]> mj.ucw.cz Git - libucw.git/blob - lib/kmp-test.c
Merge with git+ssh://cvs.ucw.cz/projects/sherlock/GIT/sherlock.git#v3.8
[libucw.git] / lib / kmp-test.c
1 /*
2  *      Test of KMP search
3  *
4  *      (c) 2006, Pavel Charvat <pchar@ucw.cz>
5  */
6
7 #include "lib/lib.h"
8 #include "lib/mempool.h"
9 #include <string.h>
10
11 #if 0
12 #define TRACE(x...) do{log(L_DEBUG, x);}while(0)
13 #else
14 #define TRACE(x...) do{}while(0)
15 #endif
16
17 /* TEST1 - multiple searches */
18
19 #define KMP_PREFIX(x) kmp1_##x
20 #define KMP_WANT_CLEANUP
21 #include "lib/kmp.h"
22 #define KMPS_PREFIX(x) kmp1s1_##x
23 #define KMPS_KMP_PREFIX(x) kmp1_##x
24 #define KMPS_WANT_BEST
25 #define KMPS_EXIT(kmp,src,s) TRACE("Best match has %d characters", s->best->len)
26 #include "lib/kmp-search.h"
27 #define KMPS_PREFIX(x) kmp1s2_##x
28 #define KMPS_KMP_PREFIX(x) kmp1_##x
29 #define KMPS_VARS uns count;
30 #define KMPS_INIT(kmp,src,s) s->u.count = 0
31 #define KMPS_FOUND(kmp,src,s) s->u.count++
32 #include "lib/kmp-search.h"
33
34 static void
35 test1(void)
36 {
37   TRACE("Running test1");
38   struct kmp1_struct kmp;
39   kmp1_init(&kmp);
40   kmp1_add(&kmp, "ahoj");
41   kmp1_add(&kmp, "hoj");
42   kmp1_add(&kmp, "aho");
43   kmp1_build(&kmp);
44   struct kmp1s1_search s1;
45   kmp1s1_search(&kmp, &s1, "asjlahslhalahosjkjhojsas");
46   ASSERT(s1.best->len == 3);
47   struct kmp1s2_search s2;
48   kmp1s2_search(&kmp, &s2, "asjlahslhalahojsjkjhojsas");
49   ASSERT(s2.u.count == 4);
50   kmp1_cleanup(&kmp);
51 }
52
53 /* TEST2 - various tracing */
54
55 #define KMP_PREFIX(x) kmp2_##x
56 #define KMP_USE_UTF8
57 #define KMP_TOLOWER
58 #define KMP_ONLYALPHA
59 #define KMP_STATE_VARS byte *str; uns id;
60 #define KMP_ADD_EXTRA_ARGS uns id
61 #define KMP_VARS byte *start;
62 #define KMP_ADD_INIT(kmp,src) kmp->u.start = src
63 #define KMP_ADD_NEW(kmp,src,s) do{ TRACE("Inserting string %s with id %d", kmp->u.start, id); \
64   s->u.str = kmp->u.start; s->u.id = id; }while(0)
65 #define KMP_ADD_DUP(kmp,src,s) TRACE("String %s already inserted", kmp->u.start)
66 #define KMP_WANT_CLEANUP
67 #define KMP_WANT_SEARCH
68 #define KMPS_ADD_CONTROLS
69 #define KMPS_MERGE_CONTROLS
70 #define KMPS_FOUND(kmp,src,s) TRACE("String %s with id %d found", s->out->u.str, s->out->u.id)
71 #define KMPS_STEP(kmp,src,s) TRACE("Got to state %p after reading %d", s->s, s->c)
72 #include "lib/kmp.h"
73
74 static void
75 test2(void)
76 {
77   TRACE("Running test2");
78   struct kmp2_struct kmp;
79   kmp2_init(&kmp);
80   kmp2_add(&kmp, "ahoj", 1);
81   kmp2_add(&kmp, "ahoj", 2);
82   kmp2_add(&kmp, "hoj", 3);
83   kmp2_add(&kmp, "aho", 4);
84   kmp2_add(&kmp, "aba", 5);
85   kmp2_add(&kmp, "aba", 5);
86   kmp2_add(&kmp, "pěl", 5);
87   kmp2_build(&kmp);
88   kmp2_run(&kmp, "Šíleně žluťoučký kůň úpěl ďábelské ódy labababaks sdahojdhsaladsjhla");
89   kmp2_cleanup(&kmp);
90 }
91
92 /* TEST3 - random tests */
93
94 #define KMP_PREFIX(x) kmp3_##x
95 #define KMP_STATE_VARS uns index;
96 #define KMP_ADD_EXTRA_ARGS uns index
97 #define KMP_VARS byte *start;
98 #define KMP_ADD_INIT(kmp,src) kmp->u.start = src
99 #define KMP_ADD_NEW(kmp,src,s) s->u.index = index
100 #define KMP_ADD_DUP(kmp,src,s) *(kmp->u.start) = 0
101 #define KMP_WANT_CLEANUP
102 #define KMP_WANT_SEARCH
103 #define KMPS_VARS uns sum, *cnt;
104 #define KMPS_FOUND(kmp,src,s) do{ ASSERT(s->u.cnt[s->out->u.index]); s->u.cnt[s->out->u.index]--; s->u.sum--; }while(0)
105 #include "lib/kmp.h"
106
107 static void
108 test3(void)
109 {
110   TRACE("Running test3");
111   struct mempool *pool = mp_new(1024);
112   for (uns testn = 0; testn < 100; testn++)
113   {
114     mp_flush(pool);
115     uns n = random_max(100);
116     byte *s[n];
117     struct kmp3_struct kmp;
118     kmp3_init(&kmp);
119     for (uns i = 0; i < n; i++)
120       {
121         uns m = random_max(10);
122         s[i] = mp_alloc(pool, m + 1);
123         for (uns j = 0; j < m; j++)
124           s[i][j] = 'a' + random_max(3);
125         s[i][m] = 0;
126         kmp3_add(&kmp, s[i], i);
127       }
128     kmp3_build(&kmp);
129     for (uns i = 0; i < 10; i++)
130       {
131         uns m = random_max(100);
132         byte b[m + 1];
133         for (uns j = 0; j < m; j++)
134           b[j] = 'a' + random_max(4);
135         b[m] = 0;
136         uns cnt[n];
137         struct kmp3_search search;
138         search.u.sum = 0;
139         search.u.cnt = cnt;
140         for (uns j = 0; j < n; j++)
141           {
142             cnt[j] = 0;
143             if (*s[j])
144               for (uns k = 0; k < m; k++)
145                 if (!strncmp(b + k, s[j], strlen(s[j])))
146                   cnt[j]++, search.u.sum++;
147           }
148         kmp3_search(&kmp, &search, b);
149         ASSERT(search.u.sum == 0);
150       }
151     kmp3_cleanup(&kmp);
152   }
153   mp_delete(pool);
154 }
155
156 /* TEST4 - user-defined character type */
157
158 struct kmp4_struct;
159 struct kmp4_state;
160
161 static inline int
162 kmp4_eq(struct kmp4_struct *kmp UNUSED, byte *a, byte *b)
163 {
164   return (a == b) || (a && b && *a == *b);
165 }
166
167 static inline uns
168 kmp4_hash(struct kmp4_struct *kmp UNUSED, struct kmp4_state *s, byte *c)
169 {
170   return (c ? (*c << 16) : 0) + (uns)(addr_int_t)s;
171 }
172
173 #define KMP_PREFIX(x) kmp4_##x
174 #define KMP_CHAR byte *
175 #define KMP_CONTROL_CHAR NULL
176 #define KMP_GET_CHAR(kmp,src,c) ({ c = src++; !!*c; })
177 #define KMP_GIVE_HASHFN
178 #define KMP_GIVE_EQ
179 #define KMP_WANT_CLEANUP
180 #define KMP_WANT_SEARCH
181 #define KMPS_FOUND(kmp,src,s) TRACE("found")
182 #define KMPS_ADD_CONTROLS
183 #define KMPS_MERGE_CONTROLS
184 #include "lib/kmp.h"
185
186 static void
187 test4(void)
188 {
189   TRACE("Running test4");
190   struct kmp4_struct kmp;
191   kmp4_init(&kmp);
192   kmp4_add(&kmp, "ahoj");
193   kmp4_build(&kmp);
194   kmp4_run(&kmp, "djdhaskjdahoahaahojojshdaksjahdahojskj");
195   kmp4_cleanup(&kmp);
196 }
197
198 int
199 main(void)
200 {
201   test1();
202   test2();
203   test3();
204   test4();
205   return 0;
206 }