]> mj.ucw.cz Git - libucw.git/blob - ucw/ff-unicode.t
Released as 6.5.13.
[libucw.git] / ucw / ff-unicode.t
1 # Tests for the Unicode module
2
3 Name:   bput_utf8 ASCII
4 Run:    ../obj/ucw/ff-unicode-t bput_utf8
5 In:     0041 0048 004f 004a
6 Out:    41 48 4f 4a
7
8 Name:   bput_utf8 BMP
9 In:     00aa 01aa 02a5 05a5 0a5a 15a5 2a5a 5a5a a5a5
10 Out:    c2 aa c6 aa ca a5 d6 a5 e0 a9 9a e1 96 a5 e2 a9 9a e5 a9 9a ea 96 a5
11
12 Name:   bget_utf8 ASCII
13 Run:    ../obj/ucw/ff-unicode-t bget_utf8
14 In:     41 48 4f 4a
15 Out:    0041 0048 004f 004a
16
17 Name:   bget_utf8 BMP
18 In:     c2 aa c6 aa ca a5 d6 a5 e0 a9 9a e1 96 a5 e2 a9 9a e5 a9 9a ea 96 a5
19 Out:    00aa 01aa 02a5 05a5 0a5a 15a5 2a5a 5a5a a5a5
20
21 Name:   bget_utf8 garbage
22 In:     84 ff f9 f8 c2 aa 41
23 Out:    fffc fffc fffc fffc 00aa 0041
24
25 Name:   bget_utf8 denormalized
26 In:     c1 bf  e0 9f bf
27 Out:    fffc fffc
28
29 Name:   bput_utf8_32
30 Run:    ../obj/ucw/ff-unicode-t bput_utf8_32
31 In:     15a5a 2a5a5 5a5a5 a5a5a 15a5a5 2a5a5a 5a5a5a a5a5a5 15a5a5a 2a5a5a5 5a5a5a5 a5a5a5a 15a5a5a5 2a5a5a5a 5a5a5a5a
32 Out:    f0 95 a9 9a f0 aa 96 a5 f1 9a 96 a5 f2 a5 a9 9a f5 9a 96 a5 f8 8a a5 a9 9a f8 96 a5 a9 9a f8 a9 9a 96 a5 f9 96 a5 a9 9a fa a9 9a 96 a5 fc 85 a9 9a 96 a5 fc 8a 96 a5 a9 9a fc 95 a9 9a 96 a5 fc aa 96 a5 a9 9a fd 9a 96 a5 a9 9a
33
34 Name:   bget_utf8_32
35 Run:    ../obj/ucw/ff-unicode-t bget_utf8_32
36 In:     f0 95 a9 9a f0 aa 96 a5 f1 9a 96 a5 f2 a5 a9 9a f5 9a 96 a5 f8 8a a5 a9 9a f8 96 a5 a9 9a f8 a9 9a 96 a5 f9 96 a5 a9 9a fa a9 9a 96 a5 fc 85 a9 9a 96 a5 fc 8a 96 a5 a9 9a fc 95 a9 9a 96 a5 fc aa 96 a5 a9 9a fd 9a 96 a5 a9 9a
37 Out:    15a5a 2a5a5 5a5a5 a5a5a 15a5a5 2a5a5a 5a5a5a a5a5a5 15a5a5a 2a5a5a5 5a5a5a5 a5a5a5a 15a5a5a5 2a5a5a5a 5a5a5a5a
38
39 Name:   bget_utf8_32 garbage
40 In:     fe 83 81
41 Out:    fffc fffc fffc
42
43 Name:   bget_utf8_32 denormalized
44 In:     c1 bf  e0 9f bf  f0 8f bf bf  f8 87 bf bf bf  fc 83 bf bf bf
45 Out:    fffc fffc fffc fffc fffc
46
47 Name:   bput_utf16_be
48 Run:    ../obj/ucw/ff-unicode-t bput_utf16_be
49 In:     0041 004a 2a5f feff 0000 10ffff ffff 10000
50 Out:    00 41 00 4a 2a 5f fe ff 00 00 db ff df ff ff ff d8 00 dc 00
51
52 Name:   bput_utf16_le
53 Run:    ../obj/ucw/ff-unicode-t bput_utf16_le
54 In:     0041 004a 2a5f feff 0000 10ffff ffff 10000
55 Out:    41 00 4a 00 5f 2a ff fe 00 00 ff db ff df ff ff 00 d8 00 dc
56
57 Name:   bget_utf16_be
58 Run:    ../obj/ucw/ff-unicode-t bget_utf16_be
59 In:     00 41 00 4a 2a 5f fe ff 00 00 db ff df ff ff ff d8 00 dc 00
60 Out:    0041 004a 2a5f feff 0000 10ffff ffff 10000
61
62 Name:   bget_utf16_be bad surrogates
63 Run:    ../obj/ucw/ff-unicode-t bget_utf16_be
64 In:     dc 1a 2a 5f d8 01 d8 01 2a 5f d8 01
65 Out:    fffc 2a5f fffc 2a5f fffc
66
67 Name:   bget_utf16_le
68 Run:    ../obj/ucw/ff-unicode-t bget_utf16_le
69 In:     41 00 4a 00 5f 2a ff fe 00 00 ff db ff df ff ff 00 d8 00 dc
70 Out:    0041 004a 2a5f feff 0000 10ffff ffff 10000
71
72 Name:   bget_utf16_le bad surrogates
73 Run:    ../obj/ucw/ff-unicode-t bget_utf16_le
74 In:     1a dc 5f 2a 01 d8 01 d8 5f 2a 01 d8
75 Out:    fffc 2a5f fffc 2a5f fffc