]> mj.ucw.cz Git - libucw.git/blob - ucw/unicode.t
Tests: xtypes-test sets an explicit timezone
[libucw.git] / ucw / unicode.t
1 # Tests for the Unicode module
2
3 Name:   utf8_put ASCII
4 Run:    ../obj/ucw/unicode-t utf8_put
5 In:     0041 0048 004f 004a
6 Out:    41 48 4f 4a
7
8 Name:   utf8_put BMP
9 In:     00aa 01aa 02a5 05a5 0a5a 15a5 2a5a 5a5a a5a5
10 Out:    c2 aa c6 aa ca a5 d6 a5 e0 a9 9a e1 96 a5 e2 a9 9a e5 a9 9a ea 96 a5
11
12 Name:   utf8_get ASCII
13 Run:    ../obj/ucw/unicode-t utf8_get
14 In:     41 48 4f 4a
15 Out:    0041 0048 004f 004a
16
17 Name:   utf8_get BMP
18 In:     c2 aa c6 aa ca a5 d6 a5 e0 a9 9a e1 96 a5 e2 a9 9a e5 a9 9a ea 96 a5
19 Out:    00aa 01aa 02a5 05a5 0a5a 15a5 2a5a 5a5a a5a5
20
21 Name:   utf8_get garbage
22 In:     84 ff f9 f8 c2 aa 41
23 Out:    fffc fffc fffc fffc 00aa 0041
24
25 Name:   utf8_get denormalized
26 In:     c1 bf  e0 9f bf
27 Out:    fffc fffc
28
29 Name:   utf8_32_put
30 Run:    ../obj/ucw/unicode-t utf8_32_put
31 In:     15a5a 2a5a5 5a5a5 a5a5a 15a5a5 2a5a5a 5a5a5a a5a5a5 15a5a5a 2a5a5a5 5a5a5a5 a5a5a5a 15a5a5a5 2a5a5a5a 5a5a5a5a
32 Out:    f0 95 a9 9a f0 aa 96 a5 f1 9a 96 a5 f2 a5 a9 9a f5 9a 96 a5 f8 8a a5 a9 9a f8 96 a5 a9 9a f8 a9 9a 96 a5 f9 96 a5 a9 9a fa a9 9a 96 a5 fc 85 a9 9a 96 a5 fc 8a 96 a5 a9 9a fc 95 a9 9a 96 a5 fc aa 96 a5 a9 9a fd 9a 96 a5 a9 9a
33
34 Name:   utf8_32_get
35 Run:    ../obj/ucw/unicode-t utf8_32_get
36 In:     f0 95 a9 9a f0 aa 96 a5 f1 9a 96 a5 f2 a5 a9 9a f5 9a 96 a5 f8 8a a5 a9 9a f8 96 a5 a9 9a f8 a9 9a 96 a5 f9 96 a5 a9 9a fa a9 9a 96 a5 fc 85 a9 9a 96 a5 fc 8a 96 a5 a9 9a fc 95 a9 9a 96 a5 fc aa 96 a5 a9 9a fd 9a 96 a5 a9 9a
37 Out:    15a5a 2a5a5 5a5a5 a5a5a 15a5a5 2a5a5a 5a5a5a a5a5a5 15a5a5a 2a5a5a5 5a5a5a5 a5a5a5a 15a5a5a5 2a5a5a5a 5a5a5a5a
38
39 Name:   utf8_32_get garbage
40 In:     fe 83 81
41 Out:    fffc fffc fffc
42
43 Name:   utf8_32_get denormalized
44 In:     c1 bf  e0 9f bf  f0 8f bf bf  f8 87 bf bf bf  fc 83 bf bf bf
45 Out:    fffc fffc fffc fffc fffc
46
47 Name:   utf16_be_put
48 Run:    ../obj/ucw/unicode-t utf16_be_put
49 In:     0041 004a 2a5f feff 0000 10ffff ffff 10000
50 Out:    00 41 00 4a 2a 5f fe ff 00 00 db ff df ff ff ff d8 00 dc 00
51
52 Name:   utf16_le_put
53 Run:    ../obj/ucw/unicode-t utf16_le_put
54 In:     0041 004a 2a5f feff 0000 10ffff ffff 10000
55 Out:    41 00 4a 00 5f 2a ff fe 00 00 ff db ff df ff ff 00 d8 00 dc
56
57 Name:   utf16_be_get
58 Run:    ../obj/ucw/unicode-t utf16_be_get
59 In:     00 41 00 4a 2a 5f fe ff 00 00 db ff df ff ff ff d8 00 dc 00
60 Out:    0041 004a 2a5f feff 0000 10ffff ffff 10000
61
62 Name:   utf16_be_get bad surrogates
63 In:     dc 1a 2a 5f d8 01 d8 01 2a 5f d8 01
64 Out:    fffc 2a5f fffc fffc 2a5f fffc
65
66 Name:   utf16_le_get
67 Run:    ../obj/ucw/unicode-t utf16_le_get
68 In:     41 00 4a 00 5f 2a ff fe 00 00 ff db ff df ff ff 00 d8 00 dc
69 Out:    0041 004a 2a5f feff 0000 10ffff ffff 10000
70
71 Name:   utf16_le_get bad surrogates
72 In:     1a dc 5f 2a 01 d8 01 d8 5f 2a 01 d8
73 Out:    fffc 2a5f fffc fffc 2a5f fffc