]> mj.ucw.cz Git - libucw.git/blobdiff - charset/charconv.h
Config parser: Document :reset.
[libucw.git] / charset / charconv.h
index 35044311f10dbd0b6b1da86789b3f4bb959a9a0a..ba695ac9ed13c9cdf2d7656fff71a2f4b67e0461 100644 (file)
@@ -1,12 +1,16 @@
 /*
- *     Character Set Conversion Library 1.1
+ *     Character Set Conversion Library 1.2
  *
- *     (c) 1998--2001 Martin Mares <mj@ucw.cz>
+ *     (c) 1998--2005 Martin Mares <mj@ucw.cz>
+ *     (c) 2007 Pavel Charvat <pchar@ucw.cz>
  *
  *     This software may be freely distributed and used according to the terms
- *     of the GNU General Public License. See file COPYING in any of the GNU packages.
+ *     of the GNU Lesser General Public License.
  */
 
+#ifndef _CHARSET_CHARCONV_H
+#define _CHARSET_CHARCONV_H
+
 struct conv_context {
 
   /* Parameters supplied by the caller */
@@ -20,9 +24,11 @@ struct conv_context {
   /* Internal variables */
 
   int (*convert)(struct conv_context *);
+  int source_charset, dest_charset;
   unsigned short int *in_to_x;
   unsigned short int *x_to_out;
-  unsigned int state, value;
+  unsigned int state, code, remains;
+  unsigned char *string_at;
 };
 
 void conv_init(struct conv_context *);
@@ -35,9 +41,23 @@ void conv_set_charset(struct conv_context *, int, int);
 
 enum charset_id {
        CONV_CHARSET_ASCII,
-       CONV_CHARSET_LATIN1,
-       CONV_CHARSET_LATIN2,
+       CONV_CHARSET_ISO_8859_1,
+       CONV_CHARSET_ISO_8859_2,
+       CONV_CHARSET_ISO_8859_3,
+       CONV_CHARSET_ISO_8859_4,
+       CONV_CHARSET_ISO_8859_5,
+       CONV_CHARSET_ISO_8859_6,
+       CONV_CHARSET_ISO_8859_7,
+       CONV_CHARSET_ISO_8859_8,
+       CONV_CHARSET_ISO_8859_9,
+       CONV_CHARSET_ISO_8859_10,
+       CONV_CHARSET_ISO_8859_11,
+       CONV_CHARSET_ISO_8859_13,
+       CONV_CHARSET_ISO_8859_14,
+       CONV_CHARSET_ISO_8859_15,
+       CONV_CHARSET_ISO_8859_16,
        CONV_CHARSET_WIN1250,
+       CONV_CHARSET_WIN1251,
        CONV_CHARSET_WIN1252,
        CONV_CHARSET_KAMCS,
        CONV_CHARSET_CSN369103,
@@ -45,9 +65,15 @@ enum charset_id {
        CONV_CHARSET_MACCE,
        CONV_CHARSET_CORK,
        CONV_CHARSET_UTF8,
+       CONV_CHARSET_UTF16_BE,
+       CONV_CHARSET_UTF16_LE,
        CONV_NUM_CHARSETS
 };
 
+/* Conversion of a single character between current non-UTF8 charset and Unicode */
+int conv_in_to_ucs(struct conv_context *c, unsigned int y);
+int conv_ucs_to_out(struct conv_context *c, unsigned int ucs);
+
 /* For those brave ones who want to mess with charconv internals */
 unsigned int conv_x_to_ucs(unsigned int x);
 unsigned int conv_ucs_to_x(unsigned int ucs);
@@ -55,5 +81,7 @@ unsigned int conv_x_count(void);
 
 /* Charset names */
 
-int find_charset_by_name(char *);
+int find_charset_by_name(const char *);
 char *charset_name(int);
+
+#endif