]> mj.ucw.cz Git - libucw.git/blob - ucw/fastbuf.h
tableprinter: code cleanup
[libucw.git] / ucw / fastbuf.h
1 /*
2  *      UCW Library -- Fast Buffered I/O
3  *
4  *      (c) 1997--2011 Martin Mares <mj@ucw.cz>
5  *      (c) 2004 Robert Spalek <robert@ucw.cz>
6  *      (c) 2014 Pavel Charvat <pchar@ucw.cz>
7  *
8  *      This software may be freely distributed and used according to the terms
9  *      of the GNU Lesser General Public License.
10  */
11
12 #ifndef _UCW_FASTBUF_H
13 #define _UCW_FASTBUF_H
14
15 #include <string.h>
16 #include <alloca.h>
17
18 #ifdef CONFIG_UCW_CLEAN_ABI
19 #define bbcopy_slow ucw_bbcopy_slow
20 #define bclose ucw_bclose
21 #define bclose_file_helper ucw_bclose_file_helper
22 #define bconfig ucw_bconfig
23 #define beof_slow ucw_beof_slow
24 #define bfdopen ucw_bfdopen
25 #define bfdopen_internal ucw_bfdopen_internal
26 #define bfdopen_shared ucw_bfdopen_shared
27 #define bfilesize ucw_bfilesize
28 #define bfilesync ucw_bfilesync
29 #define bfix_tmp_file ucw_bfix_tmp_file
30 #define bflush ucw_bflush
31 #define bfmmopen_internal ucw_bfmmopen_internal
32 #define bgetc_slow ucw_bgetc_slow
33 #define bgets ucw_bgets
34 #define bgets0 ucw_bgets0
35 #define bgets_bb ucw_bgets_bb
36 #define bgets_mp ucw_bgets_mp
37 #define bgets_nodie ucw_bgets_nodie
38 #define bgets_stk_init ucw_bgets_stk_init
39 #define bgets_stk_step ucw_bgets_stk_step
40 #define bopen ucw_bopen
41 #define bopen_fd_name ucw_bopen_fd_name
42 #define bopen_file ucw_bopen_file
43 #define bopen_file_try ucw_bopen_file_try
44 #define bopen_limited_fd ucw_bopen_limited_fd
45 #define bopen_tmp ucw_bopen_tmp
46 #define bopen_tmp_file ucw_bopen_tmp_file
47 #define bopen_try ucw_bopen_try
48 #define bpeekc_slow ucw_bpeekc_slow
49 #define bprintf ucw_bprintf
50 #define bputc_slow ucw_bputc_slow
51 #define bread_slow ucw_bread_slow
52 #define brefill ucw_brefill
53 #define brewind ucw_brewind
54 #define bseek ucw_bseek
55 #define bsetpos ucw_bsetpos
56 #define bskip_slow ucw_bskip_slow
57 #define bspout ucw_bspout
58 #define bthrow ucw_bthrow
59 #define bwrite_slow ucw_bwrite_slow
60 #define fb_tie ucw_fb_tie
61 #define fbatomic_internal_write ucw_fbatomic_internal_write
62 #define fbatomic_open ucw_fbatomic_open
63 #define fbbuf_init_read ucw_fbbuf_init_read
64 #define fbbuf_init_write ucw_fbbuf_init_write
65 #define fbdir_cheat ucw_fbdir_cheat
66 #define fbdir_open_fd_internal ucw_fbdir_open_fd_internal
67 #define fbgrow_create ucw_fbgrow_create
68 #define fbgrow_create_mp ucw_fbgrow_create_mp
69 #define fbgrow_get_buf ucw_fbgrow_get_buf
70 #define fbgrow_reset ucw_fbgrow_reset
71 #define fbgrow_rewind ucw_fbgrow_rewind
72 #define fbmem_clone_read ucw_fbmem_clone_read
73 #define fbmem_create ucw_fbmem_create
74 #define fbmulti_append ucw_fbmulti_append
75 #define fbmulti_create ucw_fbmulti_create
76 #define fbmulti_remove ucw_fbmulti_remove
77 #define fbnull_open ucw_fbnull_open
78 #define fbnull_start ucw_fbnull_start
79 #define fbnull_test ucw_fbnull_test
80 #define fbpar_cf ucw_fbpar_cf
81 #define fbpar_def ucw_fbpar_def
82 #define fbpool_end ucw_fbpool_end
83 #define fbpool_init ucw_fbpool_init
84 #define fbpool_start ucw_fbpool_start
85 #define open_tmp ucw_open_tmp
86 #define temp_file_name ucw_temp_file_name
87 #define vbprintf ucw_vbprintf
88 #endif
89
90 /***
91  * === Internal structure [[internal]]
92  *
93  * Generally speaking, a fastbuf consists of a buffer and a set of callbacks.
94  * All front-end functions operate on the buffer and if the buffer becomes
95  * empty or fills up, they ask the corresponding callback to handle the
96  * situation. Back-ends then differ just in the definition of the callbacks.
97  *
98  * The state of the fastbuf is represented by a <<struct_fastbuf,`struct fastbuf`>>,
99  * which is a simple structure describing the state of the buffer (the pointers
100  * `buffer`, `bufend`), the front-end cursor (`bptr`), the back-end cursor (`bstop`),
101  * position of the back-end cursor in the file (`pos`), some flags (`flags`)
102  * and pointers to the callback functions.
103  *
104  * The buffer can be in one of the following states:
105  *
106  * 1. Flushed:
107  *
108  *    +------------------------------------+---------------------------+
109  *    | unused                             | free space                |
110  *    +------------------------------------+---------------------------+
111  *    ^              ^                     ^                           ^
112  *    buffer      <= bstop (BE pos)     <= bptr (FE pos)            <= bufend
113  *
114  *   * This schema describes a fastbuf after its initialization or @bflush().
115  *   * There is no cached data and we are ready for any read or write operation
116  *     (well, only if the back-end supports it).
117  *   * The interval `[bptr, bufend]` can be used by front-ends
118  *     for writing. If it is empty, the `spout` callback gets called
119  *     upon the first write attempt to allocate a new buffer. Otherwise
120  *     the fastbuf silently comes to the writing mode.
121  *   * When a front-end needs to read something, it calls the `refill` callback.
122  *   * The pointers can be either all non-`NULL` or all NULL.
123  *   * `bstop == bptr` in most back-ends, but it is not necessary. Some
124  *     in-memory streams take advantage of this.
125  *
126  * 2. Reading:
127  *
128  *    +------------------------------------+---------------------------+
129  *    | read data                          | unused                    |
130  *    +------------------------------------+---------------------------+
131  *    ^               ^                    ^                           ^
132  *    buffer       <= bptr (FE pos)     <= bstop (BE pos)           <= bufend
133  *
134  *   * If we try to read something, we get to the reading mode.
135  *   * No writing is allowed until a flush operation. But note that @bflush()
136  *     will simply set `bptr` to `bstop` before `spout`
137  *     and it breaks the position of the front-end's cursor,
138  *     so the user should seek afwards.
139  *   * The interval `[buffer, bstop]` contains a block of data read by the back-end.
140  *     `bptr` is the front-end's cursor which points to the next character to be read.
141  *     After the last character is read, `bptr == bstop` and the `refill` callback
142  *     gets called upon the next read attempt to bring further data.
143  *     This gives us an easy way how to implement @bungetc().
144  *
145  * 3. Writing:
146  *
147  *    +-----------------------+----------------+-----------------------+
148  *    | unused                | written data   | free space            |
149  *    +-----------------------+----------------+-----------------------+
150  *    ^            ^                           ^                       ^
151  *    buffer    <= bstop (BE pos)            < bptr (FE pos)        <= bufend
152  *
153  *   * This schema corresponds to the situation after a write attempt.
154  *   * No reading is allowed until a flush operation.
155  *   * The `bptr` points at the position where the next character
156  *     will be written to. When we want to write, but `bptr == bufend`, we call
157  *     the `spout` hook to flush the witten data and get an empty buffer.
158  *   * `bstop` usually points at the beginning of the written data,
159  *     but it is not necessary.
160  *
161  *
162  * Rules for back-ends:
163  *
164  *   - Front-ends are only allowed to change the value of `bptr`, some flags
165  *     and if a fatal error occurs, then also `bstop`. Back-ends can rely on it.
166  *   - `buffer <= bstop <= bufend` and `buffer <= bptr <= bufend`.
167  *   - `pos` should be the real position in the file corresponding to the location of `bstop` in the buffer.
168  *     It can be modified by any back-end's callback, but the position of `bptr` (`pos + (bptr - bstop)`)
169  *     must stay unchanged after `refill` or `spout`.
170  *   - Failed callbacks (except `close`) should use @bthrow().
171  *   - Any callback pointer may be NULL in case the callback is not implemented.
172  *   - Callbacks can change not only `bptr` and `bstop`, but also the location and size of the buffer;
173  *     the fb-mem back-end takes advantage of it.
174  *
175  *   - Initialization:
176  *     * out: `buffer <= bstop <= bptr <= bufend` (flushed).
177  *     * @fb_tie() should be called on the newly created fastbuf.
178  *
179  *   - `refill`:
180  *     * in: `buffer <= bstop <= bptr <= bufend` (reading or flushed).
181  *     * out: `buffer <= bptr <= bstop <= bufend` (reading).
182  *     * Resulting `bptr == bstop` signals the end of file.
183  *       The next reading attempt will again call `refill` which can succeed this time.
184  *     * The callback must also return zero on EOF (iff `bptr == bstop`).
185  *
186  *   - `spout`:
187  *     * in: `buffer <= bstop <= bptr <= bufend` (writing or flushed).
188  *     * out: `buffer <= bstop <= bptr < bufend` (flushed).
189  *
190  *   - `seek`:
191  *     * in: `buffer <= bstop <= bptr <= bufend` (flushed).
192  *     * in: `(ofs >= 0 && whence == SEEK_SET) || (ofs <= 0 && whence == SEEK_END)`.
193  *     * out: `buffer <= bstop <= bptr <= bufend` (flushed).
194  *
195  *   - `close`:
196  *     * in: `buffer <= bstop <= bptr <= bufend` (flushed or after @bthrow()).
197  *     * `close` must always free all internal structures, even when it throws an exception.
198  ***/
199
200 /**
201  * This structure contains the state of the fastbuf. See the discussion above
202  * for how it works.
203  **/
204 struct fastbuf {
205   byte *bptr, *bstop;                           /* State of the buffer */
206   byte *buffer, *bufend;                        /* Start and end of the buffer */
207   char *name;                                   /* File name (used for error messages) */
208   ucw_off_t pos;                                /* Position of bstop in the file */
209   uint flags;                                   /* See enum fb_flags */
210   int (*refill)(struct fastbuf *);              /* Get a buffer with new data, returns 0 on EOF */
211   void (*spout)(struct fastbuf *);              /* Write buffer data to the file */
212   int (*seek)(struct fastbuf *, ucw_off_t, int);/* Slow path for @bseek(), buffer already flushed; returns success */
213   void (*close)(struct fastbuf *);              /* Close the stream */
214   int (*config)(struct fastbuf *, uint, int);   /* Configure the stream */
215   int can_overwrite_buffer;                     /* Can the buffer be altered? 0=never, 1=temporarily, 2=permanently */
216   struct resource *res;                         /* The fastbuf can be tied to a resource pool */
217 };
218
219 /**
220  * Fastbuf flags
221  */
222 enum fb_flags {
223   FB_DEAD = 0x1,                                /* Some fastbuf's method has thrown an exception */
224   FB_DIE_ON_EOF = 0x2,                          /* Most of read operations throw "fb.eof" on EOF */
225 };
226
227 /** Tie a fastbuf to a resource in the current resource pool. Returns the pointer to the same fastbuf. **/
228 struct fastbuf *fb_tie(struct fastbuf *b);      /* Tie fastbuf to a resource if there is an active pool */
229
230 /***
231  * === Fastbuf on files [[fbparam]]
232  *
233  * If you want to use fastbufs to access files, you can choose one of several
234  * back-ends and set their parameters.
235  ***/
236
237 /**
238  * Back-end types
239  */
240 enum fb_type {
241   FB_STD,                               /* Standard buffered I/O */
242   FB_DIRECT,                            /* Direct I/O bypassing system caches (see fb-direct.c for a description) */
243   FB_MMAP                               /* Memory mapped files */
244 };
245
246 /**
247  * When you open a file fastbuf, you can use this structure to select a back-end
248  * and set its parameters. If you want just an "ordinary" file stream, you can
249  * happily pass NULL instead and the defaults from the configuration file (or
250  * hard-wired defaults if no config file has been read) will be used.
251  */
252 struct fb_params {
253   enum fb_type type;                    /* The chosen back-end */
254   uint buffer_size;                     /* 0 for default size */
255   uint keep_back_buf;                   /* FB_STD: optimize for bi-directional access */
256   uint read_ahead;                      /* FB_DIRECT options */
257   uint write_back;
258   struct asio_queue *asio;
259 };
260
261 struct cf_section;
262 extern struct cf_section fbpar_cf;      /** Configuration section with which you can fill the `fb_params` **/
263 extern struct fb_params fbpar_def;      /** The default `fb_params` **/
264
265 /**
266  * Opens a file with file mode @mode (see the man page of open()).
267  * Use @params to select the fastbuf back-end and its parameters or
268  * pass NULL if you are fine with defaults.
269  *
270  * Raises `ucw.fb.open` if the file does not exist.
271  **/
272 struct fastbuf *bopen_file(const char *name, int mode, struct fb_params *params);
273 struct fastbuf *bopen_file_try(const char *name, int mode, struct fb_params *params); /** Like @bopen_file(), but returns NULL on failure. **/
274
275 /**
276  * Opens a temporary file.
277  * It is placed with other temp files and it is deleted when closed.
278  * Again, use NULL for @params if you want the defaults.
279  **/
280 struct fastbuf *bopen_tmp_file(struct fb_params *params);
281
282 /**
283  * Creates a fastbuf from a file descriptor @fd and sets its filename
284  * to @name (the name is used only in error messages).
285  * When the fastbuf is closed, the fd is closed as well. You can override
286  * this behavior by calling @bconfig().
287  */
288 struct fastbuf *bopen_fd_name(int fd, struct fb_params *params, const char *name);
289 static inline struct fastbuf *bopen_fd(int fd, struct fb_params *params) /** Same as above, but with an auto-generated filename. **/
290 {
291   return bopen_fd_name(fd, params, NULL);
292 }
293
294 /**
295  * Flushes all buffers and makes sure that they are written to the disk.
296  **/
297 void bfilesync(struct fastbuf *b);
298
299 /***
300  * === Fastbufs on regular files [[fbfile]]
301  *
302  * If you want to use the `FB_STD` back-end and not worry about setting
303  * up any parameters, there is a couple of shortcuts.
304  ***/
305
306 struct fastbuf *bopen(const char *name, uint mode, uint buflen);        /** Equivalent to @bopen_file() with `FB_STD` back-end. **/
307 struct fastbuf *bopen_try(const char *name, uint mode, uint buflen);    /** Equivalent to @bopen_file_try() with `FB_STD` back-end. **/
308 struct fastbuf *bopen_tmp(uint buflen);                                 /** Equivalent to @bopen_tmp_file() with `FB_STD` back-end. **/
309 struct fastbuf *bfdopen(int fd, uint buflen);                           /** Equivalent to @bopen_fd() with `FB_STD` back-end. **/
310 struct fastbuf *bfdopen_shared(int fd, uint buflen);                    /** Like @bfdopen(), but it does not close the @fd on @bclose(). **/
311
312 /***
313  * === Temporary files [[fbtemp]]
314  *
315  * Usually, @bopen_tmp_file() is the best way how to come to a temporary file.
316  * However, in some specific cases you can need more, so there is also a set
317  * of more general functions.
318  ***/
319
320 #define TEMP_FILE_NAME_LEN 256
321
322 /**
323  * Generates a temporary filename and stores it to the @name_buf (of size
324  * at least * `TEMP_FILE_NAME_LEN`). If @open_flags are not NULL, flags that
325  * should be OR-ed with other flags to open() will be stored there.
326  *
327  * The location and style of temporary files is controlled by the configuration.
328  * By default, the system temp directory (`$TMPDIR` or `/tmp`) is used.
329  *
330  * If the location is a publicly writeable directory (like `/tmp`), the
331  * generated filename cannot be guaranteed to be unique, so @open_flags
332  * will include `O_EXCL` and you have to check the result of open() and
333  * iterate if needed.
334  *
335  * This function is not specific to fastbufs, it can be used separately.
336  **/
337 void temp_file_name(char *name_buf, int *open_flags);
338
339 /**
340  * Opens a temporary file and returns its file descriptor.
341  * You specify the file @mode and @open_flags passed to open().
342  *
343  * If the @name_buf (of at last `TEMP_FILE_NAME_LEN` chars) is not NULL,
344  * the filename is also stored in it.
345  *
346  * This function is not specific to fastbufs, it can be used separately.
347  */
348 int open_tmp(char *name_buf, int open_flags, int mode);
349
350 /**
351  * Sometimes, a file is created as temporary and then moved to a stable
352  * location. This function takes a fastbuf created by @bopen_tmp_file()
353  * or @bopen_tmp(), marks it as permanent, closes it and renames it to
354  * @name.
355  *
356  * Please note that it assumes that the temporary file and the @name
357  * are on the same volume (otherwise, rename() fails), so you might
358  * want to configure a special location for the temporary files
359  * beforehand.
360  */
361 void bfix_tmp_file(struct fastbuf *fb, const char *name);
362
363 /* Internal functions of some file back-ends */
364
365 struct fastbuf *bfdopen_internal(int fd, const char *name, uint buflen);
366 struct fastbuf *bfmmopen_internal(int fd, const char *name, uint mode);
367
368 #ifdef CONFIG_UCW_FB_DIRECT
369 extern uint fbdir_cheat;
370 struct asio_queue;
371 struct fastbuf *fbdir_open_fd_internal(int fd, const char *name, struct asio_queue *io_queue, uint buffer_size, uint read_ahead, uint write_back);
372 #endif
373
374 void bclose_file_helper(struct fastbuf *f, int fd, int is_temp_file);
375
376 /***
377  * === Fastbufs on file fragments [[fblim]]
378  *
379  * The `fblim` back-end reads from a file handle, but at most a given
380  * number of bytes. This is frequently used for reading from sockets.
381  ***/
382
383 struct fastbuf *bopen_limited_fd(int fd, uint bufsize, uint limit); /** Create a fastbuf which reads at most @limit bytes from @fd. **/
384
385 /***
386  * === Fastbufs on in-memory streams [[fbmem]]
387  *
388  * The `fbmem` back-end keeps the whole contents of the stream
389  * in memory (as a linked list of memory blocks, so address space
390  * fragmentation is avoided).
391  *
392  * First, you use @fbmem_create() to create the stream and the fastbuf
393  * used for writing to it. Then you can call @fbmem_clone_read() to get
394  * an arbitrary number of fastbuf for reading from the stream.
395  ***/
396
397 struct fastbuf *fbmem_create(uint blocksize);           /** Create stream and return its writing fastbuf. **/
398 struct fastbuf *fbmem_clone_read(struct fastbuf *f);    /** Given a writing fastbuf, create a new reading fastbuf. **/
399
400 /***
401  * === Fastbufs on static buffers [[fbbuf]]
402  *
403  * The `fbbuf` back-end stores the stream in a given block of memory.
404  * This is useful for parsing and generating of complex data structures.
405  ***/
406
407 /**
408  * Creates a read-only fastbuf that takes its data from a given buffer.
409  * The fastbuf structure is allocated by the caller and pointed to by @f.
410  * The @buffer and @size specify the location and size of the buffer.
411  *
412  * In some cases, the front-ends can take advantage of rewriting the contents
413  * of the buffer temporarily. In this case, set @can_overwrite as described
414  * in <<internal,Internals>>. If you do not care, keep @can_overwrite zero.
415  *
416  * It is not possible to close this fastbuf. This implies that no tying to
417  * resources takes place.
418  */
419 void fbbuf_init_read(struct fastbuf *f, byte *buffer, uint size, uint can_overwrite);
420
421 /**
422  * Creates a write-only fastbuf which writes into a provided memory buffer.
423  * The fastbuf structure is allocated by the caller and pointed to by @f.
424  * An attempt to write behind the end of the buffer causes the `ucw.fb.write` exception.
425  *
426  * Data are written directly into the buffer, so it is not necessary to call @bflush()
427  * at any moment.
428  *
429  * It is not possible to close this fastbuf. This implies that no tying to
430  * resources takes place.
431  */
432 void fbbuf_init_write(struct fastbuf *f, byte *buffer, uint size);
433
434 static inline uint fbbuf_count_written(struct fastbuf *f) /** Calculates, how many bytes were already written into the buffer. **/
435 {
436   return f->bptr - f->bstop;
437 }
438
439 /***
440  * === Fastbuf on recyclable growing buffers [[fbgrow]]
441  *
442  * The `fbgrow` back-end keeps the stream in a contiguous buffer stored in the
443  * main memory, but unlike <<fbmem,`fbmem`>>, the buffer does not have a fixed
444  * size and it is expanded to accomodate all data.
445  *
446  * At every moment, you can use `fastbuf->buffer` to gain access to the stream.
447  ***/
448
449 struct mempool;
450
451 struct fastbuf *fbgrow_create(uint basic_size);         /** Create the growing buffer pre-allocated to @basic_size bytes. **/
452 struct fastbuf *fbgrow_create_mp(struct mempool *mp, uint basic_size); /** Create the growing buffer pre-allocated to @basic_size bytes. **/
453 void fbgrow_reset(struct fastbuf *b);                   /** Reset stream and prepare for writing. **/
454 void fbgrow_rewind(struct fastbuf *b);                  /** Prepare for reading (of already written data). **/
455
456 /**
457  * Can be used in any state of @b (for example when writing or after
458  * @fbgrow_rewind()) to return the pointer to internal buffer and its length in
459  * bytes. The returned buffer can be invalidated by further requests.
460  **/
461 uint fbgrow_get_buf(struct fastbuf *b, byte **buf);
462
463 /***
464  * === Fastbuf on memory pools [[fbpool]]
465  *
466  * The write-only `fbpool` back-end also keeps the stream in a contiguous
467  * buffer, but this time the buffer is allocated from within a memory pool.
468  ***/
469
470 struct fbpool { /** Structure for fastbufs & mempools. **/
471   struct fastbuf fb;
472   struct mempool *mp;
473 };
474
475 /**
476  * Initialize a new `fbpool`. The structure is allocated by the caller,
477  * so @bclose() should not be called and no resource tying takes place.
478  **/
479 void fbpool_init(struct fbpool *fb);    /** Initialize a new mempool fastbuf. **/
480 /**
481  * Start a new continuous block and prepare for writing (see <<mempool:mp_start()>>).
482  * Provide the memory pool you want to use for this block as @mp.
483  **/
484 void fbpool_start(struct fbpool *fb, struct mempool *mp, size_t init_size);
485 /**
486  * Close the block and return the address of its start (see <<mempool:mp_end()>>).
487  * The length can be determined by calling <<mempool:mp_size(mp, ptr)>>.
488  **/
489 void *fbpool_end(struct fbpool *fb);
490
491 /***
492  * === Atomic files for multi-threaded programs [[fbatomic]]
493  *
494  * This fastbuf backend is designed for cases when several threads
495  * of a single program append records to a common file and while the
496  * record can mix in an arbitrary way, the bytes inside a single
497  * record must remain uninterrupted.
498  *
499  * In case of files with fixed record size, we just allocate the
500  * buffer to hold a whole number of records and take advantage
501  * of the atomicity of the write() system call.
502  *
503  * With variable-sized records, we need another solution: when
504  * writing a record, we keep the fastbuf in a locked state, which
505  * prevents buffer flushing (and if the buffer becomes full, we extend it),
506  * and we wait for an explicit commit operation which write()s the buffer
507  * if the free space in the buffer falls below the expected maximum record
508  * length.
509  *
510  * Please note that initialization of the clones is not thread-safe,
511  * so you have to serialize it yourself.
512  ***/
513
514 struct fb_atomic {
515   struct fastbuf fb;
516   struct fb_atomic_file *af;
517   byte *expected_max_bptr;
518   uint slack_size;
519 };
520
521 /**
522  * Open an atomic fastbuf.
523  * If @master is NULL, the file @name is opened. If it is non-null,
524  * a new clone of an existing atomic fastbuf is created.
525  *
526  * If the file has fixed record length, just set @record_len to it.
527  * Otherwise set @record_len to the expected maximum record length
528  * with a negative sign (you need not fit in this length, but as long
529  * as you do, the fastbuf is more efficient) and call @fbatomic_commit()
530  * after each record.
531  *
532  * You can specify @record_len, if it is known (for optimisations).
533  *
534  * The file is closed when all fastbufs using it are closed.
535  **/
536 struct fastbuf *fbatomic_open(const char *name, struct fastbuf *master, uint bufsize, int record_len);
537 void fbatomic_internal_write(struct fastbuf *b);
538
539 /**
540  * Declare that you have finished writing a record. This is required only
541  * if a fixed record size was not specified.
542  **/
543 static inline void fbatomic_commit(struct fastbuf *b)
544 {
545   if (b->bptr >= ((struct fb_atomic *)b)->expected_max_bptr)
546     fbatomic_internal_write(b);
547 }
548
549 /*** === Null fastbufs ***/
550
551 /**
552  * Creates a new "/dev/null"-like  fastbuf.
553  * Any read attempt returns an EOF, any write attempt is silently ignored.
554  **/
555 struct fastbuf *fbnull_open(uint bufsize);
556
557 /**
558  * Can be used by any back-end to switch it to the null mode.
559  * You need to provide at least one byte long buffer for writing.
560  **/
561 void fbnull_start(struct fastbuf *b, byte *buf, uint bufsize);
562
563 /**
564  * Checks whether a fastbuf has been switched to the null mode.
565  **/
566 bool fbnull_test(struct fastbuf *b);
567
568 /***
569  * === Fastbufs atop other fastbufs [[fbmulti]]
570  *
571  * Imagine some code which does massive string processing. It takes an input
572  * buffer, writes a part of it into an output buffer, then some other string
573  * and then the remaining part of the input buffer. Or anything else where you
574  * copy all the data at each stage of the complicated process.
575  *
576  * This backend takes multiple fastbufs and concatenates them formally into
577  * one. You may then read them consecutively as they were one fastbuf at all.
578  *
579  * This backend is read-only.
580  *
581  * This backend is seekable iff all of the supplied fastbufs are seekable.
582  *
583  * You aren't allowed to do anything with the underlying buffers while these
584  * are connected into fbmulti.
585  *
586  * The fbmulti is inited by @fbmulti_create(). It returns an empty fbmulti.
587  * Then you call @fbmulti_append() for each fbmulti.
588  *
589  * If @bclose() is called on fbmulti, all the underlying buffers get closed
590  * recursively.
591  *
592  * If you want to keep an underlying fastbuf open after @bclose, just remove it
593  * by @fbmulti_remove where the second parameter is a pointer to the removed
594  * fastbuf. If you pass NULL, all the underlying fastbufs are removed.
595  *
596  * After @fbmulti_remove, the state of the fbmulti is undefined. The only allowed
597  * operation is either another @fbmulti_remove or @bclose on the fbmulti.
598  ***/
599
600 /**
601  * Create an empty fbmulti
602  **/
603 struct fastbuf *fbmulti_create(void);
604
605 /**
606  * Append a fb to fbmulti
607  **/
608 void fbmulti_append(struct fastbuf *f, struct fastbuf *fb);
609
610 /**
611  * Remove a fb from fbmulti
612  **/
613 void fbmulti_remove(struct fastbuf *f, struct fastbuf *fb);
614
615 /*** === Configuring stream parameters [[bconfig]] ***/
616
617 enum bconfig_type {                     /** Parameters that could be configured. **/
618   BCONFIG_IS_TEMP_FILE,                 /* 0=normal file, 1=temporary file, 2=shared fd */
619   BCONFIG_KEEP_BACK_BUF,                /* Optimize for bi-directional access */
620 };
621
622 int bconfig(struct fastbuf *f, uint type, int data); /** Configure a fastbuf. Returns previous value. **/
623
624 /*** === Universal functions working on all fastbuf's [[ffbasic]] ***/
625
626 /**
627  * Close and free fastbuf.
628  * Can not be used for fastbufs not returned from function (initialized in a parameter, for example the one from `fbbuf_init_read`).
629  */
630 void bclose(struct fastbuf *f);
631 void bthrow(struct fastbuf *f, const char *id, const char *fmt, ...) FORMAT_CHECK(printf,3,4) NONRET;   /** Throw exception on a given fastbuf **/
632 int brefill(struct fastbuf *f, int allow_eof);
633 void bspout(struct fastbuf *f);
634 void bflush(struct fastbuf *f);                                 /** Write data (if it makes any sense, do not use for in-memory buffers). **/
635 void bseek(struct fastbuf *f, ucw_off_t pos, int whence);       /** Seek in the buffer. See `man fseek` for description of @whence. Only for seekable fastbufs. **/
636 void bsetpos(struct fastbuf *f, ucw_off_t pos);                 /** Set position to @pos bytes from beginning. Only for seekable fastbufs. **/
637 void brewind(struct fastbuf *f);                                /** Go to the beginning of the fastbuf. Only for seekable ones. **/
638 ucw_off_t bfilesize(struct fastbuf *f);                         /** How large is the file? -1 if not seekable. **/
639
640 static inline ucw_off_t btell(struct fastbuf *f)                /** Where am I (from the beginning)? **/
641 {
642   return f->pos + (f->bptr - f->bstop);
643 }
644
645 int bgetc_slow(struct fastbuf *f);
646 static inline int bgetc(struct fastbuf *f)                      /** Return next character from the buffer. **/
647 {
648   return (f->bptr < f->bstop) ? (int) *f->bptr++ : bgetc_slow(f);
649 }
650
651 int bpeekc_slow(struct fastbuf *f);
652 static inline int bpeekc(struct fastbuf *f)                     /** Return next character from the buffer, but keep the current position. **/
653 {
654   return (f->bptr < f->bstop) ? (int) *f->bptr : bpeekc_slow(f);
655 }
656
657 int beof_slow(struct fastbuf *f);
658 static inline int beof(struct fastbuf *f)                       /** Have I reached EOF? **/
659 {
660   return (f->bptr < f->bstop) ? 0 : beof_slow(f);
661 }
662
663 static inline void bungetc(struct fastbuf *f)                   /** Return last read character back. Only one back is guaranteed to work. **/
664 {
665   f->bptr--;
666 }
667
668 void bputc_slow(struct fastbuf *f, uint c);
669 static inline void bputc(struct fastbuf *f, uint c)             /** Write a single character. **/
670 {
671   if (f->bptr < f->bufend)
672     *f->bptr++ = c;
673   else
674     bputc_slow(f, c);
675 }
676
677 static inline uint bavailr(struct fastbuf *f)                   /** Return the length of the cached data to be read. Do not use directly. **/
678 {
679   return f->bstop - f->bptr;
680 }
681
682 static inline uint bavailw(struct fastbuf *f)                   /** Return the length of the buffer available for writing. Do not use directly. **/
683 {
684   return f->bufend - f->bptr;
685 }
686
687 uint bread_slow(struct fastbuf *f, void *b, uint l, uint check);
688 /**
689  * Read at most @l bytes of data into @b.
690  * Returns number of bytes read.
691  * 0 means end of file.
692  */
693 static inline uint bread(struct fastbuf *f, void *b, uint l)
694 {
695   if (bavailr(f) >= l)
696     {
697       memcpy(b, f->bptr, l);
698       f->bptr += l;
699       return l;
700     }
701   else
702     return bread_slow(f, b, l, 0);
703 }
704
705 /**
706  * Reads exactly @l bytes of data into @b.
707  * If at the end of file, it returns 0.
708  * If there are data, but less than @l, it raises `ucw.fb.eof`.
709  */
710 static inline uint breadb(struct fastbuf *f, void *b, uint l)
711 {
712   if (bavailr(f) >= l)
713     {
714       memcpy(b, f->bptr, l);
715       f->bptr += l;
716       return l;
717     }
718   else
719     return bread_slow(f, b, l, 1);
720 }
721
722 void bwrite_slow(struct fastbuf *f, const void *b, uint l);
723 static inline void bwrite(struct fastbuf *f, const void *b, uint l) /** Writes buffer @b of length @l into fastbuf. **/
724 {
725   if (bavailw(f) >= l)
726     {
727       memcpy(f->bptr, b, l);
728       f->bptr += l;
729     }
730   else
731     bwrite_slow(f, b, l);
732 }
733
734 /**
735  * Reads a line into @b and strips trailing `\n`.
736  * Returns pointer to the terminating 0 or NULL on `EOF`.
737  * Raises `ucw.fb.toolong` if the line is longer than @l.
738  **/
739 char *bgets(struct fastbuf *f, char *b, uint l);
740 char *bgets0(struct fastbuf *f, char *b, uint l);       /** The same as @bgets(), but for 0-terminated strings. **/
741 /**
742  * Returns either length of read string (excluding the terminator) or -1 if it is too long.
743  * In such cases exactly @l bytes are read.
744  */
745 int bgets_nodie(struct fastbuf *f, char *b, uint l);
746
747 struct mempool;
748 struct bb_t;
749 /**
750  * Read a string, strip the trailing `\n` and store it into growing buffer @b.
751  * Raises `ucw.fb.toolong` if the line is longer than @limit.
752  **/
753 uint bgets_bb(struct fastbuf *f, struct bb_t *b, uint limit);
754 /**
755  * Read a string, strip the trailing `\n` and store it into buffer allocated from a memory pool.
756  **/
757 char *bgets_mp(struct fastbuf *f, struct mempool *mp);
758
759 struct bgets_stk_struct {
760   struct fastbuf *f;
761   byte *old_buf, *cur_buf, *src;
762   uint old_len, cur_len, src_len;
763 };
764 void bgets_stk_init(struct bgets_stk_struct *s);
765 void bgets_stk_step(struct bgets_stk_struct *s);
766
767 /**
768  * Read a string, strip the trailing `\n` and store it on the stack (allocated using alloca()).
769  **/
770 #define bgets_stk(fb) \
771   ({ struct bgets_stk_struct _s; _s.f = (fb); for (bgets_stk_init(&_s); _s.cur_len; _s.cur_buf = alloca(_s.cur_len), bgets_stk_step(&_s)); _s.cur_buf; })
772
773 /**
774  * Write a string, without 0 or `\n` at the end.
775  **/
776 static inline void bputs(struct fastbuf *f, const char *b)
777 {
778   bwrite(f, b, strlen(b));
779 }
780
781 /**
782  * Write string, including terminating 0.
783  **/
784 static inline void bputs0(struct fastbuf *f, const char *b)
785 {
786   bwrite(f, b, strlen(b)+1);
787 }
788
789 /**
790  * Write string and append a newline to the end.
791  **/
792 static inline void bputsn(struct fastbuf *f, const char *b)
793 {
794   bputs(f, b);
795   bputc(f, '\n');
796 }
797
798 void bbcopy_slow(struct fastbuf *f, struct fastbuf *t, uint l);
799 /**
800  * Copy @l bytes of data from fastbuf @f to fastbuf @t.
801  * `UINT_MAX` (`~0U`) means all data, even if more than `UINT_MAX` bytes remain.
802  **/
803 static inline void bbcopy(struct fastbuf *f, struct fastbuf *t, uint l)
804 {
805   if (bavailr(f) >= l && bavailw(t) >= l)
806     {
807       memcpy(t->bptr, f->bptr, l);
808       t->bptr += l;
809       f->bptr += l;
810     }
811   else
812     bbcopy_slow(f, t, l);
813 }
814
815 int bskip_slow(struct fastbuf *f, uint len);
816 static inline int bskip(struct fastbuf *f, uint len) /** Skip @len bytes without reading them. **/
817 {
818   if (bavailr(f) >= len)
819     {
820       f->bptr += len;
821       return 1;
822     }
823   else
824     return bskip_slow(f, len);
825 }
826
827 /*** === Direct I/O on buffers ***/
828
829 /**
830  * Begin direct reading from fastbuf's internal buffer to avoid unnecessary copying.
831  * The function returns a buffer @buf together with its length in bytes (zero means EOF)
832  * with cached data to be read.
833  *
834  * Some back-ends allow the user to modify the data in the returned buffer to avoid unnecessary.
835  * If the back-end allows such modifications, it can set `f->can_overwrite_buffer` accordingly:
836  *
837  *   - 0 if no modification is allowed,
838  *   - 1 if the user can modify the buffer on the condition that
839  *       the modifications will be undone before calling the next
840  *       fastbuf operation
841  *   - 2 if the user is allowed to overwrite the data in the buffer
842  *       if @bdirect_read_commit_modified() is called afterwards.
843  *       In this case, the back-end must be prepared for trimming
844  *       of the buffer which is done by the commit function.
845  *
846  * The reading must be ended by @bdirect_read_commit() or @bdirect_read_commit_modified(),
847  * unless the user did not read or modify anything.
848  **/
849 static inline uint bdirect_read_prepare(struct fastbuf *f, byte **buf)
850 {
851   if (f->bptr == f->bstop && !f->refill(f))
852     {
853       *buf = NULL;  // This is not needed, but it helps to get rid of spurious warnings
854       return 0;
855     }
856   *buf = f->bptr;
857   return bavailr(f);
858 }
859
860 /**
861  * End direct reading started by @bdirect_read_prepare() and move the cursor at @pos.
862  * Data in the returned buffer must be same as after @bdirect_read_prepare() and
863  * @pos must point somewhere inside the buffer.
864  **/
865 static inline void bdirect_read_commit(struct fastbuf *f, byte *pos)
866 {
867   f->bptr = pos;
868 }
869
870 /**
871  * Similar to @bdirect_read_commit(), but accepts also modified data before @pos.
872  * Note that such modifications are supported only if `f->can_overwrite_buffer == 2`.
873  **/
874 static inline void bdirect_read_commit_modified(struct fastbuf *f, byte *pos)
875 {
876   f->bptr = pos;
877   f->buffer = pos;      /* Avoid seeking backwards in the buffer */
878 }
879
880 /**
881  * Start direct writing to fastbuf's internal buffer to avoid copy overhead.
882  * The function returns the length of the buffer in @buf (at least one byte)
883  * where we can write to. The operation must be ended by @bdirect_write_commit(),
884  * unless nothing is written.
885  **/
886 static inline uint bdirect_write_prepare(struct fastbuf *f, byte **buf)
887 {
888   if (f->bptr == f->bufend)
889     f->spout(f);
890   *buf = f->bptr;
891   return bavailw(f);
892 }
893
894 /**
895  * Commit the data written to the buffer returned by @bdirect_write_prepare().
896  * The length is specified by @pos which must point just after the written data.
897  * Also moves the cursor to @pos.
898  **/
899 static inline void bdirect_write_commit(struct fastbuf *f, byte *pos)
900 {
901   f->bptr = pos;
902 }
903
904 /*** === Formatted output ***/
905
906 /**
907  * printf into a fastbuf.
908  **/
909 int bprintf(struct fastbuf *b, const char *msg, ...)
910   FORMAT_CHECK(printf,2,3);
911 int vbprintf(struct fastbuf *b, const char *msg, va_list args); /** vprintf into a fastbuf. **/
912
913 #endif