]> mj.ucw.cz Git - libucw.git/blob - ucw/fastbuf.h
bgets_mp(): Rewritten implementation.
[libucw.git] / ucw / fastbuf.h
1 /*
2  *      UCW Library -- Fast Buffered I/O
3  *
4  *      (c) 1997--2011 Martin Mares <mj@ucw.cz>
5  *      (c) 2004 Robert Spalek <robert@ucw.cz>
6  *      (c) 2014 Pavel Charvat <pchar@ucw.cz>
7  *
8  *      This software may be freely distributed and used according to the terms
9  *      of the GNU Lesser General Public License.
10  */
11
12 #ifndef _UCW_FASTBUF_H
13 #define _UCW_FASTBUF_H
14
15 #include <string.h>
16 #include <alloca.h>
17
18 #ifdef CONFIG_UCW_CLEAN_ABI
19 #define bbcopy_slow ucw_bbcopy_slow
20 #define bclose ucw_bclose
21 #define bclose_file_helper ucw_bclose_file_helper
22 #define bconfig ucw_bconfig
23 #define beof_slow ucw_beof_slow
24 #define bfdopen ucw_bfdopen
25 #define bfdopen_internal ucw_bfdopen_internal
26 #define bfdopen_shared ucw_bfdopen_shared
27 #define bfilesize ucw_bfilesize
28 #define bfilesync ucw_bfilesync
29 #define bfix_tmp_file ucw_bfix_tmp_file
30 #define bflush ucw_bflush
31 #define bfmmopen_internal ucw_bfmmopen_internal
32 #define bgetc_slow ucw_bgetc_slow
33 #define bgets ucw_bgets
34 #define bgets0 ucw_bgets0
35 #define bgets_bb ucw_bgets_bb
36 #define bgets_mp ucw_bgets_mp
37 #define bgets_nodie ucw_bgets_nodie
38 #define bgets_stk_init ucw_bgets_stk_init
39 #define bgets_stk_step ucw_bgets_stk_step
40 #define bopen ucw_bopen
41 #define bopen_fd_name ucw_bopen_fd_name
42 #define bopen_file ucw_bopen_file
43 #define bopen_file_try ucw_bopen_file_try
44 #define bopen_limited_fd ucw_bopen_limited_fd
45 #define bopen_tmp ucw_bopen_tmp
46 #define bopen_tmp_file ucw_bopen_tmp_file
47 #define bopen_try ucw_bopen_try
48 #define bpeekc_slow ucw_bpeekc_slow
49 #define bprintf ucw_bprintf
50 #define bputc_slow ucw_bputc_slow
51 #define bread_slow ucw_bread_slow
52 #define brefill ucw_brefill
53 #define brewind ucw_brewind
54 #define bseek ucw_bseek
55 #define bsetpos ucw_bsetpos
56 #define bskip_slow ucw_bskip_slow
57 #define bspout ucw_bspout
58 #define bthrow ucw_bthrow
59 #define bwrite_slow ucw_bwrite_slow
60 #define fb_tie ucw_fb_tie
61 #define fbatomic_internal_write ucw_fbatomic_internal_write
62 #define fbatomic_open ucw_fbatomic_open
63 #define fbbuf_init_read ucw_fbbuf_init_read
64 #define fbbuf_init_write ucw_fbbuf_init_write
65 #define fbdir_cheat ucw_fbdir_cheat
66 #define fbdir_open_fd_internal ucw_fbdir_open_fd_internal
67 #define fbgrow_create ucw_fbgrow_create
68 #define fbgrow_create_mp ucw_fbgrow_create_mp
69 #define fbgrow_get_buf ucw_fbgrow_get_buf
70 #define fbgrow_reset ucw_fbgrow_reset
71 #define fbgrow_rewind ucw_fbgrow_rewind
72 #define fbmem_clone_read ucw_fbmem_clone_read
73 #define fbmem_create ucw_fbmem_create
74 #define fbmulti_append ucw_fbmulti_append
75 #define fbmulti_create ucw_fbmulti_create
76 #define fbmulti_remove ucw_fbmulti_remove
77 #define fbnull_open ucw_fbnull_open
78 #define fbnull_start ucw_fbnull_start
79 #define fbnull_test ucw_fbnull_test
80 #define fbpar_cf ucw_fbpar_cf
81 #define fbpar_def ucw_fbpar_def
82 #define fbpool_end ucw_fbpool_end
83 #define fbpool_init ucw_fbpool_init
84 #define fbpool_start ucw_fbpool_start
85 #define open_tmp ucw_open_tmp
86 #define temp_file_name ucw_temp_file_name
87 #define vbprintf ucw_vbprintf
88 #endif
89
90 /***
91  * === Internal structure [[internal]]
92  *
93  * Generally speaking, a fastbuf consists of a buffer and a set of callbacks.
94  * All front-end functions operate on the buffer and if the buffer becomes
95  * empty or fills up, they ask the corresponding callback to handle the
96  * situation. Back-ends then differ just in the definition of the callbacks.
97  *
98  * The state of the fastbuf is represented by a <<struct_fastbuf,`struct fastbuf`>>,
99  * which is a simple structure describing the state of the buffer (the pointers
100  * `buffer`, `bufend`), the front-end cursor (`bptr`), the back-end cursor (`bstop`),
101  * position of the back-end cursor in the file (`pos`), some flags (`flags`)
102  * and pointers to the callback functions.
103  *
104  * The buffer can be in one of the following states:
105  *
106  * 1. Flushed:
107  *
108  *    +------------------------------------+---------------------------+
109  *    | unused                             | free space                |
110  *    +------------------------------------+---------------------------+
111  *    ^              ^                     ^                           ^
112  *    buffer      <= bstop (BE pos)     <= bptr (FE pos)            <= bufend
113  *
114  *   * This schema describes a fastbuf after its initialization or @bflush().
115  *   * There is no cached data and we are ready for any read or write operation
116  *     (well, only if the back-end supports it).
117  *   * The interval `[bptr, bufend]` can be used by front-ends
118  *     for writing. If it is empty, the `spout` callback gets called
119  *     upon the first write attempt to allocate a new buffer. Otherwise
120  *     the fastbuf silently comes to the writing mode.
121  *   * When a front-end needs to read something, it calls the `refill` callback.
122  *   * The pointers can be either all non-`NULL` or all NULL.
123  *   * `bstop == bptr` in most back-ends, but it is not necessary. Some
124  *     in-memory streams take advantage of this.
125  *
126  * 2. Reading:
127  *
128  *    +------------------------------------+---------------------------+
129  *    | read data                          | unused                    |
130  *    +------------------------------------+---------------------------+
131  *    ^               ^                    ^                           ^
132  *    buffer       <= bptr (FE pos)     <= bstop (BE pos)           <= bufend
133  *
134  *   * If we try to read something, we get to the reading mode.
135  *   * No writing is allowed until a flush operation. But note that @bflush()
136  *     will simply set `bptr` to `bstop` before `spout`
137  *     and it breaks the position of the front-end's cursor,
138  *     so the user should seek afwards.
139  *   * The interval `[buffer, bstop]` contains a block of data read by the back-end.
140  *     `bptr` is the front-end's cursor which points to the next character to be read.
141  *     After the last character is read, `bptr == bstop` and the `refill` callback
142  *     gets called upon the next read attempt to bring further data.
143  *     This gives us an easy way how to implement @bungetc().
144  *
145  * 3. Writing:
146  *
147  *    +-----------------------+----------------+-----------------------+
148  *    | unused                | written data   | free space            |
149  *    +-----------------------+----------------+-----------------------+
150  *    ^            ^                           ^                       ^
151  *    buffer    <= bstop (BE pos)            < bptr (FE pos)        <= bufend
152  *
153  *   * This schema corresponds to the situation after a write attempt.
154  *   * No reading is allowed until a flush operation.
155  *   * The `bptr` points at the position where the next character
156  *     will be written to. When we want to write, but `bptr == bufend`, we call
157  *     the `spout` hook to flush the witten data and get an empty buffer.
158  *   * `bstop` usually points at the beginning of the written data,
159  *     but it is not necessary.
160  *
161  *
162  * Rules for back-ends:
163  *
164  *   - Front-ends are only allowed to change the value of `bptr`, some flags
165  *     and if a fatal error occurs, then also `bstop`. Back-ends can rely on it.
166  *   - `buffer <= bstop <= bufend` and `buffer <= bptr <= bufend`.
167  *   - `pos` should be the real position in the file corresponding to the location of `bstop` in the buffer.
168  *     It can be modified by any back-end's callback, but the position of `bptr` (`pos + (bptr - bstop)`)
169  *     must stay unchanged after `refill` or `spout`.
170  *   - Failed callbacks (except `close`) should use @bthrow().
171  *   - Any callback pointer may be NULL in case the callback is not implemented.
172  *   - Callbacks can change not only `bptr` and `bstop`, but also the location and size of the buffer;
173  *     the fb-mem back-end takes advantage of it.
174  *
175  *   - Initialization:
176  *     * out: `buffer <= bstop <= bptr <= bufend` (flushed).
177  *     * @fb_tie() should be called on the newly created fastbuf.
178  *
179  *   - `refill`:
180  *     * in: `buffer <= bstop <= bptr <= bufend` (reading or flushed).
181  *     * out: `buffer <= bptr <= bstop <= bufend` (reading).
182  *     * Resulting `bptr == bstop` signals the end of file.
183  *       The next reading attempt will again call `refill` which can succeed this time.
184  *     * The callback must also return zero on EOF (iff `bptr == bstop`).
185  *
186  *   - `spout`:
187  *     * in: `buffer <= bstop <= bptr <= bufend` (writing or flushed).
188  *     * out: `buffer <= bstop <= bptr < bufend` (flushed).
189  *
190  *   - `seek`:
191  *     * in: `buffer <= bstop <= bptr <= bufend` (flushed).
192  *     * in: `(ofs >= 0 && whence == SEEK_SET) || (ofs <= 0 && whence == SEEK_END)`.
193  *     * out: `buffer <= bstop <= bptr <= bufend` (flushed).
194  *
195  *   - `close`:
196  *     * in: `buffer <= bstop <= bptr <= bufend` (flushed or after @bthrow()).
197  *     * `close` must always free all internal structures, even when it throws an exception.
198  ***/
199
200 /**
201  * This structure contains the state of the fastbuf. See the discussion above
202  * for how it works.
203  **/
204 struct fastbuf {
205   byte *bptr, *bstop;                           /* State of the buffer */
206   byte *buffer, *bufend;                        /* Start and end of the buffer */
207   char *name;                                   /* File name (used for error messages) */
208   ucw_off_t pos;                                /* Position of bstop in the file */
209   uint flags;                                   /* See enum fb_flags */
210   int (*refill)(struct fastbuf *);              /* Get a buffer with new data, returns 0 on EOF */
211   void (*spout)(struct fastbuf *);              /* Write buffer data to the file */
212   int (*seek)(struct fastbuf *, ucw_off_t, int);/* Slow path for @bseek(), buffer already flushed; returns success */
213   void (*close)(struct fastbuf *);              /* Close the stream */
214   int (*config)(struct fastbuf *, uint, int);   /* Configure the stream */
215   int can_overwrite_buffer;                     /* Can the buffer be altered? 0=never, 1=temporarily, 2=permanently */
216   struct resource *res;                         /* The fastbuf can be tied to a resource pool */
217 };
218
219 /**
220  * Fastbuf flags
221  */
222 enum fb_flags {
223   FB_DEAD = 0x1,                                /* Some fastbuf's method has thrown an exception */
224   FB_DIE_ON_EOF = 0x2,                          /* Most of read operations throw "fb.eof" on EOF */
225 };
226
227 /** Tie a fastbuf to a resource in the current resource pool. Returns the pointer to the same fastbuf. **/
228 struct fastbuf *fb_tie(struct fastbuf *b);      /* Tie fastbuf to a resource if there is an active pool */
229
230 /***
231  * === Fastbuf on files [[fbparam]]
232  *
233  * If you want to use fastbufs to access files, you can choose one of several
234  * back-ends and set their parameters.
235  ***/
236
237 /**
238  * Back-end types
239  */
240 enum fb_type {
241   FB_STD,                               /* Standard buffered I/O */
242   FB_DIRECT,                            /* Direct I/O bypassing system caches (see fb-direct.c for a description) */
243   FB_MMAP                               /* Memory mapped files */
244 };
245
246 /**
247  * When you open a file fastbuf, you can use this structure to select a back-end
248  * and set its parameters. If you want just an "ordinary" file stream, you can
249  * happily pass NULL instead and the defaults from the configuration file (or
250  * hard-wired defaults if no config file has been read) will be used.
251  */
252 struct fb_params {
253   enum fb_type type;                    /* The chosen back-end */
254   uint buffer_size;                     /* 0 for default size */
255   uint keep_back_buf;                   /* FB_STD: optimize for bi-directional access */
256   uint read_ahead;                      /* FB_DIRECT options */
257   uint write_back;
258   struct asio_queue *asio;
259 };
260
261 struct cf_section;
262 extern struct cf_section fbpar_cf;      /** Configuration section with which you can fill the `fb_params` **/
263 extern struct fb_params fbpar_def;      /** The default `fb_params` **/
264
265 /**
266  * Opens a file with file mode @mode (see the man page of open()).
267  * Use @params to select the fastbuf back-end and its parameters or
268  * pass NULL if you are fine with defaults.
269  *
270  * Raises `ucw.fb.open` if the file does not exist.
271  **/
272 struct fastbuf *bopen_file(const char *name, int mode, struct fb_params *params);
273 struct fastbuf *bopen_file_try(const char *name, int mode, struct fb_params *params); /** Like @bopen_file(), but returns NULL on failure. **/
274
275 /**
276  * Opens a temporary file.
277  * It is placed with other temp files and it is deleted when closed.
278  * Again, use NULL for @params if you want the defaults.
279  **/
280 struct fastbuf *bopen_tmp_file(struct fb_params *params);
281
282 /**
283  * Creates a fastbuf from a file descriptor @fd and sets its filename
284  * to @name (the name is used only in error messages).
285  * When the fastbuf is closed, the fd is closed as well. You can override
286  * this behavior by calling @bconfig().
287  */
288 struct fastbuf *bopen_fd_name(int fd, struct fb_params *params, const char *name);
289 static inline struct fastbuf *bopen_fd(int fd, struct fb_params *params) /** Same as above, but with an auto-generated filename. **/
290 {
291   return bopen_fd_name(fd, params, NULL);
292 }
293
294 /**
295  * Flushes all buffers and makes sure that they are written to the disk.
296  **/
297 void bfilesync(struct fastbuf *b);
298
299 /***
300  * === Fastbufs on regular files [[fbfile]]
301  *
302  * If you want to use the `FB_STD` back-end and not worry about setting
303  * up any parameters, there is a couple of shortcuts.
304  ***/
305
306 struct fastbuf *bopen(const char *name, uint mode, uint buflen);        /** Equivalent to @bopen_file() with `FB_STD` back-end. **/
307 struct fastbuf *bopen_try(const char *name, uint mode, uint buflen);    /** Equivalent to @bopen_file_try() with `FB_STD` back-end. **/
308 struct fastbuf *bopen_tmp(uint buflen);                                 /** Equivalent to @bopen_tmp_file() with `FB_STD` back-end. **/
309 struct fastbuf *bfdopen(int fd, uint buflen);                           /** Equivalent to @bopen_fd() with `FB_STD` back-end. **/
310 struct fastbuf *bfdopen_shared(int fd, uint buflen);                    /** Like @bfdopen(), but it does not close the @fd on @bclose(). **/
311
312 /***
313  * === Temporary files [[fbtemp]]
314  *
315  * Usually, @bopen_tmp_file() is the best way how to come to a temporary file.
316  * However, in some specific cases you can need more, so there is also a set
317  * of more general functions.
318  ***/
319
320 #define TEMP_FILE_NAME_LEN 256
321
322 /**
323  * Generates a temporary filename and stores it to the @name_buf (of size
324  * at least * `TEMP_FILE_NAME_LEN`). If @open_flags are not NULL, flags that
325  * should be OR-ed with other flags to open() will be stored there.
326  *
327  * The location and style of temporary files is controlled by the configuration.
328  * By default, the system temp directory (`$TMPDIR` or `/tmp`) is used.
329  *
330  * If the location is a publicly writeable directory (like `/tmp`), the
331  * generated filename cannot be guaranteed to be unique, so @open_flags
332  * will include `O_EXCL` and you have to check the result of open() and
333  * iterate if needed.
334  *
335  * This function is not specific to fastbufs, it can be used separately.
336  **/
337 void temp_file_name(char *name_buf, int *open_flags);
338
339 /**
340  * Opens a temporary file and returns its file descriptor.
341  * You specify the file @mode and @open_flags passed to open().
342  *
343  * If the @name_buf (of at last `TEMP_FILE_NAME_LEN` chars) is not NULL,
344  * the filename is also stored in it.
345  *
346  * This function is not specific to fastbufs, it can be used separately.
347  */
348 int open_tmp(char *name_buf, int open_flags, int mode);
349
350 /**
351  * Sometimes, a file is created as temporary and then moved to a stable
352  * location. This function takes a fastbuf created by @bopen_tmp_file()
353  * or @bopen_tmp(), marks it as permanent, closes it and renames it to
354  * @name.
355  *
356  * Please note that it assumes that the temporary file and the @name
357  * are on the same volume (otherwise, rename() fails), so you might
358  * want to configure a special location for the temporary files
359  * beforehand.
360  */
361 void bfix_tmp_file(struct fastbuf *fb, const char *name);
362
363 /* Internal functions of some file back-ends */
364
365 struct fastbuf *bfdopen_internal(int fd, const char *name, uint buflen);
366 struct fastbuf *bfmmopen_internal(int fd, const char *name, uint mode);
367
368 #ifdef CONFIG_UCW_FB_DIRECT
369 extern uint fbdir_cheat;
370 struct asio_queue;
371 struct fastbuf *fbdir_open_fd_internal(int fd, const char *name, struct asio_queue *io_queue, uint buffer_size, uint read_ahead, uint write_back);
372 #endif
373
374 void bclose_file_helper(struct fastbuf *f, int fd, int is_temp_file);
375
376 /***
377  * === Fastbufs on file fragments [[fblim]]
378  *
379  * The `fblim` back-end reads from a file handle, but at most a given
380  * number of bytes. This is frequently used for reading from sockets.
381  ***/
382
383 struct fastbuf *bopen_limited_fd(int fd, uint bufsize, uint limit); /** Create a fastbuf which reads at most @limit bytes from @fd. **/
384
385 /***
386  * === Fastbufs on in-memory streams [[fbmem]]
387  *
388  * The `fbmem` back-end keeps the whole contents of the stream
389  * in memory (as a linked list of memory blocks, so address space
390  * fragmentation is avoided).
391  *
392  * First, you use @fbmem_create() to create the stream and the fastbuf
393  * used for writing to it. Then you can call @fbmem_clone_read() to get
394  * an arbitrary number of fastbuf for reading from the stream.
395  ***/
396
397 struct fastbuf *fbmem_create(uint blocksize);           /** Create stream and return its writing fastbuf. **/
398 struct fastbuf *fbmem_clone_read(struct fastbuf *f);    /** Given a writing fastbuf, create a new reading fastbuf. **/
399
400 /***
401  * === Fastbufs on static buffers [[fbbuf]]
402  *
403  * The `fbbuf` back-end stores the stream in a given block of memory.
404  * This is useful for parsing and generating of complex data structures.
405  ***/
406
407 /**
408  * Creates a read-only fastbuf that takes its data from a given buffer.
409  * The fastbuf structure is allocated by the caller and pointed to by @f.
410  * The @buffer and @size specify the location and size of the buffer.
411  *
412  * In some cases, the front-ends can take advantage of rewriting the contents
413  * of the buffer temporarily. In this case, set @can_overwrite as described
414  * in <<internal,Internals>>. If you do not care, keep @can_overwrite zero.
415  *
416  * A @bclose() on this fastbuf is allowed and it does nothing.
417  */
418 void fbbuf_init_read(struct fastbuf *f, byte *buffer, uint size, uint can_overwrite);
419
420 /**
421  * Creates a write-only fastbuf which writes into a provided memory buffer.
422  * The fastbuf structure is allocated by the caller and pointed to by @f.
423  * An attempt to write behind the end of the buffer causes the `ucw.fb.write` exception.
424  *
425  * Data are written directly into the buffer, so it is not necessary to call @bflush()
426  * at any moment.
427  *
428  * A @bclose() on this fastbuf is allowed and it does nothing.
429  */
430 void fbbuf_init_write(struct fastbuf *f, byte *buffer, uint size);
431
432 static inline uint fbbuf_count_written(struct fastbuf *f) /** Calculates, how many bytes were already written into the buffer. **/
433 {
434   return f->bptr - f->bstop;
435 }
436
437 /***
438  * === Fastbuf on recyclable growing buffers [[fbgrow]]
439  *
440  * The `fbgrow` back-end keeps the stream in a contiguous buffer stored in the
441  * main memory, but unlike <<fbmem,`fbmem`>>, the buffer does not have a fixed
442  * size and it is expanded to accomodate all data.
443  *
444  * At every moment, you can use `fastbuf->buffer` to gain access to the stream.
445  ***/
446
447 struct mempool;
448
449 struct fastbuf *fbgrow_create(uint basic_size);         /** Create the growing buffer pre-allocated to @basic_size bytes. **/
450 struct fastbuf *fbgrow_create_mp(struct mempool *mp, uint basic_size); /** Create the growing buffer pre-allocated to @basic_size bytes. **/
451 void fbgrow_reset(struct fastbuf *b);                   /** Reset stream and prepare for writing. **/
452 void fbgrow_rewind(struct fastbuf *b);                  /** Prepare for reading (of already written data). **/
453
454 /**
455  * Can be used in any state of @b (for example when writing or after
456  * @fbgrow_rewind()) to return the pointer to internal buffer and its length in
457  * bytes. The returned buffer can be invalidated by further requests.
458  **/
459 uint fbgrow_get_buf(struct fastbuf *b, byte **buf);
460
461 /***
462  * === Fastbuf on memory pools [[fbpool]]
463  *
464  * The write-only `fbpool` back-end also keeps the stream in a contiguous
465  * buffer, but this time the buffer is allocated from within a memory pool.
466  ***/
467
468 struct fbpool { /** Structure for fastbufs & mempools. **/
469   struct fastbuf fb;
470   struct mempool *mp;
471 };
472
473 /**
474  * Initialize a new `fbpool`. The structure is allocated by the caller.
475  * Calling @bclose() is optional.
476  **/
477 void fbpool_init(struct fbpool *fb);    /** Initialize a new mempool fastbuf. **/
478 /**
479  * Start a new continuous block and prepare for writing (see <<mempool:mp_start()>>).
480  * Provide the memory pool you want to use for this block as @mp.
481  **/
482 void fbpool_start(struct fbpool *fb, struct mempool *mp, size_t init_size);
483 /**
484  * Close the block and return the address of its start (see <<mempool:mp_end()>>).
485  * The length can be determined by calling <<mempool:mp_size(mp, ptr)>>.
486  **/
487 void *fbpool_end(struct fbpool *fb);
488
489 /***
490  * === Atomic files for multi-threaded programs [[fbatomic]]
491  *
492  * This fastbuf backend is designed for cases when several threads
493  * of a single program append records to a common file and while the
494  * record can mix in an arbitrary way, the bytes inside a single
495  * record must remain uninterrupted.
496  *
497  * In case of files with fixed record size, we just allocate the
498  * buffer to hold a whole number of records and take advantage
499  * of the atomicity of the write() system call.
500  *
501  * With variable-sized records, we need another solution: when
502  * writing a record, we keep the fastbuf in a locked state, which
503  * prevents buffer flushing (and if the buffer becomes full, we extend it),
504  * and we wait for an explicit commit operation which write()s the buffer
505  * if the free space in the buffer falls below the expected maximum record
506  * length.
507  *
508  * Please note that initialization of the clones is not thread-safe,
509  * so you have to serialize it yourself.
510  ***/
511
512 struct fb_atomic {
513   struct fastbuf fb;
514   struct fb_atomic_file *af;
515   byte *expected_max_bptr;
516   uint slack_size;
517 };
518
519 /**
520  * Open an atomic fastbuf.
521  * If @master is NULL, the file @name is opened. If it is non-null,
522  * a new clone of an existing atomic fastbuf is created.
523  *
524  * If the file has fixed record length, just set @record_len to it.
525  * Otherwise set @record_len to the expected maximum record length
526  * with a negative sign (you need not fit in this length, but as long
527  * as you do, the fastbuf is more efficient) and call @fbatomic_commit()
528  * after each record.
529  *
530  * You can specify @record_len, if it is known (for optimisations).
531  *
532  * The file is closed when all fastbufs using it are closed.
533  **/
534 struct fastbuf *fbatomic_open(const char *name, struct fastbuf *master, uint bufsize, int record_len);
535 void fbatomic_internal_write(struct fastbuf *b);
536
537 /**
538  * Declare that you have finished writing a record. This is required only
539  * if a fixed record size was not specified.
540  **/
541 static inline void fbatomic_commit(struct fastbuf *b)
542 {
543   if (b->bptr >= ((struct fb_atomic *)b)->expected_max_bptr)
544     fbatomic_internal_write(b);
545 }
546
547 /*** === Null fastbufs ***/
548
549 /**
550  * Creates a new "/dev/null"-like  fastbuf.
551  * Any read attempt returns an EOF, any write attempt is silently ignored.
552  **/
553 struct fastbuf *fbnull_open(uint bufsize);
554
555 /**
556  * Can be used by any back-end to switch it to the null mode.
557  * You need to provide at least one byte long buffer for writing.
558  **/
559 void fbnull_start(struct fastbuf *b, byte *buf, uint bufsize);
560
561 /**
562  * Checks whether a fastbuf has been switched to the null mode.
563  **/
564 bool fbnull_test(struct fastbuf *b);
565
566 /***
567  * === Fastbufs atop other fastbufs [[fbmulti]]
568  *
569  * Imagine some code which does massive string processing. It takes an input
570  * buffer, writes a part of it into an output buffer, then some other string
571  * and then the remaining part of the input buffer. Or anything else where you
572  * copy all the data at each stage of the complicated process.
573  *
574  * This backend takes multiple fastbufs and concatenates them formally into
575  * one. You may then read them consecutively as they were one fastbuf at all.
576  *
577  * This backend is read-only.
578  *
579  * This backend is seekable iff all of the supplied fastbufs are seekable.
580  *
581  * You aren't allowed to do anything with the underlying buffers while these
582  * are connected into fbmulti.
583  *
584  * The fbmulti is inited by @fbmulti_create(). It returns an empty fbmulti.
585  * Then you call @fbmulti_append() for each fbmulti.
586  *
587  * If @bclose() is called on fbmulti, all the underlying buffers get closed
588  * recursively.
589  *
590  * If you want to keep an underlying fastbuf open after @bclose, just remove it
591  * by @fbmulti_remove where the second parameter is a pointer to the removed
592  * fastbuf. If you pass NULL, all the underlying fastbufs are removed.
593  *
594  * After @fbmulti_remove, the state of the fbmulti is undefined. The only allowed
595  * operation is either another @fbmulti_remove or @bclose on the fbmulti.
596  ***/
597
598 /**
599  * Create an empty fbmulti
600  **/
601 struct fastbuf *fbmulti_create(void);
602
603 /**
604  * Append a fb to fbmulti
605  **/
606 void fbmulti_append(struct fastbuf *f, struct fastbuf *fb);
607
608 /**
609  * Remove a fb from fbmulti
610  **/
611 void fbmulti_remove(struct fastbuf *f, struct fastbuf *fb);
612
613 /*** === Configuring stream parameters [[bconfig]] ***/
614
615 enum bconfig_type {                     /** Parameters that could be configured. **/
616   BCONFIG_IS_TEMP_FILE,                 /* 0=normal file, 1=temporary file, 2=shared fd */
617   BCONFIG_KEEP_BACK_BUF,                /* Optimize for bi-directional access */
618 };
619
620 int bconfig(struct fastbuf *f, uint type, int data); /** Configure a fastbuf. Returns previous value. **/
621
622 /*** === Universal functions working on all fastbuf's [[ffbasic]] ***/
623
624 /**
625  * Close and free fastbuf.
626  * Some kinds of fastbufs are allocated by the caller (e.g., in @fbbuf_init_read());
627  * in such cases, @bclose() does not free any memory.
628  */
629 void bclose(struct fastbuf *f);
630 void bthrow(struct fastbuf *f, const char *id, const char *fmt, ...) FORMAT_CHECK(printf,3,4) NONRET;   /** Throw exception on a given fastbuf **/
631 int brefill(struct fastbuf *f, int allow_eof);
632 void bspout(struct fastbuf *f);
633 void bflush(struct fastbuf *f);                                 /** Write data (if it makes any sense, do not use for in-memory buffers). **/
634 void bseek(struct fastbuf *f, ucw_off_t pos, int whence);       /** Seek in the buffer. See `man fseek` for description of @whence. Only for seekable fastbufs. **/
635 void bsetpos(struct fastbuf *f, ucw_off_t pos);                 /** Set position to @pos bytes from beginning. Only for seekable fastbufs. **/
636 void brewind(struct fastbuf *f);                                /** Go to the beginning of the fastbuf. Only for seekable ones. **/
637 ucw_off_t bfilesize(struct fastbuf *f);                         /** How large is the file? -1 if not seekable. **/
638
639 static inline ucw_off_t btell(struct fastbuf *f)                /** Where am I (from the beginning)? **/
640 {
641   return f->pos + (f->bptr - f->bstop);
642 }
643
644 int bgetc_slow(struct fastbuf *f);
645 static inline int bgetc(struct fastbuf *f)                      /** Return next character from the buffer. **/
646 {
647   return (f->bptr < f->bstop) ? (int) *f->bptr++ : bgetc_slow(f);
648 }
649
650 int bpeekc_slow(struct fastbuf *f);
651 static inline int bpeekc(struct fastbuf *f)                     /** Return next character from the buffer, but keep the current position. **/
652 {
653   return (f->bptr < f->bstop) ? (int) *f->bptr : bpeekc_slow(f);
654 }
655
656 int beof_slow(struct fastbuf *f);
657 static inline int beof(struct fastbuf *f)                       /** Have I reached EOF? **/
658 {
659   return (f->bptr < f->bstop) ? 0 : beof_slow(f);
660 }
661
662 static inline void bungetc(struct fastbuf *f)                   /** Return last read character back. Only one back is guaranteed to work. **/
663 {
664   f->bptr--;
665 }
666
667 void bputc_slow(struct fastbuf *f, uint c);
668 static inline void bputc(struct fastbuf *f, uint c)             /** Write a single character. **/
669 {
670   if (f->bptr < f->bufend)
671     *f->bptr++ = c;
672   else
673     bputc_slow(f, c);
674 }
675
676 static inline uint bavailr(struct fastbuf *f)                   /** Return the length of the cached data to be read. Do not use directly. **/
677 {
678   return f->bstop - f->bptr;
679 }
680
681 static inline uint bavailw(struct fastbuf *f)                   /** Return the length of the buffer available for writing. Do not use directly. **/
682 {
683   return f->bufend - f->bptr;
684 }
685
686 uint bread_slow(struct fastbuf *f, void *b, uint l, uint check);
687 /**
688  * Read at most @l bytes of data into @b.
689  * Returns number of bytes read.
690  * 0 means end of file.
691  */
692 static inline uint bread(struct fastbuf *f, void *b, uint l)
693 {
694   if (bavailr(f) >= l)
695     {
696       memcpy(b, f->bptr, l);
697       f->bptr += l;
698       return l;
699     }
700   else
701     return bread_slow(f, b, l, 0);
702 }
703
704 /**
705  * Reads exactly @l bytes of data into @b.
706  * If at the end of file, it returns 0.
707  * If there are data, but less than @l, it raises `ucw.fb.eof`.
708  */
709 static inline uint breadb(struct fastbuf *f, void *b, uint l)
710 {
711   if (bavailr(f) >= l)
712     {
713       memcpy(b, f->bptr, l);
714       f->bptr += l;
715       return l;
716     }
717   else
718     return bread_slow(f, b, l, 1);
719 }
720
721 void bwrite_slow(struct fastbuf *f, const void *b, uint l);
722 static inline void bwrite(struct fastbuf *f, const void *b, uint l) /** Writes buffer @b of length @l into fastbuf. **/
723 {
724   if (bavailw(f) >= l)
725     {
726       memcpy(f->bptr, b, l);
727       f->bptr += l;
728     }
729   else
730     bwrite_slow(f, b, l);
731 }
732
733 /**
734  * Reads a line into @b and strips trailing `\n`.
735  * Returns pointer to the terminating 0 or NULL on `EOF`.
736  * Raises `ucw.fb.toolong` if the line is longer than @l.
737  **/
738 char *bgets(struct fastbuf *f, char *b, uint l);
739 char *bgets0(struct fastbuf *f, char *b, uint l);       /** The same as @bgets(), but for 0-terminated strings. **/
740 /**
741  * Returns either length of read string (excluding the terminator) or -1 if it is too long.
742  * In such cases exactly @l bytes are read.
743  */
744 int bgets_nodie(struct fastbuf *f, char *b, uint l);
745
746 struct mempool;
747 struct bb_t;
748 /**
749  * Read a string, strip the trailing `\n` and store it into growing buffer @b.
750  * Raises `ucw.fb.toolong` if the line is longer than @limit.
751  **/
752 uint bgets_bb(struct fastbuf *f, struct bb_t *b, uint limit);
753 /**
754  * Read a string, strip the trailing `\n` and store it into buffer allocated from a memory pool.
755  **/
756 char *bgets_mp(struct fastbuf *f, struct mempool *mp);
757
758 struct bgets_stk_struct {
759   struct fastbuf *f;
760   byte *old_buf, *cur_buf, *src;
761   uint old_len, cur_len, src_len;
762 };
763 void bgets_stk_init(struct bgets_stk_struct *s);
764 void bgets_stk_step(struct bgets_stk_struct *s);
765
766 /**
767  * Read a string, strip the trailing `\n` and store it on the stack (allocated using alloca()).
768  **/
769 #define bgets_stk(fb) \
770   ({ struct bgets_stk_struct _s; _s.f = (fb); for (bgets_stk_init(&_s); _s.cur_len; _s.cur_buf = alloca(_s.cur_len), bgets_stk_step(&_s)); _s.cur_buf; })
771
772 /**
773  * Write a string, without 0 or `\n` at the end.
774  **/
775 static inline void bputs(struct fastbuf *f, const char *b)
776 {
777   bwrite(f, b, strlen(b));
778 }
779
780 /**
781  * Write string, including terminating 0.
782  **/
783 static inline void bputs0(struct fastbuf *f, const char *b)
784 {
785   bwrite(f, b, strlen(b)+1);
786 }
787
788 /**
789  * Write string and append a newline to the end.
790  **/
791 static inline void bputsn(struct fastbuf *f, const char *b)
792 {
793   bputs(f, b);
794   bputc(f, '\n');
795 }
796
797 void bbcopy_slow(struct fastbuf *f, struct fastbuf *t, uint l);
798 /**
799  * Copy @l bytes of data from fastbuf @f to fastbuf @t.
800  * `UINT_MAX` (`~0U`) means all data, even if more than `UINT_MAX` bytes remain.
801  **/
802 static inline void bbcopy(struct fastbuf *f, struct fastbuf *t, uint l)
803 {
804   if (bavailr(f) >= l && bavailw(t) >= l)
805     {
806       memcpy(t->bptr, f->bptr, l);
807       t->bptr += l;
808       f->bptr += l;
809     }
810   else
811     bbcopy_slow(f, t, l);
812 }
813
814 int bskip_slow(struct fastbuf *f, uint len);
815 static inline int bskip(struct fastbuf *f, uint len) /** Skip @len bytes without reading them. **/
816 {
817   if (bavailr(f) >= len)
818     {
819       f->bptr += len;
820       return 1;
821     }
822   else
823     return bskip_slow(f, len);
824 }
825
826 /*** === Direct I/O on buffers ***/
827
828 /**
829  * Begin direct reading from fastbuf's internal buffer to avoid unnecessary copying.
830  * The function returns a buffer @buf together with its length in bytes (zero means EOF)
831  * with cached data to be read.
832  *
833  * Some back-ends allow the user to modify the data in the returned buffer to avoid unnecessary.
834  * If the back-end allows such modifications, it can set `f->can_overwrite_buffer` accordingly:
835  *
836  *   - 0 if no modification is allowed,
837  *   - 1 if the user can modify the buffer on the condition that
838  *       the modifications will be undone before calling the next
839  *       fastbuf operation
840  *   - 2 if the user is allowed to overwrite the data in the buffer
841  *       if @bdirect_read_commit_modified() is called afterwards.
842  *       In this case, the back-end must be prepared for trimming
843  *       of the buffer which is done by the commit function.
844  *
845  * The reading must be ended by @bdirect_read_commit() or @bdirect_read_commit_modified(),
846  * unless the user did not read or modify anything.
847  **/
848 static inline uint bdirect_read_prepare(struct fastbuf *f, byte **buf)
849 {
850   if (f->bptr == f->bstop && !f->refill(f))
851     {
852       *buf = NULL;  // This is not needed, but it helps to get rid of spurious warnings
853       return 0;
854     }
855   *buf = f->bptr;
856   return bavailr(f);
857 }
858
859 /**
860  * End direct reading started by @bdirect_read_prepare() and move the cursor at @pos.
861  * Data in the returned buffer must be same as after @bdirect_read_prepare() and
862  * @pos must point somewhere inside the buffer.
863  **/
864 static inline void bdirect_read_commit(struct fastbuf *f, byte *pos)
865 {
866   f->bptr = pos;
867 }
868
869 /**
870  * Similar to @bdirect_read_commit(), but accepts also modified data before @pos.
871  * Note that such modifications are supported only if `f->can_overwrite_buffer == 2`.
872  **/
873 static inline void bdirect_read_commit_modified(struct fastbuf *f, byte *pos)
874 {
875   f->bptr = pos;
876   f->buffer = pos;      /* Avoid seeking backwards in the buffer */
877 }
878
879 /**
880  * Start direct writing to fastbuf's internal buffer to avoid copy overhead.
881  * The function returns the length of the buffer in @buf (at least one byte)
882  * where we can write to. The operation must be ended by @bdirect_write_commit(),
883  * unless nothing is written.
884  **/
885 static inline uint bdirect_write_prepare(struct fastbuf *f, byte **buf)
886 {
887   if (f->bptr == f->bufend)
888     f->spout(f);
889   *buf = f->bptr;
890   return bavailw(f);
891 }
892
893 /**
894  * Commit the data written to the buffer returned by @bdirect_write_prepare().
895  * The length is specified by @pos which must point just after the written data.
896  * Also moves the cursor to @pos.
897  **/
898 static inline void bdirect_write_commit(struct fastbuf *f, byte *pos)
899 {
900   f->bptr = pos;
901 }
902
903 /*** === Formatted output ***/
904
905 /**
906  * printf into a fastbuf.
907  **/
908 int bprintf(struct fastbuf *b, const char *msg, ...)
909   FORMAT_CHECK(printf,2,3);
910 int vbprintf(struct fastbuf *b, const char *msg, va_list args); /** vprintf into a fastbuf. **/
911
912 #endif