]> mj.ucw.cz Git - libucw.git/blob - build/sherlock.cfg
7f932ea6d7aad43105a95ad5934f222faa032306
[libucw.git] / build / sherlock.cfg
1 # Configuration variables of Sherlock and their default values
2 # (c) 2005 Martin Mares <mj@ucw.cz>
3
4 # Version of the whole package
5 Set("SHERLOCK_VERSION" => "3.5");
6
7 # Installation directory for `make install'
8 Set("INSTALL_DIR" => "~/run-3.5");
9
10 # Compile everything with debug information and ASSERT's
11 UnSet("CONFIG_DEBUG");
12
13 # Enable aggressive optimizations depending on exact CPU type (don't use for portable packages)
14 UnSet("CONFIG_EXACT_CPU");
15
16 ### Standard modules available in all releases of Sherlock ###
17
18 # Gatherer (the gatherer library and some utilities) [FIXME: decide automatically?]
19 Set("CONFIG_GATHERER");
20
21 # The gatherer daemon (requires CONFIG_GATHERER)
22 Set("CONFIG_GATHERD");
23
24 # Indexer
25 Set("CONFIG_INDEXER");
26
27 # Search server
28 Set("CONFIG_SEARCH");
29
30 # Watson: The Monitoring System
31 UnSet("CONFIG_WATSON");
32
33 #ifndef CONFIG_FREE
34 ### These are available in the commercial version only: ###
35
36 # The Shepherd daemon (requires CONFIG_GATHERER and CONFIG_SHEPHERD_PROTOCOL)
37 UnSet("CONFIG_SHEPHERD");
38
39 # Support for Shepherd protocols everywhere (distributed indexing etc.)
40 UnSet("CONFIG_SHEPHERD_PROTOCOL");
41
42 # The reaper daemon, used by Shepherd to download the pages (requires CONFIG_GATHERER)
43 UnSet("CONFIG_REAPD");
44
45 # The multiplexer
46 UnSet("CONFIG_MUX");
47
48 #endif
49
50 ### Optional Modules & Features ###
51
52 # Number of sections we remember limits for
53 Set("SHERLOCK_NUM_SECTIONS" => 4);
54
55 # Use shared libraries
56 UnSet("CONFIG_SHARED");
57
58 # Gathering of PDF files
59 Set("CONFIG_PDF");
60
61 # Searching by last modification time
62 Set("CONFIG_LASTMOD");
63
64 # Searching by file type
65 Set("CONFIG_FILETYPE");
66
67 # Language processing (requires CONFIG_FILETYPE)
68 Set("CONFIG_LANG");
69
70 # Spelling checker
71 Set("CONFIG_SPELL");
72
73 # Enable indexing of context-dependent words and set maximum number
74 # of context slots (undef, 256 or 32768). Lower values save memory, higher time.
75 Set("CONFIG_MAX_CONTEXTS" => 256);
76
77 # Enable more than 16-bit word positions in references
78 Set("CONFIG_32BIT_REFERENCES");
79
80 # Debugging tools
81 UnSet("CONFIG_DEBUG_TOOLS");
82
83 # Search server: Enable EXPLAIN command (slows searching down slightly)
84 Set("CONFIG_EXPLAIN");
85
86 # If your system doesn't contain GNU libc 2.3 or newer, it's recommended to let Sherlock
87 # use its own regex library (a copy of the glibc one), because the default regex library
88 # is likely to be crappy.
89 Set("CONFIG_OWN_REGEX");
90
91 # Include custom builtin functions in filtering language
92 UnSet("CONFIG_CUSTOM_FILTER");
93
94 # Install libraries and their API includes
95 UnSet("CONFIG_INSTALL_API");
96
97 #ifndef CONFIG_FREE
98 # Number of refresh frequencies we allow
99 Set("SHERLOCK_NUM_FREQS" => 5);
100
101 # Gathering and indexing split to areas
102 UnSet("CONFIG_AREAS");
103
104 # Site compression
105 UnSet("CONFIG_SITES");
106
107 # Gathering of images
108 UnSet("CONFIG_IMAGES");
109
110 # Gathering of MS Word files
111 UnSet("CONFIG_MSWORD");
112
113 # Gathering of MS Excel files
114 UnSet("CONFIG_EXCEL");
115
116 # Extra stuff for Centrum
117 UnSet("CONFIG_CENTRUM");
118 UnSet("CONFIG_CENTRUM_CZ");
119 UnSet("CONFIG_CENTRUM_SK");
120 UnSet("CONFIG_CENTRUM_PL");
121
122 # Debugging version of Centrum installation (lower limits, trivial filters etc.)
123 UnSet("CONFIG_CENTRUM_DEBUG");
124
125 # Stemmer by UFAL and its dictionaries
126 UnSet("CONFIG_UFAL_STEMMER");
127 UnSet("CONFIG_UFAL_DICT_CS");
128 UnSet("CONFIG_UFAL_DICT_SK");
129
130 # Stemmer for Polish with its dictionary
131 UnSet("CONFIG_PL_STEMMER");
132
133 # Dynamic weights
134 UnSet("CONFIG_WEIGHTS");
135
136 #endif
137
138 ### These are internal settings which shouldn't be modified by custom configs ###
139
140 # Default configuration file
141 Set("DEFAULT_CONFIG" => "cf/sherlock");
142
143 # Configuration of parts of the UCW library
144 Set("CONFIG_UCW_PERL" => 1);
145 Set("CONFIG_UCW_SHELL_UTILS" => 1);
146
147 # Configuration of the language library
148 Set("CONFIG_LANG_DETECT" => 1);
149
150 # We always want to be able to use large files
151 Set("CONFIG_LFS" => 1);
152
153 # Maximum word length common for Sherlock and liblang, see comments in sherlock/index.h
154 Set("MAX_WORD_LEN" => 64);
155
156 # Return success
157 1;