Konverze obrázků: krok 1

[ga.git] / 10-suffix / 10-suffix.tex
diff --git a/10-suffix/10-suffix.tex b/10-suffix/10-suffix.tex

index f75d476bcad06dddd3befaba25b3adabb9f04438..fe2689373195eb50cbc61b39b8bafaffc2129a6a 100644 (file)
--- a/10-suffix/10-suffix.tex
+++ b/10-suffix/10-suffix.tex
@@ -1,335 +1,380 @@
  \input ../sgr.tex
  
-\prednaska{10}{Suffixové stromy}{}
+\prednaska{10}{Suffixové stromy}{}
  
-V~této kapitole popí¹eme jednu pozoruhodnou datovou strukturu, pomocí ní¾ doká¾eme problémy týkající
-se øetìzcù pøevádìt na grafové problémy a øe¹it je tak v~lineárním èase.
+V~této kapitole popíšeme jednu pozoruhodnou datovou strukturu, pomocí níž dokážeme problémy týkající
+se řetězců převádět na grafové problémy a řešit je tak v~lineárním čase.
  
-\h{Øetìzce, trie a suffixové stromy}
+\h{Řetězce, trie a suffixové stromy}
  
  \ss{Definice:}
  
  \nointerlineskip
  \halign{\qquad#\dotfill&~#\hfil\cr
  \hbox to 0.35\hsize{}\cr
-$\Sigma$                                       & koneèná abeceda -- mno¾ina znakù \cr
-\omit                                          & (znaky budeme znaèit latinskými písmeny)\cr
-$\Sigma^*$                                     & mno¾ina v¹ech slov nad $\Sigma$ \cr
-\omit                                          & (slova budeme znaèit øeckými písmeny)\cr
-$\varepsilon$                                  & prázdné slovo\cr
-$\vert\alpha\vert$                             & délka slova $\alpha$\cr
-$\alpha\beta$                                  & zøetìzení slov $\alpha$ a $\beta$ ($\alpha\varepsilon=\varepsilon\alpha=\alpha$)\cr
-$\alpha^R$                                     & slovo $\alpha$ napsané pozpátku\cr
-$\alpha$ je {\I prefixem} $\beta$              & $\exists\gamma: \beta=\alpha\gamma$ ($\beta$ zaèíná na~$\alpha$)\cr
-$\alpha$ je {\I suffixem} $\beta$              & $\exists\gamma: \beta=\gamma\alpha$ ($\beta$ konèí na~$\alpha$)\cr
-$\alpha$ je {\I podslovem} $\beta$             & $\exists\gamma,\delta: \beta=\gamma\alpha\delta$ (znaèíme $\alpha \subset \beta$)\cr
-$\alpha$ je {\I vlastním prefixem} $\beta$     & je prefixem a $\alpha\ne\beta$ \cr
-\omit                                          & (analogicky vlastní suffix a podslovo)\cr
+$\Sigma$                                       & konečná abeceda -- množina znaků \cr
+\omit                                          & (znaky budeme značit latinskými písmeny)\cr
+$\Sigma^*$                                     & množina všech slov nad $\Sigma$ \cr
+\omit                                          & (slova budeme značit řeckými písmeny)\cr
+$\varepsilon$                                  & prázdné slovo\cr
+$\vert\alpha\vert$                             & délka slova $\alpha$\cr
+$\alpha\beta$                                  & zřetězení slov $\alpha$ a $\beta$ ($\alpha\varepsilon=\varepsilon\alpha=\alpha$)\cr
+$\alpha^R$                                     & slovo $\alpha$ napsané pozpátku\cr
+$\alpha$ je {\I prefixem} $\beta$              & $\exists\gamma: \beta=\alpha\gamma$ ($\beta$ začíná na~$\alpha$)\cr
+$\alpha$ je {\I suffixem} $\beta$              & $\exists\gamma: \beta=\gamma\alpha$ ($\beta$ končí na~$\alpha$)\cr
+$\alpha$ je {\I podslovem} $\beta$             & $\exists\gamma,\delta: \beta=\gamma\alpha\delta$ (značíme $\alpha \subset \beta$)\cr
+$\alpha$ je {\I vlastním prefixem} $\beta$    & je prefixem a $\alpha\ne\beta$ \cr
+\omit                                          & (analogicky vlastní suffix a podslovo)\cr
  }
  
-\s{Pozorování:} Prázdné slovo je prefixem, suffixem i podslovem ka¾dého slova vèetnì sebe sama.
-Podslova jsou právì prefixy suffixù a také suffixy prefixù.
+\s{Pozorování:} Prázdné slovo je prefixem, suffixem i podslovem každého slova včetně sebe sama.
+Podslova jsou právě prefixy suffixů a také suffixy prefixů.
  
-\s{Definice:} {\I Trie ($\Sigma$-strom)} pro koneènou mno¾inu slov $X\subset\Sigma^*$ je orientovaný graf $G=(V,E)$, kde:
+\s{Definice:} {\I Trie ($\Sigma$-strom)} pro konečnou množinu slov $X\subset\Sigma^*$ je orientovaný graf $G=(V,E)$, kde:
  \itemize\relax
-\:$V = \{\alpha: \alpha\hbox{ je prefixem nìjakého $\beta\in X$} \},$
+\:$V = \{\alpha: \alpha\hbox{ je prefixem nějakého $\beta\in X$} \},$
  \:$(\alpha,\beta)\in E \equiv \exists x\in\Sigma: \beta=\alpha x$.
  \endlist
  
-\s{Pozorování:} Trie je strom s koøenem $\varepsilon$. Jeho listy jsou slova z $X$, která nejsou vlastními prefixy jiných slov z~$X$.
-Hrany si mù¾eme pøedstavit popsané písmeny, o~nì¾ prefix roz¹iøují, popisky hran na~cestì z~koøene do~vrcholu~$\alpha$ dávají právì slovo~$\alpha$.
+\s{Pozorování:} Trie je strom s kořenem $\varepsilon$. Jeho listy jsou slova z $X$, která nejsou vlastními prefixy jiných slov z~$X$.
+Hrany si můžeme představit popsané písmeny, o~něž prefix rozšiřují, popisky hran na~cestě z~kořene do~vrcholu~$\alpha$ dávají právě slovo~$\alpha$.
  
-\s{Definice:} {\I Komprimovaná trie ($\Sigma^+$-strom)} vznikne z trie nahrazením maximálních nevìtvících se cest hranami. Hrany
-jsou tentokrát popsané øetìzci místo jednotlivými písmeny, pøièem¾ popisky v¹ech hran vycházejících z~jednoho vrcholu se li¹í v~prvním
-znaku. Vrcholùm \uv{uvnitø hran} (které padly za obì» kompresi) budeme øíkat {\I skryté vrcholy.}
+\s{Definice:} {\I Komprimovaná trie ($\Sigma^+$-strom)} vznikne z trie nahrazením maximálních nevětvících se cest hranami. Hrany
+jsou tentokrát popsané řetězci místo jednotlivými písmeny, přičemž popisky všech hran vycházejících z~jednoho vrcholu se liší v~prvním
+znaku. Vrcholům \uv{uvnitř hran} (které padly za oběť kompresi) budeme říkat {\I skryté vrcholy.}
  
-\s{Definice:} {\I Suffixový strom (ST)} pro slovo $\sigma\in\Sigma^*$ je komprimovaná trie pro $X=\{\alpha: \hbox{$\alpha$ je suffixem $\sigma$}\}$.
+\s{Definice:} {\I Suffixový strom (ST)} pro slovo $\sigma\in\Sigma^*$ je komprimovaná trie pro $X=\{\alpha: \hbox{$\alpha$ je suffixem $\sigma$}\}$.
  
-\s{Pozorování:} Vrcholy suffixového stromu (vèetnì skrytých) odpovídají prefixùm suffixù slova~$\sigma$,
-tedy v¹em jeho podslovùm. Listy stromu jsou suffixy, které se v~$\sigma$ ji¾ nikde jinde nevyskytují
-(takovým suffixùm budeme øíkat {\I nevnoøené}). Vnitøní vrcholy odpovídají {\I vìtvícím podslovùm,}
-tedy podslovùm $\alpha\subset\sigma$ takovým, ¾e $\alpha a\subset\sigma$ i $\alpha b\subset\sigma$
-pro nìjaké dva rùzné znaky~$a$,~$b$.
+\s{Pozorování:} Vrcholy suffixového stromu (včetně skrytých) odpovídají prefixům suffixů slova~$\sigma$,
+tedy všem jeho podslovům. Listy stromu jsou suffixy, které se v~$\sigma$ již nikde jinde nevyskytují
+(takovým suffixům budeme říkat {\I nevnořené}). Vnitřní vrcholy odpovídají {\I větvícím podslovům,}
+tedy podslovÅ¯m $\alpha\subset\sigma$ takovÃ½m, Å¾e $\alpha a\subset\sigma$ i $\alpha b\subset\sigma$
+pro nějaké dva různé znaky~$a$,~$b$.
  
-Nìkdy mù¾e být nepraktické, ¾e nìkteré suffixy neodpovídají listùm (proto¾e jsou vnoøené), ale
-s~tím se mù¾eme snadno vypoøádat: pøidáme na~konec slova~$\sigma$ nìjaký znak~$\$$, který se nikde
-jinde nevyskytuje. Neprázdné suffixy slova $\sigma\$$ odpovídají suffixùm slova~$\sigma$
-a ¾ádný z~nich nemù¾e být vnoøený. Takový suffixový strom budeme znaèit ST\$.
+Někdy může být nepraktické, že některé suffixy neodpovídají listům (protože jsou vnořené), ale
+s~tím se můžeme snadno vypořádat: přidáme na~konec slova~$\sigma$ nějaký znak~$\$$, který se nikde
+jinde nevyskytuje. Neprázdné suffixy slova $\sigma\$$ odpovídají suffixům slova~$\sigma$
+a žádný z~nich nemůže být vnořený. Takový suffixový strom budeme značit ST\$.
  
-\s{Pøíklad:}
+\s{Příklad:}
  
-\figure{baraba.eps}{Suffixy slova \uv{baraba}: trie, suffixový strom, ST s~dolarem}{\epsfxsize}
+\figure{baraba.epdf}{Suffixy slova \uv{baraba}: trie, suffixový strom, ST s~dolarem}{\epsfxsize}
  
-\>Nyní jak je to s~konstrukcí suffixových stromù:
+\>Nyní jak je to s~konstrukcí suffixových stromů:
  
-\s{Lemma:} Suffixový strom pro slovo $\sigma$ délky $n$ je reprezentovatelný v~prostoru $\O(n)$.
+\s{Lemma:} Suffixový strom pro slovo $\sigma$ délky $n$ je reprezentovatelný v~prostoru $\O(n)$.
  
-\proof Strom má $\O(n)$ listù a ka¾dý vnitøní vrchol má alespoò $2$ syny, tak¾e vnitøních
-vrcholù je také $\O(n)$. Hran je rovnì¾ lineárnì. Nálepky na~hranách staèí popsat
-poèáteèní a koncovou pozicí v~$\sigma$.
+\proof Strom má $\O(n)$ listů a každý vnitřní vrchol má alespoň $2$ syny, takže vnitřních
+vrcholů je také $\O(n)$. Hran je rovněž lineárně. Nálepky na~hranách stačí popsat
+počáteční a koncovou pozicí v~$\sigma$.
  \qed
  
-\s{Vìta:} Suffixový strom pro slovo $\sigma$ délky $n$ lze sestrojit v~èase $\O(n)$.
+\s{Věta:} Suffixový strom pro slovo $\sigma$ délky $n$ lze sestrojit v~čase $\O(n)$.
  
-\proof Ve~zbytku této kapitoly pøedvedeme dvì rùzné konstrukce v~lineárním èase.
+\proof Ve~zbytku této kapitoly předvedeme dvě různé konstrukce v~lineárním čase.
  \qed
  
-\s{Aplikace} -- co v¹e doká¾eme v~lineárním èase, kdy¾ umíme lineárnì konstruovat ST:
+\s{Aplikace} -- co vše dokážeme v~lineárním čase, když umíme lineárně konstruovat ST:
  
  \nobreak
  
  \numlist\ndotted
-\:{\I Inverzní vyhledávání} (tj. pøedzpracujeme si v~lineárním èase text a pak umíme pro libovolné
-slovo~$\alpha$ v~èase $\O(\vert\alpha\vert)$ rozhodnout, zda se v~textu vyskytuje)\foot{Èili pøesný
-opak toho, co~umí vyhledávací automat -- ten si pøedzpracovává dotaz.} -- staèí sestrojit~ST
-a pak jej procházet od~koøene. Také umíme najít v¹echny výskyty (odpovídají suffixùm, které mají
-jako prefix hledané slovo, tak¾e staèí vytvoøit ST\$ a vypsat v¹echny listy pod
-nalezeným vrcholem) nebo pøímo vrátit jejich poèet (pøedpoèítáme si pomocí DFS pro ka¾dý vrchol,
-kolik pod ním le¾í listù).
-
-\:{\I Nejdel¹í opakující se podslovo} -- takové podslovo je v~ST\$ nutnì vìtvící, tak¾e staèí
-najít vnitøní vrchol s~nejvìt¹í {\I písmenkovou hloubkou} (tj. hloubkou mìøenou ve~znacích
-místo ve~hranách).
-
-\:{\I Histogram èetností podslov délky~$k$} -- rozøízneme ST v~písmenkové hloubce~$k$ a spoèítáme,
-kolik pùvodních listù je pod ka¾dým novým.
-
-\:{\I Nejdel¹í spoleèné podslovo} slov~$\alpha$ a $\beta$ -- postavíme ST pro slovo $\alpha\$_1\beta\$_2$,
-jeho listy odpovídají suffixùm slov $\alpha$ a $\beta$. Tak¾e staèí pomocí DFS najít nejhlub¹í vnitøní
-vrchol, pod kterým se vyskytují listy pro~$\alpha$ i $\beta$. Podobnì mù¾eme sestrojit ST\$ pro libovolnou
-mno¾inu slov.\foot{Jen si musíme dát pozor, abychom si moc nezvìt¹ili abecedu, ale to bude jasné,
-a¾ pøedvedeme konkrétní konstrukce.}
-
-\:{\I Nejdel¹í palindromické podslovo} (tj. takové $\beta\subset\alpha$, pro nì¾ je $\beta^R=\beta$)
--- postavíme spoleèný ST\$ pro slova $\alpha$ a $\alpha^R$. Postupnì procházíme pøes v¹echny mo¾né støedy
-palindromického podslova a v¹imneme si, ¾e takové slovo je pro ka¾dý støed nejdel¹ím spoleèným
-prefixem podslova od~tohoto bodu do~konce a podslova od~tohoto bodu pozpátku k~zaèátku,
-èili nìjakého suffixu $\alpha$ a nìjakého suffixu $\alpha^R$. Tyto suffixy ov¹em odpovídají
-listùm sestrojeného ST a jejich nejdel¹í spoleèný prefix je nejbli¾¹ím spoleèným pøedchùdcem
-ve~stromu, tak¾e staèí pro strom vybudovat datovou strukturu pro spoleèné pøedchùdce
-a s~její pomocí doká¾eme jeden støed prozkoumat v~konstantním èase.
-
-\:{\I Burrows-Wheelerova Transformace} \cite{burrows:bwt} -- jejím základem je lexikografické setøídìní v¹ech
-rotací slova~$\sigma$, co¾ zvládneme sestrojením ST pro slovo~$\sigma\sigma$, jeho
-uøíznutím v~písmenkové hloubce~$\vert\sigma\vert$ a vypsáním novì vzniklých listù v~poøadí
+\:{\I Inverzní vyhledávání} (tj. předzpracujeme si v~lineárním čase text a pak umíme pro libovolné
+slovo~$\alpha$ v~čase $\O(\vert\alpha\vert)$ rozhodnout, zda se v~textu vyskytuje)\foot{Čili přesný
+opak toho, co~umí vyhledávací automat -- ten si předzpracovává dotaz.} -- stačí sestrojit~ST
+a pak jej procházet od~kořene. Také umíme najít všechny výskyty (odpovídají suffixům, které mají
+jako prefix hledané slovo, takže stačí vytvořit ST\$ a vypsat všechny listy pod
+nalezeným vrcholem) nebo přímo vrátit jejich počet (předpočítáme si pomocí DFS pro každý vrchol,
+kolik pod ním leží listů).
+
+\:{\I Nejdelší opakující se podslovo} -- takové podslovo je v~ST\$ nutně větvící, takže stačí
+najít vnitřní vrchol s~největší {\I písmenkovou hloubkou} (tj. hloubkou měřenou ve~znacích
+místo ve~hranách).
+
+\:{\I Histogram četností podslov délky~$k$} -- rozřízneme ST\$ v~písmenkové hloubce~$k$ a spočítáme,
+kolik původních listů je pod každým novým.
+
+\:{\I Nejdelší společné podslovo} slov~$\alpha$ a $\beta$ -- postavíme ST pro slovo $\alpha\$_1\beta\$_2$,
+jeho listy odpovídají suffixům slov $\alpha$ a $\beta$. Takže stačí pomocí DFS najít nejhlubší vnitřní
+vrchol, pod kterÃ½m se vyskytujÃ listy pro~$\alpha$ i $\beta$. PodobnÄ\9b mÅ¯Å¾eme sestrojit ST\$ pro libovolnou
+množinu slov.\foot{Jen si musíme dát pozor, abychom si moc nezvětšili abecedu; jak moc si ji
+můžeme dovolit zvětšit, vyplyne z~konkrétních konstrukcí.}
+
+\:{\I NejdelÅ¡Ã palindromickÃ© podslovo} (tj. takovÃ© $\beta\subset\alpha$, pro nÄ\9bÅ¾ je $\beta^R=\beta$)
+-- postavíme společný ST\$ pro slova $\alpha$ a $\alpha^R$. Postupně procházíme přes všechny možné středy
+palindromického podslova a všimneme si, že takové slovo je pro každý střed nejdelším společným
+prefixem podslova od~tohoto bodu do~konce a podslova od~tohoto bodu pozpátku k~začátku,
+čili nějakého suffixu $\alpha$ a nějakého suffixu $\alpha^R$. Tyto suffixy ovšem odpovídají
+listům sestrojeného ST a jejich nejdelší společný prefix je nejbližším společným předchůdcem
+ve~stromu, takže stačí pro strom vybudovat datovou strukturu pro společné předchůdce
+a s~její pomocí dokážeme jeden střed prozkoumat v~konstantním čase.
+
+\:{\I Burrows-Wheelerova Transformace} \cite{burrows:bwt} -- jejím základem je lexikografické setřídění všech
+rotací slova~$\sigma$, což zvládneme sestrojením ST pro slovo~$\sigma\sigma$, jeho
+uříznutím v~písmenkové hloubce~$\vert\sigma\vert$ a vypsáním nově vzniklých listů v~pořadí
  \uv{zleva doprava}.
  \endlist
  
-\s{Cvièení:} Zkuste vymyslet co nejlep¹í algoritmy pro tyto problémy bez pou¾ití~ST.
+\s{Cvičení:} Zkuste vymyslet co nejlepší algoritmy pro tyto problémy bez použití~ST.
  
-\h{Suffix Array}
+\h{Suffixová pole}
  
-\>V~nìkterých pøípadech se hodí místo suffixového stromu pou¾ívat kompaktnìj¹í datové struktury.
+\>V~některých případech se hodí místo suffixového stromu používat kompaktnější datové struktury.
  
-\s{Notace:} Pro slovo $\sigma$ bude $\sigma[i]$ znaèit jeho $i$-tý znak (èíslujeme od~jednièky),
-$\sigma[i:j]$ pak podslovo slo¾ené z~$i$-tého a¾ $j$-tého znaku. Libovolnou z~mezí mù¾eme vynechat, proto
-$\sigma[i:{}]$ bude suffix od~$i$ do~konce a $\sigma[{}:j]$ prefix od~zaèátku do~$j$.
-Pokud $j<i$, definujeme $\sigma[i:j]$ jako prázdné slovo, tak¾e prázdný suffix mù¾eme
-napøíklad zapsat jako $\sigma[\vert\sigma\vert+1:{}].$
+\s{Notace:} Pro slovo $\sigma$ bude $\sigma[i]$ značit jeho $i$-tý znak (číslujeme od~nuly),
+$\sigma[i:j]$ pak podslovo $\sigma[i]\sigma[i+1]\ldots\sigma[j-1]$. Libovolnou z~mezÃ mÅ¯Å¾eme vynechat, proto
+$\sigma[i:{}]$ bude suffix od~$i$ do~konce a $\sigma[{}:j]$ prefix od~začátku do~$j-1$.
+Pokud $j\le i$, definujeme $\sigma[i:j]$ jako prÃ¡zdnÃ© slovo, takÅ¾e prÃ¡zdnÃ½ suffix mÅ¯Å¾eme
+například zapsat jako $\sigma[\vert\sigma\vert:{}].$
  
-${\rm LCP}(\alpha,\beta)$ bude znaèit délku nejdel¹ího spoleèného prefixu slov $\alpha$ a $\beta$,
-èili nejvìt¹í $i\le \vert\alpha\vert,\vert\beta\vert$ takové, ¾e $\alpha[{}:i]=\beta[{}:i]$.
+${\rm LCP}(\alpha,\beta)$ bude značit délku nejdelšího společného prefixu slov $\alpha$ a $\beta$,
+Ä\8dili nejvÄ\9btÅ¡Ã $i\le \vert\alpha\vert,\vert\beta\vert$ takovÃ©, Å¾e $\alpha[{}:i]=\beta[{}:i]$.
  
-\s{Definice:} {\I Suffix Array} $A_\sigma$ pro slovo $\sigma$ délky~$n$ je posloupnost v¹ech suffixù
-slova~$\sigma$ v~lexikografickém poøadí. Mù¾eme ho reprezentovat napøíklad jako permutaci $A$ èísel
-$1,\ldots,n+1$, pro ní¾ $\sigma[A[1]:{}] < \sigma[A[2]:{}] < \ldots < \sigma[A[n+1]:]$.
+\s{Definice:} {\I Suffixové pole (Suffix Array)} $A_\sigma$ pro slovo $\sigma$ délky~$n$ je posloupnost všech suffixů
+slova~$\sigma$ v~lexikografickém pořadí. Můžeme ho reprezentovat například jako permutaci $A$ čísel
+$0,\ldots,n$, pro níž $\sigma[A[0]:{}] < \sigma[A[1]:{}] < \ldots < \sigma[A[n]:{}]$.
  
-\s{Definice:} {\I Longest Common Prefix Array} $L_\sigma$ pro slovo $\sigma$ je posloupnost,
-v~ní¾ $L_\sigma[i]:={\rm LCP}(A_\sigma[i],A_\sigma[i+1])$.
+\s{Definice:} {\I Pole nejdelších společných prefixů (Longest Common Prefix Array)} $L_\sigma$ pro slovo $\sigma$ je posloupnost,
+v~nÃÅ¾ $L_\sigma[i]:={\rm LCP}(A_\sigma[i],A_\sigma[i+1])$.
  
-\s{Vìta:} Suffixový strom pro slovo $\sigma\$$ je lineárnì ekvivalentní s~dvojicí $(A_\sigma,L_\sigma)$.
-[Jinými slovy, kdy¾ máme jedno, mù¾eme z~toho v~lineárním èase spoèítat druhé, a naopak.]
+\s{Věta:} Suffixový strom pro slovo $\sigma\$$ a dvojici $(A_\sigma,L_\sigma)$ na sebe lze
+v~lineárním čase převádět.
  
-\proof Kdy¾ projdeme ST($\sigma\$$) do hloubky, poøadí listù odpovídá $A_\sigma$ a písmenkové hloubky vnitøních
-vrcholù v~inorderu odpovídají $L_\sigma$. Naopak ST($\sigma$) získáme tak, ¾e sestrojíme kartézský strom
-pro~$L_\sigma$ (získáme vnitøní vrcholy ST), doplníme do~nìj listy, pøiøadíme jim suffixy podle~$A_\sigma$
-a nakonec podle listù rekonstruujeme nálepky hran.
+\proof Když projdeme ST($\sigma\$$) do hloubky, pořadí listů odpovídá posloupnosti $A_\sigma$ a písmenkové hloubky vnitřních
+vrcholů v~inorderu odpovídají $L_\sigma$. Naopak ST($\sigma\$$) získáme tak, že sestrojíme kartézský strom
+pro~$L_\sigma$ (získáme vnitřní vrcholy ST), doplníme do~něj listy, přiřadíme jim suffixy podle~$A_\sigma$
+a nakonec podle listů rekonstruujeme nálepky hran.
  \qed
  
-\h{Rekurzivní konstrukce}
+\h{Rekurzivní konstrukce}
  
-\>Tento algoritmus konstruuje pro slovo $\sigma$ délky~$n$ jeho suffix array a LCP array v~èase $\O(n+{\rm Sort}(n,\Sigma))$,
-kde ${\rm Sort}(\ldots)$ je èas potøebný pro setøídìní $n$ symbolù z~abecedy~$\Sigma$. V~kombinaci s~pøedchozími
-výsledky nám tedy dává lineární konstrukci ST($\sigma$) pro libovolnou fixní abecedu.
+\>Ukážeme algoritmus, který pro slovo $\sigma\in\Sigma^*$ délky~$n$ sestrojí jeho suffixové pole
+a LCP pole v~čase $\O(n+{\rm Sort}(n,\Sigma))$, kde ${\rm Sort}(\ldots)$ je čas potřebný pro setřídění
+$n$~symbolů z~abecedy~$\Sigma$. V~kombinaci s~předchozími výsledky tedy dostaneme lineární konstrukci
+ST($\sigma$) pro libovolnou fixní abecedu.
  
-\s{Algoritmus:} (Konstrukce $A$ a $L$ podle Kärkkäinena a Sanderse \cite{karkkainen03simple})
+\s{Algoritmus:} (Konstrukce $A$ a $L$ podle Kärkkäinena a Sanderse \cite{karkkainen03simple})
  
  \algo
-\:Redukujeme abecedu na~$1\ldots n$: ve~vstupním slovu je nejvý¹e $n$ rùzných znakù,
-tak¾e je staèí setøídit a pøeèíslovat.
+\:Redukujeme abecedu na~$1\ldots n$: ve~vstupním slovu je nejvýše $n$ různých znaků,
+takže je stačí setřídit a přečíslovat.
  
-\:Definujeme slova $\sigma_0$, $\sigma_1$, $\sigma_2$ následovnì:
+\:Definujeme slova $\sigma_0$, $\sigma_1$, $\sigma_2$ následovně:
  $$\eqalign{
  \sigma_0[i] &:= \left<\sigma[3i],\sigma[3i+1],\sigma[3i+2]\right>\cr
  \sigma_1[i] &:= \left<\sigma[3i+1],\sigma[3i+2],\sigma[3i+3]\right>\cr
  \sigma_2[i] &:= \left<\sigma[3i+2],\sigma[3i+3],\sigma[3i+4]\right>\cr
  }$$
-V¹echna $\sigma_k$ jsou slova délky $\approx n/3$ nad~abecedou velikosti $n^3$. Dovolíme
-si mírnì zneu¾ívat notaci a pou¾ívat symbol $\sigma_k$ i jejich pøepis do~abecedy pùvodní.
+Všechna $\sigma_k$ jsou slova délky $\approx n/3$ nad~abecedou velikosti $n^3$. Dovolíme
+si mírně zneužívat notaci a používat symbol $\sigma_k$ i jejich přepis do~abecedy původní.
  
-\:Zavoláme algoritmus rekurzivnì na slovo $\sigma_0\sigma_1$, èím¾ získáme $A_{01}$ a $L_{01}$.
+\:Zavoláme algoritmus rekurzivně na slovo $\sigma_0\sigma_1$, čímž získáme $A_{01}$ a $L_{01}$.
+(Suffixy slova $\sigma_0\sigma_1$ odpovídají suffixům slov $\sigma_0$ a~$\sigma_1$.)
  
-\:Z~$A_{01}$ a $L_{01}$ vydìlíme $A_0=A_{\sigma_0}$, $A_1$, $L_0$ a $L_1$. Také si pro ka¾dý prvek
-$A_i$ zapamatujeme, kde se v~$A_{01}$ vyskytoval.
+\:Spočítáme pole $P_0$ a $P_1$, která nám budou říkat, kde se v~$A_{01}$ vyskytuje
+který suffix slov $\sigma_0$ a~$\sigma_1$. Tedy $A_{01}[P_0[i]]=i$, $A_{01}[P_1[i]] = i+\vert\sigma_0\vert$.
+Jinými slovy, $P_0$ a~$P_1$ budou části inverzní permutace k~$A_{01}$. Všimněte si,
+že platí $P_i[x] < P_j[y]$ právě tehdy, když $\sigma_i[x:{}] < \sigma_j[y:{}]$, takže
+suffixy slov $\sigma_0$ a~$\sigma_1$ od této chvíle umíme porovnávat v~čase~$\O(1)$.
  
-\:Dopoèítáme $A_2$: Jeliko¾ $\sigma_2[i:{}] = \sigma[3i+2:{}] = \sigma[3i+2]\sigma[3i+3:\nobreak{}\nobreak] = \sigma[3i+2]\sigma_0[i+1:{}]$
-a v¹echna $\sigma_0[i:{}]$ u¾ máme setøídìná, mù¾eme v¹echna $\sigma_2[i:{}]$ setøídit dvìma prùchody pøihrádkového tøídìní.
+\:Vytvoříme~$A_2$ (suffixové pole pro~$\sigma_2$): Jelikož $\sigma_2[i:{}] = \sigma[3i+2:{}] = \sigma[3i+2]\sigma[3i+3:\nobreak{}\nobreak] = \sigma[3i+2]\sigma_0[i+1:{}]$,
+odpovídá lexikografické pořadí suffixů $\sigma_2[i:{}]$ pořadí dvojic $(\sigma[3i+2],P_0[i+1])$.
+Tyto dvojice ovšem můžeme setřídit dvěma průchody přihrádkového třídění.
  
-\:Dopoèítáme $L_2$: Stejným trikem jako $A_2$ -- pokud jsou první písmena rùzná, je spoleèný prefix prázdný, jinak
-má délku $1+{\rm LCP}(\sigma_0[i+1:{}],\sigma_0[j+1:{}]) = 1+\min_{i+1\le k< j+1} L_0[k]$. Minimum zvládneme pro ka¾dou
-dvojici $i,j$ spoèítat v~konstantním èase pomocí datové struktury pro intervalová minima.
-
-\:$A_0,A_1,A_2\buildrel merge\over\longrightarrow A$ -- sléváme tøi setøídìné posloupnosti,
-tak¾e staèí umìt prvky libovolných dvou posloupností v~konstantním èase porovnat:
+\:Slijeme $A_{01}$ a~$A_2$ do~$A$: sléváme dvě setříděné posloupnosti,
+takže stačí umět jejich prvky v~konstantním čase porovnat:
  $$\eqalign{
-\sigma_0[i:{}] < \sigma_1[j:{}] &~\hbox{podle zapamatovaných pozic v~$A_{01}$} \cr
-\sigma_0[i:{}] < \sigma_2[k:{}] &\equiv \sigma[3i]\,\sigma_1[i:{}] < \sigma[3k+2]\,\sigma_0[k+1:{}]\cr
-&\Leftrightarrow (\sigma[3i] < \sigma[3k+2]) \vee {} \cr&\hphantom{{}\Leftrightarrow{}} (\sigma[3i] = \sigma[3k+2] \wedge \sigma_1[i:{}] < \sigma_0[k+1:{}])\cr
-\sigma_1[j:{}]<\sigma_2[k:{}] &\equiv \sigma[3j+1]\,\sigma[3j+2]\,\sigma_0[j+1:{}] < \cr&\hphantom{{}\equiv{}} \sigma[3k+2]\,\sigma[3k+3]\,\sigma_1[k+1:{}]
+\sigma_0[i:{}] < \sigma_2[j:{}] \Leftrightarrow{} &\sigma[3i:{}] < \sigma[3j+2:{}] \cr
+                                \Leftrightarrow{} &\sigma[3i]\,\sigma_1[i:{}] < \sigma[3j+2]\,\sigma_0[j+1:{}],\cr
+\sigma_1[i:{}] < \sigma_2[j:{}] \Leftrightarrow{} &\sigma[3i+1:{}] < \sigma[3j+2:{}] \cr
+                                \Leftrightarrow{} &\sigma[3i+1]\,\sigma[3i+2]\,\sigma_0[i+1:{}] < \cr
+                                                  &\sigma[3j+2]\,\sigma[3j+3]\,\sigma_1[j+1:{}].\cr
  }$$
-
-\:Dopoèítáme $L$ -- pokud sousedí suffix ze~$\sigma_{0,1}$ se suffixem ze~$\sigma_{0,1}$,
-vyèteme výsledek pøímo z~$L_{01}$. Pokud sousedí $\sigma_2$ se $\sigma_2$, staèí pou¾ít
-u¾ spoèítané $L_2$. Pokud sousedí $\sigma_{0,1}$ se $\sigma_2$, odebereme první jeden
-nebo dva znaky, ty porovnáme samostatnì a v~pøípadì shody zbude suffix ze~$\sigma_0$
-a suffix ze~$\sigma_1$ (stejnì jako pøi slévání) a pro ty doká¾eme $L$ dopoèítat
-pomocí struktury pro intervalová minima v~$L_{01}$.
+Pokaždé tedy porovnáme nejvýše dvě dvojice znaků a pak dvojici suffixů slov $\sigma_0$ a $\sigma_1$,
+k~čemuž nám pomohou pole $P_0$ a~$P_1$.
+
+\:Dopočítáme $L$:
+   \::Pokud v~$A$ sousedí suffix slova~$\sigma_{0,1}$ se suffixem slova~$\sigma_{0,1}$,
+      sousedí tyto dva suffixy i v~$A_{01}$, takže jejich LCP najdeme přímo v~$L$.
+   \::Setkají-li se dva suffixy slova~$\sigma_2$, všimneme si, že
+      $\sigma_2[i:{}] = \sigma[3i+2:\nobreak{}] = \sigma[3i+2]\,\sigma_0[i+1:{}]$.
+      ${\rm LCP}(\sigma_2[i:{}],\sigma_2[j:{}])$ je tedy buďto~0 (pokud $\sigma[3i+2]\ne\sigma[3j+2]$),
+      nebo $1+3\cdot{\rm LCP}(\sigma_0[i+1:{}],\sigma_0[j+1:{}])$, případně totéž zvýšené
+      o~1 nebo~2, pokud se trojznaky v~$\sigma_0$ následující po LCP zčásti shodují.
+      Přitom ${\rm LCP}(\sigma_0[p:{}],\sigma_0[q:{}])$ spočítáme pomocí~$L$.
+      Je to totiž minimum intervalu v~$L$ mezi indexy $P_0[p]$ a~$P_0[q]$. To zjistíme
+      v~konstantním čase pomocí struktury pro intervalová minima.
+   \::Pokud se setká suffix slova~$\sigma_{0,1}$ se suffixem slova~$\sigma_2$, stačí
+      tyto suffixy přepsat podobně jako v~6.~kroku a problém tím opět převést
+      na výpočet LCP dvou suffixů slov~$\sigma_{0,1}$.
  
  \endalgo
  
-\s{Analýza èasové slo¾itosti:} Tøídìní v~prvním volání trvá ${\rm Sort}(n,\Sigma)$, ve~v¹ech
-ostatních voláních je lineární (trojice èísel velikosti $\O(n)$ mù¾eme tøídit tøíprùchodovým
-pøihrádkovým tøídìním s~$\O(n)$ pøihrádkami). Z~toho dostáváme:
+\s{Analýza časové složitosti:} Třídění napoprvé trvá ${\rm Sort}(n,\Sigma)$, ve~všech
+rekurzivních voláních už je lineární (trojice čísel velikosti $\O(n)$ můžeme třídit tříprůchodovým
+přihrádkovým tříděním s~$\O(n)$ přihrádkami). Z~toho dostáváme:
  $$T(n) = T(2/3\cdot n) + \O(n),~\hbox{a tedy}~T(n)=\O(n).$$
  \qed
  
-\h{Ukkonenova inkrementální konstrukce}
+\h{Ukkonenova inkrementální konstrukce}
  
-\>Ukkonenùv algoritmus \cite{ukkonen95line} konstruuje suffixový strom bez dolarù inkrementálnì: zaène se stromem
-pro prázdné slovo (ten má jediný vrchol, a to koøen) a postupnì pøidává dal¹í znaky na~konec
-slova. To zvládne v~èase $\O(1)$ amortizovanì na~pøidání jednoho znaku.
-Pro slovo~$\sigma$ tedy doká¾e sestrojit ST v~èase $\O(\vert\sigma\vert)$.
+\>Ukkonen popsal algoritmus \cite{ukkonen95line} pro konstrukci suffixového stromu bez dolarů,
+pracující inkrementálně: Začne se stromem pro prázdné slovo a postupně na konec slova přidává
+další znaky a přepočítává strom. Každý znak přitom přidá v~amortizovaně konstantním čase.
+Pro slovo~$\sigma$ tedy dokáže sestrojit ST v~čase $\O(\vert\sigma\vert)$.
  
-Budeme pøedpokládat, ¾e hrany vedoucí z~jednoho vrcholu je mo¾né indexovat jejich
-prvními písmeny -- to bezpeènì platí, pokud je abeceda pevná; není-li, mù¾eme
-si pomoci hashováním.
+Budeme předpokládat, že hrany vedoucí z~jednoho vrcholu je možné indexovat jejich
+prvnÃmi pÃsmeny -- to bezpeÄ\8dnÄ\9b platÃ, pokud je abeceda pevnÃ¡; nenÃ-li, mÅ¯Å¾eme
+si pomoci hešováním.
  
-\s{Pozorování:} Kdy¾ slovo~$\sigma$ roz¹íøíme na~$\sigma a$, ST se zmìní následovnì:
+\s{Pozorování:} Když slovo~$\sigma$ rozšíříme na~$\sigma a$, ST se změní následovně:
  
  \numlist\ndotted
-\:Pokud $\beta$ byl nevnoøený suffix slova~$\sigma$, je i $\beta a$ nevnoøený suffix~$\sigma a$. Z~toho víme, ¾e listy
-zùstanou listy, pouze jim potøebujeme prodlou¾it nálepky. Pomù¾eme si snadno: zavedeme
-{\I otevøené hrany,} jejich¾ nálepka je \uv{od~pozice~$i$ do konce}. Listy se tak
-o~sebe postarají samy.
-\:Pokud $\beta$ bylo vìtvící slovo, zùstane nadále vìtvící -- tedy vnitøní vrcholy ve~stromu zùstanou.
-\:Pokud $\beta$ byl vnoøený suffix (tj. vnitøní èi skrytý vrchol), pak se $\beta a$ buïto
-vyskytuje v~$\sigma$, a tím pádem je to vnoøený suffix nového slova a strom není nutné
-upravovat, nebo se v~$\sigma$ nevyskytuje a tehdy pro nìj musíme zalo¾it novou odboèku
-a nový list s~otevøenou hranou.
+\:Všechny stávající vrcholy stromu (včetně skrytých) odpovídají podslovům slova~$\sigma$.
+  Ta jsou i podslovy $\sigma a$, takže se budou nacházet i v~novém stromu.
+\:Pokud $\beta$ bylo větvící slovo, zůstane nadále větvící -- tedy vnitřní vrcholy ve~stromu zůstanou.
+\:Každý nový suffix~$\beta a$ vznikne prodloužením nějakého původního suffixu~$\beta$. Přitom:
+  \itemize\ibull
+  \:Pokud byl~$\beta$ nevnořený suffix (čili byl reprezentovaný listem), ani $\beta a$
+    nebude vnořený. Z~toho víme, že listy zůstanou listy, pouze jim potřebujeme prodloužit
+    nálepky. Aby to netrvalo příliš dlouho, zavedeme {\I otevřené hrany,} jejichž nálepka
+    říká \uv{od~pozice~$i$ do konce}. Listy se tak o~sebe postarají samy.
+  \:Pokud $\beta$ byl vnořený suffix (tj. vnitřní či skrytý vrchol):
+    \itemize\ibull
+      \:Buď se $\beta a$ vyskytuje v~$\sigma$, a tím pádem je to vnořený suffix nového slova
+        a strom není nutné upravovat;
+      \:nebo se $\beta a$ v~$\sigma$ nevyskytuje -- tehdy pro něj musíme založit nový list
+        s~otevřenou hranou a případně i nový vnitřní vrchol, pod nímž bude tento list připojen.
+    \endlist
+  \endlist
  \endlist
  
-Víme tedy, co v¹echno musí algoritmus ve~stromu pøí roz¹íøení slova upravit, zbývá
-vyøe¹it, jak to udìlat efektivnì. K~tomu se hodí pár definic a lemmat:
-
-\s{Definice:} {\I Aktivní suffix} $\alpha(\sigma)$ øíkáme nejdel¹ímu vnoøenému suffixu slova~$\sigma$.
-
-\s{Lemma:} Suffix $\beta$ slova $\sigma$ je vnoøený $\Leftrightarrow$ $\vert\beta\vert \le \vert\alpha(\sigma)\vert.$
+Víme tedy, co všechno je při rozšíření slova potřeba ve~stromu upravit.
+Zbývá vyřešit, jak to udělat efektivně.
  
-\proof Ka¾dý suffix vnoøeného suffixu je opìt vnoøený. \qed
+\s{Vnořené suffixy:}
+Především potřebujeme umět rozpoznat, které suffixy jsou vnořené a které nikoliv.
+K~tomu se hodí všimnout si, že vnořené suffixy tvoří souvislý úsek:
  
-\s{Lemma:} Pro ka¾dé $\sigma$, $a$ platí: $\alpha(\sigma a)$ je suffixem $\alpha(\sigma)a.$
+{\narrower
+\s{Lemma:} Je-li $\alpha$ vnořený suffix slova~$\sigma$ a $\beta$ je suffix slova~$\alpha$,
+pak $\beta$ je v~$\sigma$ také vnořený.
  
-\proof $\alpha(\sigma a)$ i $\alpha(\sigma)a$ jsou suffixy slova $\sigma a$, a~proto staèí porovnat jejich délky.
-Slovo $\beta := \hbox{\uv{$\alpha(\sigma a)$ bez koncového~$a$}}$ je vnoøeným suffixem v~$\sigma$, tak¾e
-$\vert\beta\vert \le \vert\alpha(\sigma)\vert$, a~tedy také $\vert\alpha(\sigma a)\vert = \vert\beta a\vert \le \vert\alpha(\sigma)a\vert$.
+\proof
+Ve~slově sigma se vyskytuje $\alpha x$ a $\alpha y$ pro nějaké dva různé znaky $x$ a~$y$.
+Každý z~těchto výskytů přitom končí výskytem slova~$\beta$, jednou následovaným~$x$,
+podruhé~$y$.
  \qed
  
-\s{Definice:} Suffix $\beta a$ je {\I zralý} $\equiv$ $\beta$ je vnoøený suffix~$\sigma$, ale $\beta a$ není podslovem~$\sigma$
-(tedy musíme pro~nìj pøi pøidávání znaku~$a$ k~aktuálnímu slovu~$\sigma$ zakládat nový vrchol).
-
-\s{Lemma:} Suffix $\beta$ je zralý $\Leftrightarrow$ $\vert\alpha(\sigma)a\vert \ge \vert\beta a\vert > \vert\alpha(\sigma a)\vert$.
+}
  
-\proof Jeliko¾ $\beta$ je vnoøeným suffixem $\sigma$, musí platit první nerovnost. Aby byl zralý,
-musí také nebýt vnoøeným suffixem $\sigma a$, a~tomu odpovídá druhá nerovnost.
-\qed
+\>Stačí si tedy zapamatovat nejdelší vnořený suffix slova~$\sigma$. Tomu budeme říkat
+{\I aktivní suffix} a budeme ho značit $\alpha(\sigma)$. Libovolný suffix~$\beta\subseteq\sigma$
+pak bude vnořený právě tehdy, když $\vert\beta\vert \le \vert\alpha(\sigma)\vert$.
  
-\s{Idea algoritmu:} Udr¾ujeme si $\alpha=\alpha(\sigma)$ a pøi pøidání znaku $a$ zkontrolujeme, zda $\alpha a$ je
-stále vnoøený suffix. Pokud ano, nic se nemìní, pokud ne, pøidáme vnitøní vrchol, $\alpha$ zkrátíme
-zleva o~znak a testujeme dál.
+Aktivní suffix tedy tvoří hranici mezi nevnořenými a vnořenými suffixy. Jak se tato
+hranice posune, když slovo~$\sigma$ rozšíříme? Na to je odpověď snadná:
  
-\s{Analýza:} Úprav stromu provedeme $\O(1)$ amortizovanì (ka¾dá úprava slovo $\alpha$ zkrátí,
-ka¾dé pøidání znaku ho~prodlou¾í o~znak, tak¾e v¹ech zkrácení je $\O(\vert\sigma\vert)$). Staèí
-tedy ukázat, jak provést úpravu v~(amortizovanì) konstantním èase, k~èemu¾ potøebujeme
-$\alpha$ reprezentovat ¹ikovnì a také si udr¾ovat pomocné informace (zpìtné hrany),
-abychom umìli rychle zkracovat.
+{\narrower
+\s{Lemma:} Pro každé $\sigma$, $a$ platí: $\alpha(\sigma a)$ je suffixem $\alpha(\sigma)a.$
  
-\s{Definice:} {\I Referenèní pár} je dvojice $(\pi,\tau)$, v~ní¾ $\pi$ je vrchol
-stromu a $\tau$ libovolné slovo. Tento pár popisuje slovo $\pi\tau$. Referenèní
-pár je {\I kanonický,} pokud neexistuje hrana vedoucí z~vrcholu $\pi$ s~nálepkou,
-která by byla prefixem slova~$\tau$.
+\proof
+$\alpha(\sigma a)$ i $\alpha(\sigma)a$ jsou suffixy slova $\sigma a$, a~proto stačí porovnat jejich délky.
+Slovo $\beta := \hbox{\uv{$\alpha(\sigma a)$ bez koncového~$a$}}$ je vnořeným suffixem v~$\sigma$, takže
+$\vert\beta\vert \le \vert\alpha(\sigma)\vert$, a~tedy také $\vert\alpha(\sigma a)\vert = \vert\beta a\vert \le \vert\alpha(\sigma)a\vert$.
+\qed
  
-\s{Pozorování:} Ke~ka¾dému slovu existuje právì jeden kanonický referenèní pár,
-který ho popisuje. V¹imnìte si, ¾e je to ze~v¹ech referenèních párù pro toto slovo
-ten s~nejdel¹ím~$\pi$ (nejhlub¹ím vrcholem).
+}
  
-\s{Definice:} Zpìtná hrana $\<back>[\pi]$ vede z~vrcholu $\pi$ do~vrcholu,
-který je ze~v¹ech vrcholù nejdel¹ím vlastním suffixem slova~$\pi$.
+\>Hranice se tedy může posouvat pouze doprava, případně zůstat na místě.
+Toho lze snadno využít.
+
+\s{Idea algoritmu:} Udržujeme si $\alpha=\alpha(\sigma)$ a při přidání znaku $a$ zkontrolujeme,
+zda $\alpha a$ je stále vnořený suffix. Pokud ano, nic se nemění, pokud ne, přidáme nový list
+a případně také vnitřní vrchol, $\alpha$ zkrátíme zleva o~znak a testujeme dál.
+
+\s{Analýza:} Po~přidání jednoho znaku na konec slova~$\sigma$ provedeme amortizovaně
+konstantní počet úprav stromu (každá úprava slovo $\alpha$ zkrátí, po všech úpravách
+přidáme k~$\alpha$ jediný znak). Tudíž stačí ukázat, jak provést každou úpravu
+v~(amortizovaně) konstantním čase. K~tomu potřebujeme šikovnou reprezentaci slova~$\alpha$,
+která bude umět efektivně prodlužovat zprava, zkracovat zleva a testovat existenci
+vrcholu ve~stromu.
+
+\s{Definice:} {\I Referenční pár} pro slovo $\alpha\subseteq\sigma$ je dvojice
+$(\pi,\tau)$, v~níž $\pi$ je vrchol stromu, $\tau$ libovolné slovo a $\pi\tau=\alpha$.
+Navíc víme, že $\tau\subseteq\sigma$, takže si~$\tau$ stačí pamatovat jako dvojici
+indexů ve~slově~$\sigma$.
+
+Referenční pár je {\I kanonický,} pokud neexistuje hrana vedoucí z~vrcholu~$\pi$ s~nálepkou,
+která by byla prefixem slova~$\tau$. (Všimněte si, že taková hrana se pozná podle toho,
+že první znak nálepky se shoduje s~prvním znakem slova~$\tau$ a nálepka není delší než
+slovo~$\tau$. Shodu ostatních znaků není nutné kontrolovat.)
+
+\s{Pozorování:} Ke~každému slovu $\alpha\subseteq\sigma$ existuje právě jeden kanonický
+referenční pár, který ho popisuje. To je ze~všech referenčních párů pro toto slovo
+ten s~nejdelším~$\pi$ (nejhlubším vrcholem).
+
+\s{Definice:} Zpětná hrana $\<back>(\pi)$ vede z~vrcholu $\pi$ do~vrcholu,
+který je zkrácením slova~$\pi$ o~jeden znak zleva. (Nahlédneme, že takový
+vrchol musí existovat: pokud je $\pi$ vnitřní vrchol, pak je slovo~$\pi$
+větvící, takže každý jeho suffix musí také být větvící, a~tím pádem musí
+odpovídat nějakého vrcholu.)
+
+\s{Operace s~referenčními páry:}
+S~referenčním párem $(\pi,\tau)$ popisujícím slovo~$\alpha$ potřebujeme provádět
+následujicí operace:
+
+\itemize\ibull
+\:{\I Přidání znaku~$a$ na konec:} Připíšeme~$a$ na konec slova~$\tau$.
+  To je jistě referenční pár pro $\alpha a$, ale nemusí být kanonický.
+  Přitom můžeme snadno ověřit, zda se $\alpha a$ ve~stromu nachází,
+  a případně operaci odmítnout.
+\:{\I Odebrání znaku ze~začátku:} Pokud $\pi$ není kořen stromu, položíme
+  $\pi\leftarrow\<back>(\pi)$ a zachováme~$\tau$. Pokud naopak je~$\pi$
+  prázdný řetězec, odebereme z~$\tau$ jeho první znak (to lze udělat
+  v~konstantním čase, protože~$\tau$ je reprezentované dvojicí indexů do~$\sigma$).
+\:{\I Převedení na kanonický tvar:} Obě předchozí operace mohou vytvořit referenční
+  pár, který není kanonický. Pokaždé proto kanonicitu zkontrolujeme a případně
+  pár upravíme. Ověříme, zda hrana z~$\pi$ indexovaná písmenem~$a$ není
+  dost krátká na to, aby byla prefixem slova~$\tau$. Pokud je, tak se
+  po~této hraně přesuneme dolů, čímž~$\pi$ prodloužíme a~$\tau$ zkrátíme,
+  a proces opakujeme. Jelikož tím pokaždé $\tau$~zkrátíme a kdykoliv jindy
+  se $\tau$ prodlouží nejvýše o~1, mají všechny převody na kanonický tvar
+  amortizovaně konstantní složitost.
+\endlist
  
-\s{Pozorování:} Zpìtné hrany jsme sice zavedli stejnì obecnì, jako se to dìlá
-pøi konstrukci vyhledávacích automatù podle Aha a McCorasickové, ale v~na¹em
-pøípadì se \<back> pro vnitøní vrcholy chová daleko jednodu¹eji (a~na ¾ádné
-jiné ho potøebovat nebudeme): pokud je $\pi$ vnitøní vrchol, musí to být
-vìtvící podslovo, a~tím pádem ka¾dé jeho zkrácení zleva musí být také vìtvící
-podslovo. Tedy $\<back>(\pi)$ dá~$\pi$ bez prvního znaku, a~to se nám
-bude hodit pøi zkracování suffixù.
+\>Nyní již můžeme doplnit detaily, získat celý algoritmus a nahlédnout,
+že pracuje v~amortizovaně konstantním čase.
  
-\s{Algoritmus podrobnìji:} (Doplnili jsme detaily do~pøedchozího algoritmu.)
+\s{Algoritmus podrobněji:}
  
  \algo
-\:Vstup: $\alpha=\alpha(\sigma)$ reprezentovaný jako kanonický referenèní pár $(\pi,\tau)$, $T$ suffixový strom pro~$\sigma$ a jeho funkce \<back>, nový znak~$a$.
-\:Zjistíme, jestli $\alpha a$ je pøítomen ve~stromu, a pøípadnì ho zalo¾íme:
-\::Pokud $\tau=\varepsilon$: ($\alpha=\pi$ je vnitøní vrchol)
-\:::Vede-li z~vrcholu $\pi$ hrana s~nálepkou zaèínající znakem $a$, pak je pøítomen.
-\:::Nevede-li, není pøítomen, a~tak pøidáme novou otevøenou hranu vedoucí z~$\pi$ do~nového listu.
-\::Pokud $\tau\ne\varepsilon$: ($\alpha$ je skrytý vrchol)
-\:::Najdeme hranu, po~ní¾ z~$\pi$ pokraèuje slovo $\tau$ (která to je, poznáme podle prvního znaku slova~$\tau$).
-\:::Pokud v~popisce této hrany po~$\tau$ následuje znak~$a$, pak je $\alpha a$ pøítomen.
-\:::Pokud nenásleduje, tak nebyl pøítomen, èili tuto hranu rozdìlíme: pøidáme na~ni nový vnitøní vrchol,
-    do~nìj¾ povede hrana s~popiskou~$\tau$ a z~nìj zbytek pùvodní hrany a otevøená hrana do~nového listu.
-\:Pokud $\alpha a$ byl pøítomen, tak $\alpha$ zkrátíme a test opakujeme:
-\::Je-li $\pi\ne\varepsilon$, nastavíme $\pi := \<back>(\pi)$. V~opaèném pøípadì (jsme v~koøeni) zkrátíme $\tau$ o~znak zleva.
-\::Pár $(\pi,\tau)$ u¾ popisuje zkrácené slovo, ale nemusí být kanonický, tak¾e to je¹tì napravíme:
-\:::Dokud existuje hrana vedoucí z~$\pi$, její¾ popiska je prefixem slova $\tau$, tak se
-    po~této hranì posuneme, èili prodlou¾íme $\pi$ o~tuto popisku a zkrátíme o~ni~$\tau$.
-\::Zpìt na~krok 2.
-\:Pokud $\alpha a$ u¾ je pøítomen, zbývá pøidat $a$ k~$\alpha$ a zastavit se:
-\::$\tau := \tau a$.
-\::Kanonikalizace stejnì jako v~bodech 12--13.\foot{Dokonce jednodu¹¹í, proto¾e projdeme nejvý¹e jednu hranu.}
-\:Dopoèítáme zpìtné hrany (viz ní¾e).
-\:Výstup: $\alpha=\alpha(\sigma a)$ coby kanonický referenèní pár $(\pi,\tau)$, $T$ suffixový strom pro~$\sigma a$
-  a jeho funkce \<back>.
+\:{\I Vstup:} $\alpha=\alpha(\sigma)$ reprezentovaný jako kanonický referenční pár $(\pi,\tau)$, $T$ suffixový strom pro~$\sigma$ spolu s~hranami \<back>, nový znak~$a$.
+\:Zjistíme, jestli $\alpha a$ je přítomen ve~stromu, a případně ho založíme:
+\::Pokud $\tau=\varepsilon$: ($\alpha=\pi$ je vnitřní vrchol)
+\:::Vede-li z~vrcholu $\pi$ hrana s~nálepkou začínající znakem $a$, pak je přítomen.
+\:::Nevede-li, není přítomen, a~tak přidáme novou otevřenou hranu vedoucí z~$\pi$ do~nového listu.
+\::Pokud $\tau\ne\varepsilon$: ($\alpha$ je skrytý vrchol)
+\:::Najdeme hranu, po~níž z~$\pi$ pokračuje slovo $\tau$ (která to je, poznáme podle prvního znaku slova~$\tau$).
+\:::Pokud v~popisce této hrany po~$\tau$ následuje znak~$a$, pak je $\alpha a$ přítomen.
+\:::Pokud nenásleduje, tak nebyl přítomen, čili tuto hranu rozdělíme: přidáme na~ni nový vnitřní vrchol,
+    do~nějž povede hrana s~popiskou~$\tau$ a z~něj zbytek původní hrany a otevřená hrana do~nového listu.
+\:Pokud $\alpha a$ nebyl přítomen, tak $\alpha$ zkrátíme a vrátíme se na~krok~2.
+\:Nyní víme, že $\alpha a$ již byl přítomen, takže upravíme referenční pár, aby popisoval $\alpha a$.
+\:Dopočítáme zpětné hrany (viz níže).
+\:{\I Výstup:} $\alpha=\alpha(\sigma a)$ jako kanonický referenční pár $(\pi,\tau)$, $T$ suffixový strom pro~$\sigma a$
+  a jeho zpětné hrany \<back>.
  \endalgo
  
-\s{Èasová slo¾itost:}
-
-Kanonikalizace pracuje v~amortizovanì konstantním èase, proto¾e ka¾dá její iterace
-zkrátí~$\tau$ a za~ka¾dé spu¹tìní algoritmu se~$\tau$ prodlou¾í jen jednou, a~to o~jeden znak.
-
-Prùchodù hlavním cyklem je, jak u¾ víme, amortizovanì konstantní poèet a ka¾dý prùchod
-zvládneme v~konstantním èase.
-
-Zbývá dodat, jak nastavovat novým vrcholùm jejich \<back>. To potøebujeme
-jen pro vnitøní vrcholy (na~zpìtné hrany z~listù se algoritmus nikdy neodkazuje)
-a v¹imneme si, ¾e pokud jsme zalo¾ili vrchol, odpovídá tento vrchol v¾dy souèasnému~$\alpha$
-a zpìtná hrana z~nìj povede do~zkrácení slova~$\alpha$ o~znak zleva, co¾ je
-pøesnì vrchol, který zalo¾íme (nebo zjistíme, ¾e u¾ existuje) v~pøí¹tí iteraci
-hlavního cyklu. V~dal¹í iteraci urèitì je¹tì nebudeme tuto hranu potøebovat,
-proto¾e $\pi$ v¾dy jen zkracujeme, a~tak mù¾eme vznik zpìtné hrany o~iteraci
-zpozdit a zvládnout to tak také v~èase $\O(1)$.
-
-Celkovì je tedy èasová slo¾itost inkrementálního udr¾ování suffixového
-stromu amortizovanì konstantní.
-\qed
+\s{Zpětné hrany:}
+Zbývá dodat, jak nastavovat novým vrcholům jejich zpětné hrany. To potřebujeme
+jen pro vnitřní vrcholy (na~zpětné hrany z~listů se algoritmus nikdy neodkazuje).
+Všimneme si, že pokud jsme založili vrchol, odpovídá tento vrchol vždy současnému~$\alpha$
+a zpětná hrana z~něj povede do~zkrácení slova~$\alpha$ o~znak zleva, což je
+přesně vrchol, který založíme (nebo zjistíme, že už existuje) v~příští iteraci
+hlavního cyklu. V~další iteraci ještě určitě nebudeme tuto hranu potřebovat,
+protože $\pi$ vždy jen zkracujeme, a~tak můžeme vznik zpětné hrany o~iteraci
+zpozdit. Výroba zpětné hrany tedy bude také trvat jen konstantně dlouho.
  
  \references
  \bye