Pro +ostatní vrcholy platí, ¾e objem kapaliny pøitékající se rovná objemu +kapaliny odtékající. Toto pravidlo, které pochází z teorie o elektrických obvodech, +se zvykne nazývat Kirchhoffùv zákon. Hledání maximálního toku je duální úlohou k hledání +minimálního øezu. Ford-Fulkersonùv(FF) algoritmus, který bude popsán ní¾e je základním +algoritmem pro hledání tokù. Na úlohu hledání maximálního toku se dají pøevést mnohé +grafové problémy a i proto existuje mnoho algoritmù a nìkteré z nich jsou pouze modifikace +základního FF algoritmu. V dal¹í pøedná¹ce najdete Dinitzùv algoritmus pro tenhle problém. + + +\s{Definice:} + +\itemize\ibull +\:sí»: $N=(V,E,s,t,w)$ kde $V$ je mno¾ina vrcholù, $E\subseteq V\times V$, +$s\in V$ je zdroj, $t\in V$ je stok, $w:\, E\rightarrow{R}^{+}$ jsou kapacity hran +\:tok: $f:\, E\rightarrow{R}^{+}$kde $\forall e\in E\, f(e)\leq w(e)$ a +$\forall v\in V,\, v\neq s,\, v\neq t\,\,\sum_{uv\in E}f(uv)=\sum_{vw\in E}f(vw)$ +\:velikost toku: $\|f\|=\sum_{sv\in E}f(sv)-\sum_{vs\in E}f(vs)$ kde $s$ je zdroj +\:øez: $st$-øez je mno¾ina hran $C\subseteq E$ taková, ¾e v grafu $(V,\, E\setminus C)$ neexistuje +cesta z s do t +\:separátor: $st$-separátor je mno¾ina vrcholù $S\subseteq V$ taková, ¾e v grafu +$(V\setminus S,\, E\cap(V\setminus S)\times(V\backslash S))$ neexistuje +cesta z s do t +\:velikost øezu: $\|c\|=\sum_{e\in c}w(e)$ je velikost øezu +\endlist + +\figure{graf.eps}{Pøíklad orientovaného grafu ze zvoleným zdrojem a stokem.}{0.4\hsize} + +\s{Vìta(Ford-Fulkerson) o souvislosti tokù a øezù} +Nech» $N=(V,E,s,t,w)$ je sí», $F$ je mno¾ina pøípustných tokù pro tuto sí» a $C$ je +mno¾ina øezù oddìlující zdroj od stoku. Pak +$$max_{f\in F}|f|=min_{c\in C}\|c\|$$. +Vìta platí pro v¹echny výbìry zdrojù a stokù $\forall s,t\in V, s\neq t$ nech» $st-F$ je mno¾ina +v¹ech tokù ze zdroje $s$ do stoku $t$ a $st-C$ je mno¾ina v¹ech øezù oddìlujících $s$ od $t$. Pak +$$max_{f\in st-F}\|f\|=min_{c\in st-C}\|c\|$$ +pro graf $G=(V,E,w)$. + +\s{Dùkaz vìty:} + +\s{$max_{f}\|f\|\leq min_{c}\|c\|$:} Vìznìme libovolný øez oddìlující zdroj od stoku $c$ a uva¾me +graf $G'=(V,E\setminus c)$, který vznikl odebráním hran nacházejících se v øezu. Buï $S$ mno¾ina +vrcholù dosa¾itelných ze zdroje v $G'$. +Pro libovolnej tok $f$ platí: + +$$\|f\| = \sum_{uv\in E, u\in S, v\notin S}f(uv) - \sum_{uv\in E, u\in S, v\notin S}f(vu)$$ +velikost toku je rovna rozdílu velikostí tokù pøes hrany opou¹tìjící $S$ a pøicházející do $S$. +$$\|f\| = \sum_{u\in V}f(su) - \sum_{u\in V}f(us)$$ +proto¾e se tok zachovává ve v¹ech vrcholech partity $S$ kromì $s$ dostáváme +$$= \sum_{v\in S}(\sum_{u\in V}f(uv)-\sum_{u\in V}f(vu))$$ +$f(uv)$ pro $u,v\in S$ jsme jednou pøièítali a jednou odèítali +$$= \sum_{uv\in E, u\in S, v\notin S}f(uv) - \sum_{uv\in E, u\in S, v\notin S}f(vu)$$ + +Teï si u¾ staèí jenom uvìdomit, ¾e +$$\|f\| = \sum_{uv\in E, u\in S, v\notin S}f(uv)- \sum_{uv\in E, u\in S, v\notin S}f(vu) \leq \sum_{uv\in E, u\in S, v\notin S}f(uv) +\leq \sum_{uv\in E, u\in S, v\notin S}w(uv) \leq \|c\|$$ +Poslední nerovnost je dùsledkem toho, ¾e øez obsahuje v¹echny hrany opou¹tìjící $S$. + +$max_{f}|f|\geq min_{c}|c|$: dùkaz plyne z korektnosti +Ford-Fulkersonova algoritmu viz. algoritmus dále + +\s{Dùsledek:}Pro ka¾dou sí» s celoèíselnými kapacitami je její maximální tok celoèíselný. + +\h{Maximální párování v bipartitním grafu} +Maximální párování v bipartitním grafu $(A\cup B,E)$ se dá najít +pomocí maximálního toku v síti $(A\cup B\cup s\cup t,E',s,t,w)$ kde +$w(e)=1$ a $E'=\{ uv\| u\in A, uv\in E\} \cup \{su\| u\in A\} \cup\{ut\| u\in B\}$ a +obdobnì mù¾eme nalézt minimální vrcholové pokrytí. + +\figure{bip-graf.eps}{Bipartitní graf pro který hledáme maximální párování.}{0.2\hsize} +\figure{bip-tok.eps}{Sí» v které najdeme maximální tok.}{0.3\hsize} + +\s{Definice} +\itemize\ibull +\:neorientovaný graf G je vrcholovì k-souvislý $\Leftrightarrow$ G má alespoò +k+1 vrcholù a neexistuje separátor s ménì ne¾ k vrcholy +\:neorientovaný graf G je hranovì k-souvislý $\Leftrightarrow$ G má alespoò k+1 vrcholù +a neexistuje øez s ménì ne¾ k hranami +\:orientovaný graf je silnì souvislý $\Leftrightarrow$ existuje orientovaná cesta mezi +v¹emi vrcholy v obou smìrech +\:cirkulace je nulový tok t.j. $\forall v\in V, \sum f(uv)=\sum f(vu)$ +\endlist + +\s{Vìta:}(Menger) o souvislosti existencí disjunktních cest a souvislostí +grafù + +buï $G$ neorientovaný graf, pak: +\itemize\ibull +\:$G$ je vrcholovì k-souvislý $\Leftrightarrow$$\forall v,w\in V\,\exists$ +k vrcholovì disjunktních cest z $v$ do $w$ +\:$G$ je hranovì k-souvislý $\Leftrightarrow$$\forall v,w\in V\,\exists$ +k hranovì disjunktních cest z $v$ do $w$ +\:kdy¾ $u$ a $v$ jsou nesousední vrcholy v $G$ pak maximální poèet vrcholovì disjunktních +cest mezi $u$ a $v$ se rovná minimálnímu poètu vrcholù z $G-{u,v}$ kterých odebrání oddìlí +$u$ od $v$ +\:kdy¾ $u$ a $v$ jsou vrcholy v $G$ pak maximální poèet hranovì disjunktních +cest mezi $u$ a $v$ se rovná minimálnímu poètu hran, kterých odebrání oddìlí $u$ od $v$ +\endlist +buï $G$ orientovaný graf, pak: +\itemize\ibull +\:kdy¾ $u$ a $v$ jsou vrcholy $G$, $uv\notin E(G)$ pak maximální poèet vrcholovì disjunktních +cest z $u$ do $v$ je rovný minimálnímu poètu vrcholù z $G-{u,v}$ kterých odebrání oddìlí $u$ od $v$ +\:kdy¾ $u$ a $v$ jsou vrcholy $G$ pak maximální poèet hranovì disjunktních cest z $u$ do $v$ je +rovný minimálnímu poètu hran, kterých odebrání oddìlí $u$ od $v$ +\endlist + +Vrcholová i hranová souvislost grafu se dá zjistit pomocí maximálního +toku. Pro hranovou souvislost pøímo zjistíme maximální tok pro ka¾dou +dvojici vrcholù (volba zdroje a stoku). V pøípadì neorientovaného grafu vyrobíme orientovaný graf tak, ¾e ka¾dou +neorientovanou hranu nahradíme orientovanými v obou smìrech. Pro vrcholovou souvislost +navíc musíme ka¾dý vrchol nahradit dvìma novými a spojit je hranou +v obou smìrech (pod-rozdìlení vrcholu). Kapacity hran volíme 1. +Pro nalezení tìchto cest staèí v¾dy v síti odebírat postupnì cestu +z $s$ do $t$. Odebrání jedné cesty sní¾í tok o jedna a tedy cest +musíme nalézt $k$. +\figure{vrchol.eps}{Vrchol který chceme pod-rozdìlit.}{0.1\hsize} +\figure{podrozdeleni.eps}{Výsledek pod-rozdìlení vrcholu.}{0.15\hsize} + + +\s{Ford-Fulkersonùv algoritmus} +Algoritmus nepracuje pøímo s kapacitami a s toky pøes hrany, ale s rezervami +tìchto hran. Funkce rezerv definujeme jako $r(uv)\equiv w(uv)-f(uv)+f(vu)$. +Jestli $uv\notin E(G)$ pak $w(uv)=0$. +Kdy¾ zmen¹ujeme rezervu hrany tak o stejnou hodnotu zvý¹íme hodnotu +rezervy opaèné hrany. Dále pak FF cesta, je cesta pro kterou má ka¾dá hrana kladnou rezervu. + +\algo +\:nastav rezervy pro nulový tok na v¹ech hranách (rezervy se rovnají kapacitám) +\:while $\exists$FF cesta z $s$ do $t$ +\::buï $p$ FF cesta z $s$ do $t$ +\::zvìt¹i tok zmen¹ením rezerv, o $m=min_{uv\in p}r(uv)$ +\:end while +\:spoèti tok z rezerv +\endalgo + +Pro dùkaz korektnosti algoritmu uva¾ mno¾inu $X=\{ v,\,\exists$FF +cesta z $s$ do $v\}$ po dobìhnutí algoritmu. Proto¾e neexistuje FF cesta z $s$ do $t$, $t\notin X$. +Pak mno¾iny $X$ a $V\setminus X$ urèují øez tvoøený hranami spojujícími +vrcholy z rùzných mno¾in $c=\{uv: uv\in E, u\in X, v\in V\setminus X\}$. V¹echny hrany $uv\in c$ +mají nulovou rezervu, nebo» jinak by se dala prodlou¾it FF cesta do vrcholu z $V\setminus X$. Tak¾e velikost +toku se rovná souètu kapacit hran z $X$ do $V\setminus X$ (tohle tvrzení jsme dokázali pøi dùkazu opaèné implikace +FF vìty). Souèasnì tyhle hrany tvoøí $st$-øez, kterého kapacita je rovna velikosti toku. Na¹li jsme tedy øez, +kterého velikost se rovná velikosti pøípustného toku a tím je dùkaz FF vìty ukonèen. + +Kdy¾ máme celoèíselné kapacity hran tak v ka¾dém kroku se tok zvìt¹í +alespoò o jedna a maximální tok je z hora omezen, napøíklad souètem +v¹ech kapacit hran. Pro racionální kapacity staèí vynásobit kapacity +a dostaneme celoèíselné. Z toho plyne koneènost FF algoritmu pro hrany s racionálními kapacitami. +Táto varianta FF algoritmu není obecnì koneèná pøi reálných kapacitách. grafových agoritmù - ze dne 20.3.2006 +% Zapsal Jiøí Peinlich - a Michal Kùrka - +%%%%%%%%%%% + +\input ../sgr.tex + +\prednaska{3}{Bipartitní párování a globální k-souvislost}{zapsali Jiøí Peinlich, Michal Kùrka} + +\h{Maximální párování v $k$-regulárním bipartitním grafu} + +\s{Operace Degree Split} provádí rozdìlení sudì-regulárního grafu na dva +podgrafy s polovièní regularitou. Operaci Degree Split definujme na +sudì-regulárním grafu takto: V grafu najdeme eulerovský tah. Sestrojíme dva +grafy, které budou mít oba stejnou mno¾inu vrcholù jako graf pùvodní a ka¾dý +bude mít polovinu jeho hran. Mno¾inu hran prvního grafu budou tvoøit sudé hrany +z nalezeného eulerovského tahu, mno¾inu hran druhého grafu pak hrany liché. Tuto +operaci lze jistì provést v lineárním èase (v lineárním èase najdeme eulerovský +tah i rozklad na sudé a liché hrany). + +Dále budeme pracovat s $2^d$-regulárními grafy. Operací Degree Split tedy získáme dva grafy, které budou $2^{d-1}$-regulární. + +Provedeme-li operaci Degree Split $\log k = d$ krát (polovinu hran v¾dy +zahodíme), získáme 1-regulární podgraf a tedy párování pro zadaný graf (ve +skuteènosti mù¾eme graf rozkládat na párování a vyrobit si 1-faktorizaci +grafu). Slo¾itost nalezení párování bude tedy pro $2^d$ regulární grafy $\O(2^d n +d)$. + +Pokud zadaný graf nebude $2^d$-regulární budeme muset pøidat hrany tak, aby nový +graf tuto vlastnost mìl. Operaci Degree Split pak budeme provádìt tak, abychom +se k párování blí¾ili. + +Místo toho, abychom do grafu hrany jen pøidávali, budeme v pøípadech, kdy je to +mo¾né, pouze zvìt¹ovat násobnost hrany. U ka¾dé hrany si tedy budeme pamatovat +její násobnost. + +\s{Degree Split s~násobnostmi:} Pro sudì-regulární grafy s násobnostmi zavedeme operaci Degree Split takto: +Graf $G=(V,E)$ rozdìlíme na dva grafy $G_1$ a $G_2$, bude platit $V(G_1) = V(G_2) = V$. Hrany nyní pøidìlíme následujícím zpùsobem: +\algo +\:Pokud $e\in E$ v $G$ má sudou násobnost (znaèíme $n(e)$), umístíme ji do $E_1$ i do $E_2$ s násobností ${n(e) \over 2}$, v opaèném pøípadì pøidáme do obou grafù hranu s násobností $\lfloor {n(e) \over 2} \rfloor$. +\:Graf se zbylých hran má v¹echny stupnì sudé a je bez multiplicit. Provedeme na nìj pùvodní operaci Degree Split a rozdìlené mno¾iny hran pøidáme do $G_1$ a $G_2$. +\endalgo + +Celý proces lze stihnout v èase $\O(m)$ ($m$ je poèet hran $G$), nebo» v první èásti u ka¾dé hrany pouze zjistíme, zda má sudou násobnost, pøidáme nové hrany v konstantním èase (upravíme násobnosti), a v druhé èásti se provede Split, který má té¾ lineární slo¾itost. Operace Degree Split má tedy slo¾itost $\O(m)$ i v grafu s násobnostmi. + +Mìjme nyní $k$-regulární bipartitní graf. Zvolme $t$ tak aby $2^t\geq kn$. +Zvolme dále +$\alpha := \lfloor {2^t \over k} \rfloor$ a +$\beta := 2^t \bmod k$. +Do grafu pøidáme hrany a upravíme násobnosti hran tak, aby byl $2^t$ regulární. Dále pøidáme triviální párování ($i$-tý vrchol vlevo se spojí s $i$-tým vrcholem vpravo) s násobností $\beta$. Tuto mno¾inu hran oznaème $F$. Platí $\beta < k \Rightarrow \vert F \vert < 2^t$. + +Takto získáme $2^t$-regulární graf. Na tento graf budeme aplikovat operaci Degree Split a vybereme si v¾dy tu polovinu, kde bude ménì hran z $F$. Tímto zpùsobem budem graf dìlit dokud budou stupnì vrcholù vìt¹í ne¾ jedna. Tedy $t$-krát. Poslední takto získaný graf bude 1-regulární (párování). V ka¾dém kroku se zbavíme alespoò poloviny hran z $F$. Provedeme to ceklem $t$-krát a tedy výsledné párování bude perfektní párování zadaného grafu. + +Slo¾itost algoritmu je $\O(kn \log n)$, proto¾e inicializace algoritmu se dá provést v lineárním èase, provede se $\log (kn)$ iterací po $\O(m)$. + +\h{Algoritmy na hledání globální k-souvislosti} +\s{Hranová k-souvislost} +Problém zji¹tìní stupnì souvislosti grafu lze pøevést na problém hledání minimálního øezu v~grafu. Algoritmus pro hledání minimálního øezu lze zkonstruovat napøíklad tak, ¾e pro ka¾dé dva vrcholy $s$, $t$ zjistíme minimální $st$-øez. Algoritmus mù¾eme zrychlit, pokud si uvìdomíme, ¾e jeden z vrcholù $s$ nebo $t$ lze zvolit pevnì. Pokud pracujeme s orientovanými grafy, musíme projít jak $s \rightarrow t$ øezy tak i $t \rightarrow s$ øezy. Algoritmus bude mít slo¾itost $\O(n^{{5/3}}m)$. + +U vrcholové $k$-souvislosti to ov¹em tak snadno nepùjde. Pokud by toti¾ fixovaný vrchol byl souèástí nìjakého minimálního separátoru, algoritmus mù¾e selhat. Pøesto ale nemusíme procházet v¹echny dvojice vrcholù. Staèí si pamatovat, kolik vrcholù $s$ jsme u¾ pro v¹echny $t$ zkontrolovali a nejmen¹í zatím nalezený separátor. Kdy¾ bude poèet vrcholù vìt¹í ne¾ nejmen¹í separátor, tak u¾ jsme jistì na¹li jeden z minimálních øezù. Slo¾itost takového algoritmu pak bude $\O(\kappa (G) n^{3/2} m)$, kde $\kappa(G)$ je stupeò souvislosti $G$, který hledáme. + +Bez tokù se dá ov¹em najít hranová k-souvislost efektivnìji (i v ohodnocených grafech). Uka¾me si, jak na to.

\h{Algoritmus pro nalezení minimálního globálního øezu v neorientovaných grafech (Namagochi, Ibaraki)}

\noindent Zavedeme znaèení:

\itemize\ibull
\:{$r(u,v)$ buï kapacita minimálního $uv$-øezu}
\:{$d(v)$ buï celková kapacita hran vedoucích z $v$}
\:{$d(U)$ buï kapacita hran vedoucích z mno¾iny $U \subseteq V$, speciálnì $d(U)=d(\overline{U})$}
\:{$d(P,Q)$ buï kapacita hran vedoucích mezi mno¾inami $P,Q$}
\endlist

\s{Definice}
{\it Legálním uspoøádáním vrcholù} (LU) budeme nazývat lineární uspoøádání vrcholù $v_1, v_2,... ,v_n$ takové, ¾e platí
$d(\{v_1 \ldots v_{i-1}\},v_i) \geq d(\{v_1 \ldots v_{i-1}\},v_j)$ pro $1 \leq ii$, $v_i$ a $v_j$ jsou oddìleny øezem $C$ a $j$ je minimální takové.
\endalgo

Ka¾dé $u_{i-1}$ je tedy buï $u_i$, pokud jsou $v_i$ a $v_{i-1}$ na stejné stranì øezu, nebo $u_{i-1}$ je $v_i$ pokud jsou $v_i$ a $v_{i-1}$ na opaèné stranì øezu.
Dostáváme tedy, ¾e $d(\{v_1...v_{i-1}\},u_i)\leq d(\{v_1...v_{i-1}\},u_{i-1})$, proto¾e buïto $u_i=u_{i-1}$ a pak je nerovnost splnìna jako rovnost, nebo je $u_i=v_j$, $j>i$ a nerovnost plyne z LU vrcholù $v_i$.

Chceme ukázat, ¾e velikost libovolného øezu je alespoò taková jako velikost øezu kolem vrcholu $v_n$.
Platí, ¾e $ \vert C \vert \geq \sum_{i=1}^{n-1} d(v_i,u_i)$. Uká¾eme, ¾e pravá strana je alespoò $d(v_n)$. + +$$\sum_{i=1}^{n-1} d(v_i,u_i) = \sum_{i=1}^{n-1} d(\{v_1..v_i\},u_i) - d(\{v_1 \ldots v_{i-1}\},u_i) \geq \sum_{i=1}^{n-1} d(\{v_1 \ldots v_i\},u_i) - d(\{v_1 .. v_{i-1}\},u_{i-1}) = $$ + +$$ = d(\{v_1 \ldots v_{n-1}\},u_{n-1}) - d(\{v_1 \ldots v_0\},u_0) = d(\{v_1 \ldots v_{n-1}\},v_n) - 0.$$ +\qed + +Dokázali jsme, ¾e libovolný øez separující $v_{n-1}$ a $v_n$ je vìt¹í ne¾ jednoduchý øez skládající se jen z hran kolem~$v_n$. Kdy¾ tedy sestavíme nìjakou LU posloupnost vrcholù, budeme mít k dispozici jednoduchý minimální øez $v_{n-1}$ a~$v_n$. Následnì vytvoøíme graf $G'$, v nìm¾ $v_{n-1}$ a $v_n$ skontrahujeme. Rekurzivnì najdeme minimální øez v $G'$. Hledaný minimální øez poté buïto oddìluje vrcholy $v_n$ a $v_{n-1}$ a potom je øez kolem vrcholu $v_n$ minimální, nebo vrcholy $v_n$ a $v_{n-1}$ neoddìluje, a v takovém pøípadì jej najdeme rekurzivnì. Hledaný øez je tedy men¹í z rekurzivnì nalezeného øezu a øezu kolem $v_n$. + +Zbývá ukázat, jak konstruovat LU. Postaèí hladovì: Pamatujeme si $\forall v\neq v_1 \ldots v_{i-1}$ hodnotu $d(\{v_1 \ldots v_{i-1},v)$, oznaème ji $z_v$. V ka¾dém kroku vybereme vrchol $v$ s maximální hodnotou $z_v$ a prohlásíme ho za $v_i$ a pøepoèítáme~$z_v$. + +Zde se hodí datová struktura, která doká¾e rychle hledat maxima a zvy¹ovat hodnoty prvkù, +napøíklad Fibonacciho halda. Ta zvládne \ v~èase $(\log n)$ a \ v~$\O(1)$ +amortizovanì. Celkem pak ná¹ algoritmus bude mít slo¾itost $\O(n(m+n\log n))$ pro obecné kapacity. + +Pokud jsou kapacity malá celá èísla, mù¾eme vyu¾ít balíèkové struktury. Budeme +si udr¾ovat obousmìrný seznam zatím pou¾itých hodnot $z_v$, ka¾dý prvek takového +seznamu bude obsahovat v¹echny vrcholy se spoleènou hodnotou $z_v$. Kdy¾ budeme +mít seznam seøazený, vybrání minimálního prvku znamená pouze podívat se na +první prvek seznamu a z nìj odebrat jeden vrchol, pøípadnì celý prvek ze seznamu +odstranit. index 0000000..dcec7db --- /dev/null +++ b/5-mst/5-mst.tex @@ -0,0 +1,241 @@ +%%%%%%%%%%%%%%%%%%%%%% +% lecture 04-04-2006 % +%%%%%%%%%%%%%%%%%%%%%% + +\input ../sgr.tex +\prednaska{5}{Minimální kostry}{zapsali Martin Kruli¹ \& Petr Su¹il } + +\h{Minimální kostry a základní vìty okolo nich} + +\s{Definice:} +Kostru pro nesouvislý graf definujeme jako sjednocení koster komponent grafu. + +\s{Definice:} +Nech» $G$ je neorientovaný graf. Váhy (ohodnocení) hran budi¾ zobrazení $w : E \to R$. Pro podgraf $H \subseteq G$ definujeme váhu $w(H)=\sum_{e \in E} {w(e)}$. + +\s{Poznámka:} +V dal¹ím textu nebudeme rozli¹ovat mezi podgrafy a podmno¾inami hran. Pro na¹e úèely jde o toté¾. Kostry jednovrcholových komponent nám slo¾itost nepokazí. + +\s{Definice:} +Minimální kostra (alias MST) je taková kostra $T$, která má $w(T)$ minimální. + +\s{Poznámka:} +Taková definice MST je ne¹ikovná. Vy¾aduje toti¾ existenci sèítání, pøesto¾e postaèuje pouze lineární uspoøádání. + +\s{Definice:} +Buï $T \subseteq G$ nìjaká kostra grafu~$G$. Pak +\itemize\ibull +\:$T[x,y] := $ cesta mezi $x,y$, její¾ hrany le¾í v $T$ +\:Hrana $e=(x,y) \in E \setminus T$ je {\I lehká} vzhledem ke~kostøe $ \equiv \exists e' \in T[x,y]:w(e) 0: \forall G \in {\cal C}: +\vert E(G) \vert \leq c\cdot \vert V(G) \vert$. + +\s{Dùsledek:} +Jeliko¾ v¹echny grafy vygenerované pøedchozím algoritmem jsou minory grafu ze~vstupu, +mù¾eme pro odhad jejich hustoty pou¾ít pøedchozí vìtu a dostaneme tak, ¾e pøedchozí +algoritmus má lineární èasovou slo¾itost dokonce pro ka¾dou netriviální minorovì uzavøenou +tøídu grafù. + +%%%Tomas Gavenciak + +\h{Jarníkùv algoritmus s Fibonacciho haldou} + +Pùvodní Jarníkùv algoritmus s~haldou má díky ní slo¾itost $\O(m\log n)$, to zlep¹íme pou¾itím +Fibonacciho haldy $H$, do~které si budeme ukládat trojice $(v,w,w(vw))$ vrcholù $v$ sousedících +s~dosavadní podkostrou $T$ pøes hranu $vw$, $w\in T$, která bude navíc nejlevnìj¹í mo¾ná. + +\newcount\algcnt +\s{Algoritmus: Jarníkùv algoritmus~\#2 (Fredman, Tarjan)} +\algo +\:Zaèneme libovolným vrcholem $v_0$: $T=\{v_0\}$. +\:Do~haldy $H$ umístíme v¹echny sousedy $v_0$ spolu s pøíslu¹nými hranami. +\:Opakuji dokud $H\neq\emptyset$: +\::$(v,w,w(vw))=\(H)$ +\::$T:=T\cup\{vw\}$ +\::Pro v¹echny sousedy $u\in E\backslash T$ vrcholu $v$ upravím haldu: +\:::Pokud je $u$ v~$H$ nový, pøidáme jej spolu s~nejlevnìj¹í hranou vedoucí z~$u$ do~$T$. +\:::Pokud u¾ $u$ v~$H$ je a $uv$ je levnìj¹í ne¾ pùvodní nejlevnìj¹í hrana z~$u$ +do~$T$, nahradím jeho záznam v~$H$ za~$(u,v,w(uv))$ a provedu $\(u,w(uv))$. +\global\algcnt=\itemcount +\endalgo + +Správnost algoritmu pøímo plyne ze~správnosti Jarníkova algoritmu. + +\s{Èasová slo¾itost:} +Slo¾itost tohoto algoritmu bude $\O(m+n\log n)$, nebo» vnitøní cyklus se provede +nanejvý¹ $n$-krát, za~\ v~nìm tedy zaplatíme $\O(n\log n)$, za~pøidávání +vrcholù do~$H$ a~nalezání nejlevnìj¹ích hran zaplatíme $\O(m)$ (na~ka¾dou hranu takto +sáhneme nanejvý¹ dvakrát), za~sni¾ování vah vrcholù v~haldì rovnì¾ pouze $\O(m)$ +(nanejvý¹ $m$-krát provedu porovnání vah a \ v~$\the\algcnt.$ za~$\O(1)$). + +Toto zlep¹ení je dùle¾itìj¹í, ne¾ by se mohlo zdát, proto¾e nám pro grafy s~mnoha hranami +(konkrétnì pro grafy s~$m=\Omega(n\log n)$) dává lineární algoritmus. + +\h{Kombinace Jarníkova a Borùvkova algoritmu} + +K~dal¹ímu zlep¹ení dojde, kdy¾ nejprve spustíme $\log\log n$ cyklù Borùvkova algoritmu +s~kontrahováním vrcholù, tímto dojde k~velkému sní¾ení poètu vrcholù. + +\s{Algoritmus: Jarníkùv algoritmus~\#3 (pùvod neznámý)} +\algo +\:Provedeme $\log\log n$ cyklù upraveného Borùvkova algoritmu s~kontrahováním hran popsaného vý¹e. +\:Pokraèujeme Jarníkovým algoritmem~\#2. +\endalgo + +\s{Èasová slo¾itost:} +Slo¾itost první èásti je $\O(m\log\log n)$. +Poèet vrcholù se po~první èásti algoritmu sní¾í na~$n'\leq n/\log n$ a slo¾itost druhé èásti bude +tedy nanejvý¹ $\O(m+n\log n'/\log n)=\O(m)$. Nyní ji¾ máme lineární algoritmus i~pro grafy +s~$m\geq n\log\log n$. + +\h{Jarníkùv algoritmus s~omezením velikosti haldy} + +Je¹tì vìt¹ího zrychlení dosáhneme, omezíme-li Jarníkovu algoritmu \#2 vhodnì +velikost haldy a takto budeme bìhem jednoho Jarníkova algoritmu skládat pouze +jednotlivé podkostøièky zastavené v rùstu pøeteèením haldy, podle kterých +graf následnì skontrahujeme a budeme pokraèovat s mnohem men¹ím grafem. + +\s{Algoritmus: Jarníkùv algoritmus~\#4 (Fredman, Tarjan)} +\algo +\:Opakuji, dokud mám netriviální $G$ (s alespoò jedou hranou). +\::$t=\vert V_G\vert$. +\::Zvolím $k=2^{2m/t}$ podle aktuálního $t$. +\::$T=\emptyset$ +\::Opakuji, dokud existují vrcholy mimo $T$: +\:::Najdu vrchol $v_0$ mimo $T$. +\:::Spustím Jarníkùv alg. \#2 pro celý graf od $v_0$, zastavím ho, pokud: +\global\algcnt=\itemcount +\::::$\vert H\vert\geq k$ (pøekroèena vel. haldy) nebo +\::::$H=\emptyset$ (do¹li sousedé) nebo +\::::do $T$ jsem pøidal hranu oboustrannì incidentní s~hranami v~$T$ (pøipojil +jsem novou podkostru k~nìjaké u¾ nalezené). +\::Skontrahuji $G$ podle podkoster nalezených v~$T$. +\endalgo + +\s{Pozorování:} +Ka¾dá z~nalezených podkoster v~$T$ je incidentní s~alespoò $k$ hranami (a~nebo +algoritmus u¾ konèí). +Jak to vypadá pro jednotlivá ukonèení: +\numlist\ndotted +\itemcount=\algcnt +\:$\vert H\vert\geq k$ -- bylo u¾ pøidáno dost vrcholù. +\:$H=\emptyset$ -- nalezena celá kostra, konèím. +\:Pøipojím se k~u¾ existující podkostøe -- jen ji zvìt¹ím. +\endlist + +\s{Èasová slo¾itost:} +Dùsledkem pozorování je, ¾e poèet podkoster v~jednom prùchodu je nanejvý¹ +$2m/k$. Pro $t'$ a $k'$ v následujícím kroku potom platí $t'\leq 2m/k$ a $k'=2^{2m/t'}\geq 2^k$, +prùchodù bude tedy nanejvý¹ $\log^* n$\foot{$\log^* n$ je inverzní funkce k~\uv{vì¾i +z~mocnin}, èili $\min\{i:\log^{(i)} n<1 \}$, kde $\log^{(i)} n$ je $i$-krát iterovaný +logaritmus.}, proto¾e prùchod s~$k>n$ bude u¾ urèitì poslední. +Jeden vnìj¹í prùchod trvá $\O(m+t\log k)$, zvolím-li tedy $k=2^{2m/t}$, potom bude mít +jeden prùchod slo¾itost $\O(m)$. Celková slo¾itost bude $\O(m\log^{*}n)$. +Podrobnìj¹í analýza pak dá je¹tì o~nìco lep¹í výsledek, a~to $\O(m\beta(m,n))$, kde +$\beta(m,n)=\min\{i:\log^{(i)}n\!>}} +\def\opdiv{\mathop{/}} +\def\opmod{\mathop{\%}} +\def\ALIK{{\sc Alik}} + +\def\alik#1{% +\medskip +\halign{\qquad $ ##$&\hbox to 0.4\hsize{${}##$\hfil}&\hfil $ ##$&\hbox to 0.4\hsize{${}##$ \hss}\cr +#1} +\medskip +} + +\prednaska{7}{Výpoèetní modely}{zapsal Zdenìk Vilu¹ínský } + +\h{Druhy výpoèetních modelù} + +\s{Poznámka:} V dostateènì silném výpoèetním modelu lze v¹e (a¾ na +vyjímky) spoèítat v konstantním èase. + +\s{Church - Turingova teze:} V¹echny výpoèetní modely které nejsou +absurdní jsou ekvivalentní. + + Toto tvrzení ale neplatí a¾ do tìch nejmen¹ích detailù, které by nás zajímaly. Spoèítáme to samé, +ale pøi zkoumání jemnìj¹ích slo¾itostí ne¾ polynomiálních nejsou +modely stejnì silné. + +Následující modely se li¹í v tom, zda vìøíme, ¾e lze pole +indexovat v konstantním èase nebo ne. + +\s{Pointer Machine:} Uznává 2 typy dat: + +\algo +\: Èísla - jsou omezená parametry modelu +\: Pointry - +ukazují na "krabièky" +\endalgo + +Pamì» tohoto modelu je slo¾ená z pevného poètu registrù na èísla a +na pointry a neomezeného poètu krabièek. Ka¾dá krabièka má pevný +poèet polo¾ek na èísla a pointry a na krabièku se lze odkázat +pointrem. Aritmetika není a¾ na triviální pøípady v konstantním +èase. + +\s{Random Access Machine:} Je rodinka modelù, které se li¹í v +rùzných detailech. Ov¹em dost podstatných. V¹echny mají spoleèné +to, ¾e existuje pouze jeden datový typ - {\bf èísla}, mají pevný +poèet registrù (do jednoho registru se vejde jedno èíslo) a pamì», +co¾ je pole indexované èísly, jeho¾ polo¾ky jsou èísla. Instrukce +jsou operace s èísly. + +Tento model má dvì nejasnosti: + +\algo +\: Velikost èísel +\: Cena operací +\endalgo + +\h {Typy Random Access Machine (RAM)} + +\s{1) Logaritmická cena instrukcí} + +Èasová slo¾itost instrukce roste s poètem bitù èísel, na kterých +instrukce pracuje. Dojde tím k odstranìní absurdit, ale ¹patnì se +poèítá $\O(x)$. + +\s{2) Omezení velikosti slova; Operace v $\O(1)$} + +$W$ - ¹íøka slova. Mám li vstup délky $n$, pak $W$ je alespoò +$\log n$. Mù¾eme BÚNO pøedpokládat, ¾e $W = \O(\log n)$. Není to +zcela ekvivalentní prvnímu RAM, ale dovedeme na nìj pøevést se +zpomalením $\O(\log n)$. Máme k dispozici nìkolik modelù operací: + +\algo +\:WordRAM - +, -, *, /, \%, <<, >>, \&,\^{} + +\:AC$^0$ RAM - Jsou funkce spoèitatelné hradlovou sítí, která má +polynomiální poèet hradel, libovolný poèet vstupù a konstantní +hloubku. + +\:AC$^k$ - Jsou funkce spoèitatelné hradlovou sítí, která má +polynomiální poèet hradel, libovolný poèet vstupù a hloubku $ +\O(\log^k n)$. + +\:MC$^k$ - Jsou funkce spoèitatelné hradlovou sítí, která má +polynomiální poèet hradel a má nejvý¹e 2 vrstvy. + +\: Word $\cap$ AC$^0$ - Mù¾eme v¹e, kromì *, /, \%. Nejedná se ale +o pøíli¹ zajímavý model . +\endalgo + +Zamìøíme se pøevá¾nì na WordRAM, ale ve¹keré operace lze vyrobit i +v AC$^0$RAM. + +\s{Poznámka:} Ve¹keré Pointer-Machine polynomiání algoritmy, jsem +schopen na RAM spoèíst v asymptoticky stejném èase. + +\h {Van Emde-Boas Trees} + +Struktura, která si pamatuje mno¾inu uzlù $X$ z nìjakého omezeného +universa $U$, $X \subseteq \{0..U-1\}$ a podporují "stromové +operace" v èase $\O(\log\log U)$. Stromovými operacemi jsou +my¹leny základní mno¾inové operace a operace pracující s +uspoøádáním. V takovéto struktuøe pak mají operace slo¾itost: + +\settabs 5 \columns \+ & VEBT & Best Known\cr \+ Tøídìní & +$\O(n\log\log U)$ & $\O(n\log\log n)$ \cr \+ MST & $\O(m\log\log +U)$ & $\O(m)$ - pro integerovì ohodnocené\cr \+ Dijkstra & +$\O(m\log\log U)$ & $\O(m+n\log\log U)$, neorientovanì $\O(m)$\cr + + +VEBT pro universum velikosti $U$ (WLOG $U=2^{2^K}$) obsahuje: +\algo + +\:min, max - alespoò jedno nesmí být ulo¾eno rekurzivnì v +podstromech + +\:pøihrádky $P_0$ -- $P_{\sqrt{U}}$, pøièem¾ $x$ padne do +$P_{\lfloor x/\sqrt{U} \rfloor}$ a pøihrádky jsou ulo¾ené jako +VEBT($\sqrt{U}$) + +\:"sumární" VEBT($\sqrt{U}$) obsahující èísla neprázdných +pøihrádek +\endalgo + +\s{Find:} - pøímoèaøe v $\O(\log\log U)$ + +\s{Insert:} Slo¾itost $\O(\log\log U)$ +\algo + +\:o¹etøení triviálních stromù + +\: je-li tøeba, swap s min/max + +\: padne do pøihrádky $P_i$, která je buï + +\:: prázdná $\Rightarrow$ update sumárního stromu + zalo¾ení +triviálního stromu pro pøihrádku + +\:: nìco v ní je $\Rightarrow$ zanoøím do podstromu +\endalgo + +\s{Delete:} - analogicky + +\s{FindMin:} - Slo¾itost $\O(1)$ + +\s{Succ:} - Slo¾itost $\O(\log\log U)$ +\algo + +\: porovnání $x$ s min a max + +\:: $x$ = min $\Rightarrow$ i=FindMin(sumarni strom); Succ = +FindMin($P_i$) \:: $x$ = max $\Rightarrow$ Succ = 0 + +\: $x \in P_i$ + +\:: $x \not =$ max $P_i$ $\Rightarrow$ vnoøím do $P_i$ + +\:: $x =$ max $P_i$ $\Rightarrow$ j=Succ(i) v sumárním stromu; +Succ = FindMin($P_j$) +\endalgo + +Na operace mám hezké slo¾itosti, ale s inicializací to tak pìkné +není. Nicménì z následujícího vyplyne, ¾e není tøeba inicializaci +psát. + +\h{Modely inicializace} + +\s{1) "Pøi odchodu zhasni":} Pøidáme axióm, ¾e na zaèátku je celá +pamì» vynulovaná. Za sebou pak pamì» uklidíme. + +\s{2) Neinicializovano:} V pamìti je cokoliv, musím se postarat +sám + +\s{Vìta:} Buï $P$ program pro WordRAM s nulami inicializované +pamìti bì¾ící v èase $T(n)$. Pak existuje program $P$' pro WordRAM +s {\bf neinicializovanou} pamìtí poèítající toté¾ v +èase$\O(T(n))$. + +\s{Dùkaz:} Bìhem výpoètu si budeme pamatovat, k terých pamì»ových +buòkách u¾ nìco máme. Prokládaòe ulo¾íme do pamìti 2 pole: +\itemize\ibull \:M - pamì» $P$ \:L - seznam pou¾itých bunìk v M a +L[0] = délka L +\endlist + +Redukci vylep¹íme tím, ¾e zalo¾íme dal¹í prolo¾ené pole R, ve +kterém $i$-tá polo¾ka je buï neinicializovaná nebo øíká, na které +pozici v L je $i$-tá pamì»ová buòka pùvodního stroje.R[$i$] = $j$: +L[$j$] = $i$ $\vee$ neinicializováno pokud $\not \exists$ takové $j$. + +Tak¾e jsem schopen v konstantním èase rozhodnout, +jestli u¾ do buòky bylo psáno a ve stejném èase teké buòku pøidat. + +\qed + +\s{3) Zákaz dìr:} $\Rightarrow$ randomizované + +\s{Dùsledek:}Ani v jednom z pøedchozích pøípadù nemusíme psát +inicializaci + +\h{Operace s RAM} + +Dá se s jistými omezeními pou¾ívat jako vektorový poèítaè. + \itemize\ibull + +\:Nejpravìj¹í jednièka: +\alik{ + & & x&=\0\1\9\9\9\0\1\1\0\0\9\9\9\0 \cr + & & x - 1&=\0\1\9\9\9\0\1\0\1\1\9\9\9\1 \cr + & & x \land (x - 1)&=\0\1\9\9\9\0\1\0\0\0\9\9\9\0 \cr + & & x \oplus (x \land (x - 1))&=\0\0\9\9\9\0\0\1\0\0\9\9\9\0 \cr} +\endlist + +Pro následující sadu vektorových operací vezmeme vektor, a +prolo¾íme jeho jednotlivé prvky zleva nulami. \itemize\ibull + + \alik{ & & \0 x_{n-1} \0 x_{n-2} \9\9\9 \0 x_1\0 x_0 \cr} + +\: Replikace: + +Replikace $x$ vytvoøí vektor samých $x$ + \alik{ & & x*(\0\0\9\9\9\0\0\1)^n \cr} + +\: Seètení v¹ech slo¾ek $(Sum)$: + +a) sèítáním modulo $1^{n+1}$ + +b) násobením vhodnou konstantou +\def\.{\hbox to 3pt{\hfil}} +\def\z{\rack{$x_1$}{\hss\1\hss}} +\def\y{\rack{$x_{n-1}$}{\hss\1\hss}} +\def\xa{\rack{$x_1$}{\hss\.\hss}} +\def\xb{\rack{$x_{n-1}$}{\hss.\hss}} +\def\|{\hbox to 3pt{\hfil \vrule height 8pt depth 2pt \hfil}} + +\alik{ & & x_{n-1} x_{n-2} \9\9\9\9 x_1 x_0 \cr + & & * \y\y \9\9\9\9 \z\z \cr + & & x_{n-1} x_{n-2} \9\9\9\9 x_1 x_0 \cr + & & x_{n-1} x_{n-2} \xb\9\9 x_1 x_0 \xa \cr + & & \| \xa\xa\xa\xa\xa\xa\xa \cr + & & \| \xa\xa\xa\xa\xa\xa\xa \cr + & & \9\9\9 x_1x_0\xa\xa\xa\xa\xa\xa\xa \cr + } +Výsledkem je vektor v¹ech èásteèných souètù. + +\: Paralelní porovnání $(Cmp)$: + +Compare x $\leq$ y $\equiv z_i = 1 \Leftrightarrow x_i \leq y_i$ +\alik{ & & \1 y_{n-1} \1 y_{n-2} \9\9\9 \1 y_1\1 y_0 \cr & & - \0 +x_{n-1} \0 x_{n-2} \9\9\9 \0 x_1\0 x_0 \cr \cr} + +U vektoru y nahradíme prolo¾ené nuly jednièkami a odeèteme vektor +x. Ve výsledku pak bude na místì prolo¾eného bitu jednièka právì +tehdy, kdy¾ $x_i \leq y_i$ + +\: Rank ($x$,y): + +Mám nìjaké èíslo $x$ a vektor y, Rank je poèet slo¾ek vektoru, +které jsou men¹í nebo rovny $x$. \alik{ & & +Sum(Cmp((xx\9\9\9xx),y)) \cr} + +Nareplikuji vektor samých $x$ a ten porovnám s vektorem y. +Výsledný vektor seètu. + +\: Zatøídìní: + +Zatøídit novou hodnotu do setøídìného vektoru èísel lze také v +konstantním èase. Nejprve pomocí Rank najdu místo, kam má pøijít, +pak nìjakým konstantním poètem operací vektor "roz¹oupnu" o ¹íøku +slo¾ky doleva a vlo¾ím novou hodnotu. + +\: Unpack: + +Dostane $k$-bitové èíslo a vyrobí $k$-slo¾kový vektor, jeho¾ +slo¾ky jsou bity pùvodního èísla. Zreplikuji $x$ na vektor \alik{ +& & \0x\0x\9\9\9\0x \cr} a provedu AND s vhodnou bitovou maskou, +konkrétnì \alik{ & & +\1\0\9\9\9\0\|\9\9\9\|\0\9\9\9\0\1\0\|\0\9\9\9\0\1 \cr} Tím +vytvoøím vektor, který má v ka¾dé slo¾ce nulu nebo nenulu, podle +toho, jestli bit odpovídající této slo¾ce je nulový nebo nenulový, +ale je na ¹patné pozici. Vektor teï prolo¾ím jednièkami místo nul +a odeètu jednièku v ka¾dé slo¾ce. Tam kde byla ve slo¾ce nula, tak +si vypùjèila z jednièky od prostrkání, kde byla nenula tam se +nevypùjèilo. Prokládací bity jsou teï negace tìch, které tam +potøebuji mít. Pak staèí znegovat, provést Shift na správné místo +a AND k odstranìní nepoøádku. + +\: Pack: + +Dìlá opak ne¾ unpack, dostane vektor jednièek a nul, ze kterého +vytvoøí $k$-bitové èíslo. Pøerozdìlím slo¾ky vektoru tak, jako by +byli o bit krat¹í a provedu $Sum$ - Tím se jednotlivé bity posunou +a posèítá se to, jak potøebuju. + +\endlist + +Pro dal¹í operace pøedpokládáme, ¾e pro $W$-bitová èísla máme +slova dlouhá alespoò $b^2$. + +\itemize\ibull + +\: Poèet jednièek: + +Zjistí poèet jednièkových bitù. Provedu Unpack, èím¾ dostanu +vektor, jeho¾ slo¾ky jsou bity pùvodního èísla a provedu $Sum$. + +\: Zrcadlení: + +Chci dostat zrcadlovì symetrické èíslo ke vstupnímu. Nejprve +provedu Replicate. V nejni¾¹í kopii si nechám nejvýznamìj¹í bit, v +dal¹í druhý, a¾ v poslední nejni¾¹í bit. Poté posèítám s o jedna +men¹í velikostí bloku. + +\: LSB (Least Significant Bit): + +Poøadové èíslo první jednièky zprava. Izoluji tento bit pomocí +nalezení nejpravìj¹í jednièky, \alik{& & \0\9\9\9\0\1\0\9\9\9\0 +\cr} odeètu 1 a seètu jednièky. \alik{& & \0\9\9\9\0\0\1\9\9\9\1 +\cr} + +\: MSB (Most Significant Bit): + +Provede se pøes zrcadlení. + +\: MSB pro normální délu slova: + +Rozdìlím èíslo na bloky velikosti $\lfloor\sqrt{w}\rfloor$, +nejdøíve v ka¾dém bloku zjistím, zda v nìm nìco je nebo ne - +$Cmp(x,0)$, provedu Pack, èím¾ dostanu jedno slovo $y$ odmocninové +délky, které øíká, které bloky jsou prázdné a které ne. Dále +pustím MSB kvadratické na $y$, èím¾ dostanu blok $B_i$, ve kterém +je nejpravìj¹í jednièka a nakonec pustím MSB kvadratické na blok +$B_i$. Tím ji najdu uvnitø bloku. + +\endlist +\bye diff --git a/7-ram/Makefile b/7-ram/Makefile new file mode 100644 index 0000000..30dae5a --- /dev/null +++ b/7-ram/Makefile @@ -0,0 +1,3 @@ +P=7-ram + +include ../Makerules diff --git a/8-qheapuf/8-qheapuf.tex b/8-qheapuf/8-qheapuf.tex new file mode 100644 index 0000000..e44d00e --- /dev/null +++ b/8-qheapuf/8-qheapuf.tex @@ -0,0 +1,291 @@ +\def\X{{\cal X}} +\def\B{{\cal B}} +\def\and{\ \&\ } +\def\msb{{\rm MSB}} +\def\rank{{\rm Rank}} + +\def\pnromanp{(\nroman)} +\def\pnromanap{(\nroman ')} + +% Vlozeni obrazku {obrazek}{popisek} +\def\nosizefigure#1#2{\bigskip\vbox{\centerline{\epsfbox{#1}}\smallskip\centerline{#2}}\bigskip} + +\input ../sgr.tex + +\prednaska{8}{Q-Heaps \& Union-Find problem}{zapsali Cyril Strejc a Ale¹ +©nupárek} + +Na minulém semináøi jsme si mimo jiné ukázali výpoèetní model RAM a nahlédli +jsme, ¾e pomocí RAMu mù¾eme celkem snadno (v konstatním èase) simulovat +vektorový poèítaè. A kdy¾ u¾ máme vektorový poèítaè, pojïme si ukázat, jaké +datové struktury bychom s ním mohli vytváøet. Vektor ukládáme v $\O(w)$ slovech. +V dal¹ím budeme BÚNO +pøedpokládat, ¾e hodnoty, které do stuktur ukládáme, jsou rùzné. Svým sna¾ením +smìrujeme ke strukturám, které zvládnou operace {\it Insert} a {\it Delete} v +kostantním èase s rozumnou konstantou. + +\s{Znaèení:} +\itemize\ibull +\: $w$, ¹íøka slova daného stroje (RAMu) +\: $n$, velikost vstupu +\endlist +Abychom mohli indexovat vstup, dále pøedpokládejme, ¾e $w = \O(\log n)$. + +\h{Word-Encoded B-Tree} +V podstatì pùjde o obyèejný B-strom s daty v listech. Faktor stromu oznaème $B$. +Ukládáme $k$-bitové hodnoty a chceme aby $Bk=\O(w)$ -- tehdy se nám uzel stromu +vejde do vektoru a my budeme dostateènì rychle umìt operace s uzly, které do +B-stromu potøebujeme, t.j. dìlení, spojování, vyhledávání. Té¾ ukládáme pointry +na syny. Je tøeba si trochu rozmyslet, ¾e v ka¾dém uzlu se pointry na syny také +povede ``scucnout'' do vektoru. Jen¾e poèet prvkù ($\vert T\vert$), které se do +stromu vejdou je øádovì $B^h$, kde $h$ je hloubka stromu, a tudí¾ $\log\vert +T\vert = \O(h)$. Proto se pointry do vektoru pìknì vejdou. + +\h{Q-Heaps} + +Q-Heap je teoreticky zajímavá datová struktura, v praxi neimplementovatelná. +Narozdíl od Word-Encoded B-Tree není takové omezení na velikost ukládaného èísla +-- maximální velikost èísla odpovídá velikost slova. + +\s{Znaèení:} +\itemize\ibull +\: $k = \O(w^{1/4})$ +\: $r\le k$, poèet prvkù v Q-haldì +\: $x_1 < \ldots < x_r$, prvky (o $w$ bitech) v Q-haldì +\: $\X = (x_1,\ldots,x_r)$ +\: $c_i = \msb(x_i \oplus x_{i+1})$, nejvy¹¹í bit, na kterém se li¹í $x_i$ a +$x_{i+1}$ +\: $\rank_\X(x)$, poèet prvkù mno¾iny $\X$, které jsou men¹í ne¾ $x$. +Samotné $x$ ov¹em nemusí být prvek mno¾iny $\X$. +\endlist + +Haldové operace budeme umìt v $\O(1)$, nicménì bude nutný preprocesing v èase +$\O(2^{k^4})$, co¾ ov¹em není tak hrozné, jak na prní pohled vypadá, jeliko¾ +$k = \O(\root 4 \of {\log n})$, èili nakonec ho stihneme v lineárním èase. + +A jak to tedy vypadá? Prvky $x_1,\ldots,x_r$ budeme ukládat do tzv. trie. +{\it Trie} je binární strom s prvky (daty) v listech, v na¹em pøípadì s +hodnotami $x_1,\ldots,x_r$. Popí¹u konstrukci trie. Oznaèím $c = \max(c_i)$. +Mno¾inu $\X$ rozdìlíme na dvì mno¾iny, podle hodnot prvkù na $c$-tém bitu v +binárním zápisu: $$ \X_0 = \{ x_i \vert x_i \in \X\and x_i[c]=0 \}$$ +$$ \X_1 = \{x_i \vert x_i \in \X\and x_i[c]=1\}$$ + +Tedy $$\forall x \in \X_1, \forall y \in \X_2: x < y$$ + +Èíslo $c$ -- øíkejme mu znaèka -- vlo¾íme do koøene právì budovaného (pod)stromu +a jako levý podstrom pøipojím strom, který vznikne stejnou oparací na mno¾inì +$\X_ 0$, prièem¾ $c$ vybíráme jen pøes prvky $\X_0$. Pravý podstrom vznikne +stejnì z mno¾iny $\X_1$. Pokud je ji¾ mno¾ina pouze jednoprvková, dále +nepokraèujeme v dìlení a zbývající prvek vlo¾íme jako list. Hodnoty (data) jsou +tak ulo¾eny v listech a ve vnitøích uzlech jsou znaèky. + +\s{Pøíklad:} + +\nosizefigure{trie.eps}{Trie. Ohodnocení hran je pouze pro názornost -- není +souèástí trie.} + +\>Pozorování: +\itemize\ibull +\: Tvar stromu (oznaème ho $T$) je jednozaène urèen vektrorem +$\vec c=(c_1,\ldots,c_r)$. +\: Prvky jsou v trii umístìny vzestupnì zleva doprava. +\endlist + +To je sice v¹echno moc pìkné, ale pro aplikaci v Q-Heapech budeme muset umìt +poèítat $\rank_\X(x)$ v konstatním èase. Jak tedy na to? + +\s{Lemma 1:} $\rank_\X(x)$ je urèen jednoznaènì: +\numlist\pnromanp +\: stromem $T$ +\: èíslem $i$: x vede v $T$ do $x_i$ +\: vztahem mezi $x$ a $x_i$ -- my¹leno vzhledem k relacím $<,>,=$ +\: $\msb(x \oplus x_i)$ +\endlist + +\s{Zdùvodnìní.} Pokud $x=x_i$, tak zjevnì $\rank_\X(x) = i$. Nech» tedy $x\neq +x_i$. Hodnoty znaèek klesají ve smìru od koøene k +listùm a na cestì od koøene k $x_i$ se v¹echny bity v $x_i$ na pozicích urèených +znaèkami shodují s bity v $x$ -- tak jsme k danému $x$ ve (ii) vybrali $x_i$. +Vezmeme do ruky $x$ a vydáme se na cestu od koøene do místa, kde bychom +oèekávali $x$, kdyby v trii bylo. Jeliko¾ $\msb(x \oplus x_i)$ urèitì není +znaèka na cestì z koøene do $x_i$ (v tom pøípadì by cesta podle znaèek nevedla +do $x_i$ -- $x$ se na této pozici od $x_i$, vydali bychom se tedy do opaèné +(shodující) vìtve), tak na této cestì je $\msb(x \oplus x_i)$ ostøe mezi +nìjakými znaèkami, co¾ mi urèí hranu -- breakpoint, pod kterou u¾ jsou v¹echny +hodnoty v listech buï men¹í (pokud $x>x_i$), nebo vìt¹í (pokud $xx_i$, tedy celý podstrom je men¹í ne¾ $x$ a tudí¾ $\rank_\X(011001)=4$. + +\s{Znaèení:} +\itemize\ibull +\: $\B = \{c_1,\ldots,c_k\}$ +\: $\varphi: \{1,\ldots,k\} \to \B, \varphi(i):=c_i$ +\endlist + +\s{Lemma 1':} $\rank_\X(x)$ lze spoèítat v konstatním èase z: +\numlist\pnromanap +\: $\B,\varphi$ -- tyto objekty urèují strom $T$ +\: $\equiv$ (ii), tj. èísla $i$: x vede v $T$ do $x_i$ +\: $\equiv$ (iii), tj. vztahu mezi $x$ a $x_i$ -- my¹leno vzhledem k relacím +$<,>,=$ +\: $\rank_\B(\msb(x \oplus x_i))$ +\endlist +a v¹echny vý¹e uvedené body lze té¾ spoèítat v konstatním èase. + +\s{Zdùvodnìní.} + +\numlist\pnromanap +\: Nic se nepoèítá, tak je strom ulo¾en. +\: +\endlist + +\>A teï konkrétnì, jak bude Q-Heap realizována: + +\>Pamatujeme si: +\itemize\ibull +\: $\check x_1,\ldots,\check x_2$, hodnoty v libovolném poøadí +\: $\rho:$ permutace na $\{1,\ldots,k\}$ urèující $x_i = \check x_{\rho(i)}$ pro +$1 \le i \le r$, platí $x_1 < \ldots < x_r$ +\: $r$, poèet prvkù +\: $B$, mno¾ina ``zajímavých'' bitových pozic, reprezentovaná jako vektor +\: $R$, vektor popisující funkci $\varphi: \{1,\ldots,k\} \to \{1,\ldots,k\}$, t.¾. +$B[\varphi(i)] = c_i$ +\endlist + +\> A teï si ji¾ uká¾eme dvì základní operace -- {\it insert} a {\it delete}. + +\s{Insert(x)} + +\algo +\: $i = \rank_\X(x)$ +\: porovnáme $x,x_i$ +\: zaøadíme $x$ do $x_1,\ldots,x_r, r++$ +\: spoèítáme $c_i',c_{i+1}'$ +\: update $B,R$ +\endalgo + +\s{Delete(x)} + +\algo +\: $i = \rank_\X(x)$, pøedpokládáme $x=x_i$, tedy ¾e prvek v haldì je +\: sma¾eme $x_i$ (uvolnìní $\check x_{\rho(i)}$, se¹oupnutí $\rho$); $r--$ +\: rozhodneme, jestli zmizí $c_i$, nebo $c_{i+1}$ +\: update $B$ (dle výsledku pøedchozího kroku), update $R$ (se¹oupnutí) +\endalgo + + + +\h{Union-Find problem} +Na Uion-Find problem (UF) mù¾eme nahlí¾et ze více stran (udr¾ování ekvivalencí, +inkrementální souvislost grafu). K èemu je to dobré? +Napøíklad v Kruskalovì algoritmu pro hledání minimálních koster v grafu. +\h{Udr¾ování tøíd ekvivalence } +Mìjme nìjakou mno¾inu M, která se dá rozlo¾it na k ekvivalentních podmon¾in (tøídy ekvivalence). Na mno¾iòe M chceme provádìt +dvì operace: jsou p,q z M ekvivalentní (ve stejné tøídì ekvivalence)? (find(p,q)) Dále chceme umìt spojit dvì tøídy ekvivalence do jedné (union(p,q)). +\h{Inkrementální idr¾ování komponent souvislosti grafu} +Jedná se o pøipad podobný udr¾ování tøíd ekvivalence. Tentokrát mnou¾inou M bude mno¾ina vrcholù V grafu G (V,E). +Za »øídy ekvivalence budou jednotlivé komponenty souvislosti grafu G. Operace find nám øekne o dvou vrcholech nachází-li +se ve stejné komponen»e, èi nikoliv. Operace union nám spojí dvì komponenty do jedné pøidáním hrany. Pokud pøipustíme mazání hran, +øe©ení problému je výraznì te¾¹í. + +\h{Bì¾ná implementace } +Ka¾dé tøídì ekvivalence pøiøadíme unikátní barvu, kterou obarvíme její prvky. Pro operaci find staèí porovnat barvy prvkù. +Pro operaci union dvou komponent je nutné pøebarvit obì na stejnou barvu. Budeme pøebarvovat +v¾dy tu men¹í pak celková operace union bude trvat $\O(n\log(n) + m)$. (Ka¾dé pøebarvení minimálnì zdvojnásobí velikost nové komponenty.) +\h {Chytøej¹í implementace } +Budeme-li prvky za stejné tøídy reprezentovat ve jednom stromì (synové mají ukazatel svého otce), operaci find +provedeme prùchodem ze zadaných prvkù do koøene. Prvky jsou ve stejné komponentì souvislosti, pokud mají stejného otce. +Operace union bude spojení dvou stromù do jednoho (otec jednoho stromu se zavìsí pod listy druhého). +Takto definovaný union nemusí garantovat logaritmickou slo¾itost pro find, +v extrémním pøipadì mù¾e strom mít lineární hloubku vzhledem k poètu vrcholù. + +Degeneraci stromu lze zabránit pøidánim podmínky urèující, jaký strom bude dole. +První mmo¾nost (union by size) je povìsit dolu vìtsí strom. +Druhá mo¾nost (union by rank) je ka¾dému vrcholu nastavit na zaèátku nìjaký rank (tøeba 1). Pokud je $r1 -0.187500 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +1.466381 17.802404 mt 2.345893 18.331207 2.776549 19.108648 2.758349 20.134729 ct +2.740149 21.160810 2.282193 21.922491 1.384481 22.419769 ct +0.486769 22.917048 -0.401843 22.901287 -1.281355 22.372484 ct +-2.160867 21.843681 -2.591523 21.066240 -2.573323 20.040159 ct +-2.555124 19.014078 -2.097167 18.252398 -1.199455 17.755119 ct +-0.301743 17.257841 0.586869 17.273602 1.466381 17.802404 ct +cp +st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +-18.456327 7.733937 mt -17.576815 8.262739 -17.146158 9.040180 -17.164358 10.066261 ct +-17.182558 11.092341 -17.640514 11.854021 -18.538227 12.351300 ct +-19.435938 12.848579 -20.324551 12.832818 -21.204063 12.304016 ct +-22.083574 11.775214 -22.514231 10.997772 -22.496031 9.971691 ct +-22.477831 8.945610 -22.019875 8.183930 -21.122162 7.686651 ct +-20.224451 7.189373 -19.335838 7.205134 -18.456326 7.733937 ct +st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +21.761526 7.591147 mt 22.641037 8.119949 23.071693 8.897390 23.053493 9.923470 ct +23.035294 10.949551 22.577337 11.711230 21.679626 12.208509 ct +20.781916 12.705789 19.893303 12.690026 19.013792 12.161224 ct +18.134281 11.632422 17.703625 10.854981 17.721825 9.828901 ct +17.740025 8.802821 18.197981 8.041142 19.095692 7.543863 ct +19.993402 7.046584 20.882015 7.062346 21.761526 7.591148 ct +cp +st +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -20.611444 8.823664] concat +<34> -0.093750 0.000000 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 19.653284 8.665249] concat +<30> -0.140625 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 -14.049660 16.302305] concat +<30> -0.140625 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -5.202597 6.234410] concat +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +-32.450947 1.378704 mt -31.571434 1.907506 -31.140778 2.684948 -31.158978 3.711029 ct +-31.177177 4.737109 -31.635134 5.498789 -32.532845 5.996068 ct +-33.430557 6.493347 -34.319172 6.477585 -35.198685 5.948783 ct +-36.078197 5.419981 -36.508850 4.642540 -36.490650 3.616459 ct +-36.472450 2.590378 -36.014492 1.828698 -35.116783 1.331419 ct +-34.219070 0.834141 -33.330460 0.849902 -32.450947 1.378704 ct +cp +st +gr +gs +np -10.068375 -0.049444 0 0 360 a fi +gr +gs +np -6.633695 5.234682 0 0 360 a fi +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -2.573743 20.087435 mt -19.938143 12.683045 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np 2.758769 20.087435 mt 20.263569 12.539552 lt st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +-4.973590 1.521519 mt -4.094078 2.050321 -3.663422 2.827762 -3.681622 3.853843 ct +-3.699821 4.879923 -4.157777 5.641603 -5.055490 6.138882 ct +-5.953202 6.636161 -6.841814 6.620399 -7.721326 6.091598 ct +-8.600838 5.562796 -9.031494 4.785354 -9.013294 3.759273 ct +-8.995094 2.733192 -8.537138 1.971513 -7.639426 1.474234 ct +-6.741714 0.976955 -5.853102 0.992717 -4.973590 1.521519 ct +cp +st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -22.487061 10.242557 mt -33.691406 6.326659 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -17.164839 10.088207 mt -6.207046 6.469114 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -34.559189 2.452806] concat +<33> -0.140625 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -7.042770 2.634683] concat +<32> -0.171875 0.000000 3.514598 F1 fsd sms +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +-39.923939 -5.181332 mt -46.307327 -5.196621 lt +-46.330128 -0.915765 lt +-39.946732 -0.900477 lt +-39.923939 -5.181332 lt +cp +st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +-23.667276 -5.142708 mt -29.935055 -5.157720 lt +-29.957441 -0.954395 lt +-23.689655 -0.939383 lt +-23.667276 -5.142708 lt +cp +st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +-10.162128 -4.987214 mt -15.964506 -5.001111 lt +-15.985232 -1.109894 lt +-10.182846 -1.095996 lt +-10.162128 -4.987214 lt +cp +st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +6.367862 -5.225865 mt -0.148809 -5.241473 lt +-0.172086 -0.871234 lt +6.344593 -0.855626 lt +6.367862 -5.225865 lt +cp +st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +16.236979 -0.014201 mt 9.930801 -0.029305 lt +9.908276 4.199772 lt +16.214462 4.214876 lt +16.236979 -0.014201 lt +cp +st +gr +gs +0.000000 slw +0 slc +0 slj +0.000000 0.000000 0.000000 sclr +np +30.183531 -0.057328 mt 23.748274 -0.072741 lt +23.725286 4.242900 lt +30.160553 4.258314 lt +30.183531 -0.057328 lt +cp +st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -36.487514 3.526047 mt -42.875984 -0.907493 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -31.158558 3.663718 mt -26.421215 -0.945925 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -9.009760 3.951705 mt -13.113919 -1.103017 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -3.681202 3.806533 mt 2.901950 -0.863872 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np 17.728758 10.074040 mt 12.781023 4.206653 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np 23.045580 10.086838 mt 26.805702 4.250278 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 13.358829 9.376315] concat +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 13.501940 8.519425] concat +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 13.267751 15.802456] concat +<31> -0.296875 0.078125 3.514598 F1 fsd sms +<30> 1.460429 0.078125 3.514598 F1 fsd sms +<30> 3.217734 0.078125 3.514598 F1 fsd sms +<30> 4.975039 0.078125 3.514598 F1 fsd sms +<30> 6.732343 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 -30.380739 9.232978] concat +<30> -0.140625 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 -10.912022 9.232979] concat +<31> -0.296875 0.078125 3.514598 F1 fsd sms +<30> 1.460429 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 -44.075626 1.520980] concat +<30> -0.140625 0.078125 3.514598 F1 fsd sms +<30> 1.616679 0.078125 3.514598 F1 fsd sms +<31> 3.373984 0.078125 3.514598 F1 fsd sms +<31> 5.131289 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 -28.327871 1.378164] concat +<31> -0.296875 0.078125 3.514598 F1 fsd sms +<30> 1.460429 0.078125 3.514598 F1 fsd sms +<31> 3.217734 0.078125 3.514598 F1 fsd sms +<30> 4.975039 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 -14.974368 1.663794] concat +<30> -0.140625 0.078125 3.514598 F1 fsd sms +<30> 1.616679 0.078125 3.514598 F1 fsd sms +<31> 3.373984 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 -0.464829 1.663794] concat +<31> -0.296875 0.078125 3.514598 F1 fsd sms +<30> 1.460429 0.078125 3.514598 F1 fsd sms +<31> 3.217734 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 13.411276 6.805118] concat +<30> -0.140625 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[0.708072 0.000000 0.000000 0.708072 26.110130 6.404341] concat +<31> -0.296875 0.000000 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -44.697861 -4.379025] concat +<78> -0.109375 0.527184 3.514598 F2 fsd sms +<31> 1.899313 0.000000 2.460219 F3 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -44.887436 -2.191694] concat +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -27.992928 -4.379025] concat +<78> -0.109375 0.527184 3.514598 F2 fsd sms +<32> 1.899313 0.000000 2.460219 F3 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -14.412974 -4.402461] concat +<78> -0.109375 0.574059 3.514598 F2 fsd sms +<33> 1.899313 0.046875 2.460219 F3 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 2.029149 -4.379024] concat +<78> -0.109375 0.527184 3.514598 F2 fsd sms +<34> 1.899313 0.000000 2.460219 F3 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 12.221286 0.596057] concat +<78> -0.109375 0.574059 3.514598 F2 fsd sms +<35> 1.899313 0.046875 2.460219 F3 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 25.515060 0.596062] concat +<78> -0.109375 0.574059 3.514598 F2 fsd sms +<36> 1.899313 0.046875 2.460219 F3 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -87.695099 -0.026288] concat +<78> -0.109375 21.661648 3.514598 F2 fsd sms +<31> 1.899313 21.134462 2.460219 F3 fsd sms +<3d> 4.452261 21.661648 3.514598 F1 fsd sms +<30> 8.162099 21.661648 3.514598 F1 fsd sms +<30> 9.919403 21.661648 3.514598 F1 fsd sms +<30> 11.676708 21.661648 3.514598 F1 fsd sms +<30> 13.434011 21.661648 3.514598 F1 fsd sms +<31> 15.191317 21.661648 3.514598 F1 fsd sms +<31> 16.948620 21.661648 3.514598 F1 fsd sms +<63> 25.735132 21.661648 3.514598 F2 fsd sms +<31> 27.256094 21.134462 2.460219 F3 fsd sms +<3d> 29.809042 21.661648 3.514598 F1 fsd sms +<33> 33.518883 21.661648 3.514598 F1 fsd sms +<78> -0.109375 17.444130 3.514598 F2 fsd sms +<32> 1.899313 16.916946 2.460219 F3 fsd sms +<3d> 4.452261 17.444130 3.514598 F1 fsd sms +<30> 8.162099 17.444130 3.514598 F1 fsd sms +<30> 9.919403 17.444130 3.514598 F1 fsd sms +<31> 11.676708 17.444130 3.514598 F1 fsd sms +<30> 13.434011 17.444130 3.514598 F1 fsd sms +<31> 15.191317 17.444130 3.514598 F1 fsd sms +<30> 16.948620 17.444130 3.514598 F1 fsd sms +<63> 25.735132 17.444130 3.514598 F2 fsd sms +<32> 27.256094 16.916946 2.460219 F3 fsd sms +<3d> 29.809042 17.444130 3.514598 F1 fsd sms +<34> 33.518883 17.444130 3.514598 F1 fsd sms +<78> -0.109375 13.226612 3.514598 F2 fsd sms +<33> 1.899313 12.699428 2.460219 F3 fsd sms +<3d> 4.452261 13.226612 3.514598 F1 fsd sms +<30> 8.162099 13.226612 3.514598 F1 fsd sms +<31> 9.919403 13.226612 3.514598 F1 fsd sms +<30> 11.676708 13.226612 3.514598 F1 fsd sms +<30> 13.434011 13.226612 3.514598 F1 fsd sms +<30> 15.191317 13.226612 3.514598 F1 fsd sms +<31> 16.948620 13.226612 3.514598 F1 fsd sms +<63> 25.735132 13.226612 3.514598 F2 fsd sms +<33> 27.256094 12.699428 2.460219 F3 fsd sms +<3d> 29.809042 13.226612 3.514598 F1 fsd sms +<32> 33.518883 13.226612 3.514598 F1 fsd sms +<78> -0.109375 9.009094 3.514598 F2 fsd sms +<34> 1.899313 8.481911 2.460219 F3 fsd sms +<3d> 4.452261 9.009094 3.514598 F1 fsd sms +<30> 8.162099 9.009094 3.514598 F1 fsd sms +<31> 9.919403 9.009094 3.514598 F1 fsd sms +<30> 11.676708 9.009094 3.514598 F1 fsd sms +<31> 13.434011 9.009094 3.514598 F1 fsd sms +<30> 15.191317 9.009094 3.514598 F1 fsd sms +<31> 16.948620 9.009094 3.514598 F1 fsd sms +<63> 25.735132 9.009094 3.514598 F2 fsd sms +<34> 27.256094 8.481911 2.460219 F3 fsd sms +<3d> 29.809042 9.009094 3.514598 F1 fsd sms +<35> 33.518883 9.009094 3.514598 F1 fsd sms +<78> -0.109375 4.791576 3.514598 F2 fsd sms +<35> 1.899313 4.264393 2.460219 F3 fsd sms +<3d> 4.452261 4.791576 3.514598 F1 fsd sms +<31> 8.162099 4.791576 3.514598 F1 fsd sms +<30> 9.919403 4.791576 3.514598 F1 fsd sms +<30> 11.676708 4.791576 3.514598 F1 fsd sms +<30> 13.434011 4.791576 3.514598 F1 fsd sms +<30> 15.191317 4.791576 3.514598 F1 fsd sms +<30> 16.948620 4.791576 3.514598 F1 fsd sms +<63> 25.735132 4.791576 3.514598 F2 fsd sms +<35> 27.256094 4.264393 2.460219 F3 fsd sms +<3d> 29.809042 4.791576 3.514598 F1 fsd sms +<30> 33.518883 4.791576 3.514598 F1 fsd sms +<78> -0.109375 0.574059 3.514598 F2 fsd sms +<36> 1.899313 0.046875 2.460219 F3 fsd sms +<3d> 4.452261 0.574059 3.514598 F1 fsd sms +<31> 8.162099 0.574059 3.514598 F1 fsd sms +<30> 9.919403 0.574059 3.514598 F1 fsd sms +<30> 11.676708 0.574059 3.514598 F1 fsd sms +<30> 13.434011 0.574059 3.514598 F1 fsd sms +<30> 15.191317 0.574059 3.514598 F1 fsd sms +<31> 16.948620 0.574059 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -78.755089 -2.123083 mt -78.790428 -6.778875 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -78.755089 -2.123083 mt -80.027412 -3.824239 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -78.755089 -2.123083 mt -77.666359 -3.869009 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -69.639580 -2.134195 mt -69.674919 -6.789989 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -69.639580 -2.134195 mt -70.911903 -3.835351 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -69.639580 -2.134195 mt -68.550850 -3.880121 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -79.035385 -9.478876] concat +<35> -0.187500 0.078125 3.514598 F1 fsd sms +<34> 1.569804 0.078125 3.514598 F1 fsd sms +<33> 3.327109 0.078125 3.514598 F1 fsd sms +<32> 5.084414 0.078125 3.514598 F1 fsd sms +<31> 6.841718 0.078125 3.514598 F1 fsd sms +<30> 8.599022 0.078125 3.514598 F1 fsd sms +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -99.847923 -13.545489] concat +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -79.583458 26.178902 mt -79.583458 -1.714646 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -77.825142 26.156439 mt -77.825142 -1.737108 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -70.790810 26.100727 mt -70.790810 -1.792821 lt st +gr +gs +0.000000 0.000000 0.000000 sclr +0.000000 slw +0 slc +0 slj +np -69.032494 26.078264 mt -69.032494 -1.815282 lt st +gr +gs +np 32.858963 2.257412 0 0 360 a fi +gr +gs +0.000000 0.000000 0.000000 sclr +[1.000000 0.000000 0.000000 1.000000 -13.082013 7.682764] concat +<0f> -0.203125 -0.203125 3.514598 F4 fsd sms +gr +showpage + +%%Trailer +%%DocumentSuppliedResources: procset VrrEPSProcSet +%%+ font CMR10 CMMI10 CMR7 CMSY10 +end restore +%%EOF diff --git a/8-qheapuf/trie.vrr b/8-qheapuf/trie.vrr new file mode 100644 index 0000000..e03389f --- /dev/null +++ b/8-qheapuf/trie.vrr @@ -0,0 +1,125 @@ + + (document 0.6 ( (filename "/home/cs/school/semgraf/trie.vrr") (name "Untitled 1")) ( + (page ( (tex_footer "\\bye +") (tex_header "\\nopagenumbers\\vglue0pt +") (name "Page 1")) ( + (segment (coords -69.6395797729492 -2.13419485092163) (coords -69.674919128418 -6.78998899459839) ( (id 137262032) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords -78.7550888061523 -2.12308263778687) (coords -78.7904281616211 -6.77887487411499) ( (id 137141008) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords 30.1835308074951 -0.0573275834321976) (coords 23.7482738494873 -0.0727405324578285) ( (id 137141368) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords 16.2369785308838 -0.0142008448019624) (coords 9.93080139160156 -0.029304638504982) ( (id 137190760) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords 6.3678617477417 -5.22586536407471) (coords -0.148809269070625 -5.24147319793701) ( (id 137190160) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords -10.1621284484863 -4.98721361160278) (coords -15.964506149292 -5.00111055374146) ( (id 137142536) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords -23.6672763824463 -5.14270782470703) (coords -29.9350547790527 -5.15772008895874) ( (id 137190384) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords -39.9239387512207 -5.18133211135864) (coords -46.3073272705078 -5.19662094116211) ( (id 137190984) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (ellipse-by-center-point-rotation-eccentricity (coords -6.34745788574219 3.80655813217163) (coords -4.97359085083008 1.52151823043823) 0.0 0.0 ( (id 137209384) (conic (point-entire)) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (ellipse-by-center-point-rotation-eccentricity (coords -33.8248138427734 3.66374373435974) (coords -32.4509468078613 1.37870383262634) 0.0 0.0 ( (id 137143464) (conic (point-entire)) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (ellipse-by-center-point-rotation-eccentricity (coords 20.387659072876 9.87618637084961) (coords 21.7615261077881 7.59114742279053) 0.0 0.0 ( (id 137215608) (conic (point-entire)) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (ellipse-by-center-point-rotation-eccentricity (coords -19.8301944732666 10.0189762115479) (coords -18.4563274383545 7.73393630981445) 0.0 0.0 ( (id 137141632) (conic (point-entire)) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (ellipse-by-center-point-rotation-eccentricity (coords 0.0925129652023315 20.0874443054199) (coords 1.46638071537018 17.8024044036865) 0.0 0.0 ( (id 137211072) (conic (point-entire)) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (start 137262032) (coords -70.9119033813477 -3.83535146713257) ( (id 137143944) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (start 137141008) (coords -80.0274124145508 -3.8242392539978) ( (id 137191720) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137141368) (coords 23.7252864837646 4.24289989471436) ( (id 137192200) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137190760) (coords 9.90827560424805 4.19977235794067) ( (id 137188648) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137190160) (coords -0.17208631336689 -0.871234357357025) ( (id 137189416) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137142536) (coords -15.9852323532105 -1.10989367961884) ( (id 137189896) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137190384) (coords -29.9574413299561 -0.954394519329071) ( (id 137211568) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137190984) (coords -46.3301277160645 -0.915765464305878) ( (id 137191432) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (parametric-point 137209384 0.405458569526672 ( (id 137265192) (name "noname"))) + (parametric-point 137209384 0.655175507068634 ( (id 137265064) (name "noname"))) + (parametric-point 137209384 0.163842514157295 ( (id 137264936) (name "noname"))) + (parametric-point 137143464 0.405877113342285 ( (id 137264808) (name "noname"))) + (parametric-point 137143464 0.672067046165466 ( (id 137264680) (name "noname"))) + (parametric-point 137143464 0.16384245455265 ( (id 137264552) (name "noname"))) + (parametric-point 137215608 0.421253889799118 ( (id 137222184) (name "noname"))) + (parametric-point 137215608 0.65202271938324 ( (id 137210952) (name "noname"))) + (parametric-point 137215608 0.176431387662888 ( (id 137209904) (name "noname"))) + (parametric-point 137141632 0.420289427042007 ( (id 137140160) (name "noname"))) + (parametric-point 137141632 0.65048223733902 ( (id 137210648) (name "noname"))) + (parametric-point 137141632 0.16797699034214 ( (id 137183584) (name "noname"))) + (parametric-point 137211072 0.663844585418701 ( (id 137208592) (name "noname"))) + (parametric-point 137211072 0.163843438029289 ( (id 137138784) (name "noname"))) + (segment (end 137192200) (coords 30.1605529785156 4.25831365585327) ( (id 137215112) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137188648) (coords 16.2144622802734 4.21487617492676) ( (id 137212328) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137189416) (coords 6.3445930480957 -0.855626404285431) ( (id 137213096) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137189896) (coords -10.1828460693359 -1.09599649906158) ( (id 137213864) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137211568) (coords -23.6896553039551 -0.939382672309875) ( (id 137214632) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (end 137191432) (coords -39.9467315673828 -0.9004767537117) ( (id 137210320) (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (parametric-point 137215112 0.478677123785019 ( (id 137183272) (name "noname"))) + (parametric-point 137212328 0.455544263124466 ( (id 137183408) (name "noname"))) + (parametric-point 137213096 0.471718221902847 ( (id 137184176) (name "noname"))) + (parametric-point 137213864 0.494850397109985 ( (id 137138936) (name "noname"))) + (parametric-point 137214632 0.56419050693512 ( (id 137217024) (name "noname"))) + (parametric-point 137210320 0.541113555431366 ( (id 137209272) (name "noname"))) + (top-level-group ( (name "top-level-group")) ( + (point (coords 32.8589630126953 2.25741171836853) ( (invisible #f) (name "noname"))) + (segment (coords -69.0324935913086 26.0782642364502) (coords -69.0324935913086 -1.8152824640274) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords -70.7908096313477 26.1007270812988) (coords -70.7908096313477 -1.79282057285309) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords -77.8251419067383 26.1564388275146) (coords -77.8251419067383 -1.73710787296295) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (segment (coords -79.5834579467773 26.1789016723633) (coords -79.5834579467773 -1.71464598178864) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -99.8479232788086 -13.5454893112183) "" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (group ( (name "noname")) ( + (tex-text (coords -73.9311904907227 -8.2445011138916) "543210" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (group ( (name "noname")) ( + (segment (start 137143944) (coords -68.5508499145508 -3.88012075424194) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137143944 137262032)) + (group ( (name "noname")) ( + (segment (start 137191720) (coords -77.6663589477539 -3.86900854110718) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137191720 137141008)))) + (tex-text (coords -70.1075286865234 11.9764108657837) "\\halign{\\indent$#$\\quad\\quad&$#$\\cr +x_1=000011 & c_1=3\\cr +x_2=001010 & c_2=4\\cr +x_3=010001 & c_3=2\\cr +x_4=010101 & c_4=5\\cr +x_5=100000 & c_5=0\\cr +x_6=100001 & \\cr +} +" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 27.0975303649902 1.66434144973755) "$x_6$" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 13.7881298065186 1.66433656215668) "$x_5$" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 3.62724280357361 -3.3341817855835) "$x_4$" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -12.8305053710938 -3.33418154716492) "$x_3$" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -26.4260845184326 -3.33418273925781) "$x_2$" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -44.8874359130859 -2.1916937828064) "" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -43.1700782775879 -3.33418273925781) "$x_1$" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 26.525016784668 7.23411321640015) "1" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 13.931266784668 7.66254901885986) "0" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 1.19435501098633 2.52122473716736) "101" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -13.2598657608032 2.52122473716736) "001" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -25.9967517852783 2.23559522628784) "1010" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -41.7389755249023 2.37841057777405) "0011" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -9.82520008087158 10.0904102325439) "10 +" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -29.8607482910156 10.0904092788696) "0" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 16.221019744873 16.6598873138428) "10000" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 13.5019397735596 8.51942539215088) "" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords 13.3588285446167 9.37631511688232) "" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) 137183272 + (segment (center 137209904) (center 137183272) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137209904 137183408 + (segment (center 137210952) (center 137183408) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137210952 137184176 + (segment (center 137264936) (center 137184176) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137264936 137138936 + (segment (center 137265064) (center 137138936) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137265064 137217024 + (segment (center 137264552) (center 137217024) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137264552 137209272 + (segment (center 137264680) (center 137209272) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137264680 + (path ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname")) ( 137141368 137192200 137215112 + (segment (end 137215112) (coords 30.1835308074951 -0.0573275834321976) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))))) + (path ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname")) ( 137190760 137188648 137212328 + (segment (end 137212328) (coords 16.2369785308838 -0.0142008448019624) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))))) + (path ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname")) ( 137190160 137189416 137213096 + (segment (end 137213096) (coords 6.3678617477417 -5.22586536407471) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))))) + (path ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname")) ( 137142536 137189896 137213864 + (segment (end 137213864) (coords -10.1621284484863 -4.98721361160278) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))))) + (path ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname")) ( 137190384 137211568 137214632 + (segment (end 137214632) (coords -23.6672763824463 -5.14270782470703) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))))) + (path ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname")) ( 137190984 137191432 137210320 + (segment (end 137210320) (coords -39.9239387512207 -5.18133211135864) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))))) + (tex-text (center 137209384) "2" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (center 137143464) "3" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) 137265192 + (segment (center 137183584) (center 137265192) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137183584 137264808 + (segment (center 137210648) (center 137264808) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137210648 137209384 + (parametric-point 137143464 0.329653769731522 ( (name "noname"))) 137222184 + (segment (center 137138784) (center 137222184) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137138784 137140160 + (segment (center 137208592) (center 137140160) ( (stroke-cap (cap-style butt)) (stroke-join (join-style miter)) (stroke-width 0.0) (stroke-color (rgb 0 0 0)) (fill-color (rgba 0 0 0 0)) (invisible #f) (name "noname"))) 137208592 + (point (coords -6.63369464874268 5.23468208312988) ( (invisible #f) (name "noname"))) + (point (coords -10.0683746337891 -0.0494439601898193) ( (invisible #f) (name "noname"))) 137143464 + (tex-text (coords -5.20259666442871 6.23440980911255) "" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (coords -13.5296688079834 17.1597366333008) "0" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.708072125911713 0.0 0.0 0.708072125911713)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (center 137215608) "0" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) + (tex-text (center 137141632) "4" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 1.0 0.0 0.0 1.0)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))) 137215608 137141632 137211072 + (tex-text (coords 0.235624194145203 19.9446296691895) "5" ( (relative-position-x 0.5) (relative-position-y 0.5) (absolute-shift-x 0.0) (absolute-shift-y 0.0) (alignment-x (alignment-x ref-relative)) (alignment-y (alignment-y bbox-relative)) (transform (transform 0.993641078472137 0.0 0.0 0.993641078472137)) (fill-color (rgb 0 0 0)) (invisible #f) (name "noname"))))))))) \ No newline at end of file diff --git a/9-suffix/9-suffix.tex b/9-suffix/9-suffix.tex new file mode 100644 index 0000000..1d0d024 --- /dev/null +++ b/9-suffix/9-suffix.tex @@ -0,0 +1,229 @@ +\input ../sgr.tex + +\def\leaderfill{\leaders\hbox to .5em{\hss.\hss}\hfill} +\def\itemitemitem{\par\indent\indent \hangindent3\parindent \textindent} +\dimen0 = \hsize +\divide \dimen0 by 6 +\def\vs#1#2{#1~{\rm vs.}~#2} + +\prednaska{9}{Suffixové stromy} {Tomá¹ Mikula \& Jan Král} + +\s {Definícia:} +\+\indent&\hbox to \dimen0 {$\Sigma$\leaderfill}&koneèná abeceda (mno¾ina znakov)\cr +\+&$\Sigma^*$\leaderfill&mno¾ina v¹etkých slov nad $\Sigma$\cr +\+&$\epsilon$\leaderfill&prázdne slovo\cr +\+&$\alpha\beta$\leaderfill&zre»azenie slov $\alpha,\beta\in\Sigma^*$\cr +\+&$\alpha^n$\leaderfill&$n=0: \alpha^0=\epsilon$\cr +\+&&$n>0: \alpha^n=\alpha\alpha^{n-1}$\cr +\+&$\alpha^{\rm R}$\leaderfill&slovo $\alpha$ odzadu\cr +\settabs\+\indent&$\alpha$ je {\it (vlastným) podslovom} $\beta$ &\cr +\+&$\alpha$ je {\it (vlastným) prefixom} $\beta$ &$\equiv \exists\gamma(\not=\epsilon):\beta=\alpha\gamma$\cr +\+&$\alpha$ je {\it (vlastným) sufixom} $\beta$ &$\equiv \exists\gamma(\not=\epsilon):\beta=\gamma\alpha$\cr +\+&$\alpha$ je {\it (vlastným) podslovom} $\beta$ &$\equiv \alpha$ je prefixom nejakého sufixu $\beta$ (a $\alpha\not=\beta$)\cr + +\h{Trie} +\s{Definícia:} {\it Trie ($\Sigma$-strom)} pre $X\subset\Sigma^*, \vert X\vert<\infty$ je orientovaný graf $G(V,E)$:\par +$V = \lbrace\alpha\vert\alpha\hbox{ je prefixom nejakého }\beta\in X\rbrace$\par +$(\alpha,\beta)\in E \equiv \exists x\in\Sigma:\beta=\alpha x$\par + +\s{Pozorovanie:} Trie je strom s koreòom $\epsilon$. Listy sú slová z $X$, ktoré nie sú vlastným prefixom iných slov z $X$. + +\s{Definícia:} {\it Komprimovaná trie ($\Sigma^+$-strom)} vznikne z trie nahradením nevetviacich sa ciest hranami (oznaèenými zre»azením znakov príslu¹nej cesty). + +Vrcholom, ktoré padli za obe» kompresii budeme hovori» {\it skryté vrcholy}.\par +Mô¾e sa sta», ¾e nejakému slovu z $X$ odpovedá skrytý vrchol. Aby sme sa tomuto vyhli, pridáme na koniec ka¾dého slova ¹peciálny znak $\$\notin\Sigma$. Teraz platí\par +\s{Pozorovanie:} Listy (komprimovanej) trie sú práve slová z $X$. + +\tabskip=0pt plus 1fil +\halign to\hsize{ +\hfil#\hfil&\hfil#\hfil&\hfil#\hfil\cr +\epsfbox{trie.eps}&\epsfbox{trie-c.eps}&\epsfbox{trie-cd.eps}\cr +Trie pre $\{\hbox{AULA, AUTO, AUTOBUS, BUS}\}$ & \dots komprimovaná & \dots odolarovaná\cr +} +\smallskip + +\h{Sufixové stromy} +\s{Definícia:} {\it Sufixový strom} pre slovo $\sigma\in\Sigma^*$ je komprimovaná trie pre $X=\lbrace {\rm sufixy~}\sigma\rbrace$. + +\s{Pozorovanie:} Listy sú sufixy $\sigma$, ktoré nie sú prefixom iného sufixu. Po pridaní znaku \$ na koniec ka¾dého sufixu sú listy práve v¹etky sufixy. Vnútorné vrcholy sú {\it vetviace podslová} $\sigma$ (tj. $\alpha$ podslová $\sigma$, ktoré sú prefixom aspoò dvoch sufixov a $\alpha x$ je prefixom men¹ieho poètu sufixov pre ka¾dé $x\in\Sigma$). + +V listoch si budeme znaèi» index do $\sigma$, kde daný sufix zaèína. + +\figure{st-barbara.eps}{Sufixový strom pre slovo BARBARA}{0pt} + +\s{Lemma:} Sufixový strom pre slovo $\sigma$ då¾ky $n$ je reprezentovateµný v priestore $\O(n)$.\par +\s{Dôkaz:} Strom má $\O(n)$ listov a ka¾dý vnútorný vrchol má výstupný stupeò aspoò $2$ a teda v¹etkých vrcholov je $\O(n)$. Keï¾e sa jedná o strom, hrán je tie¾ len $\O(n)$. Nálepky na hranách budú reprezentované ako 2 indexy do $\sigma$ oznaèujúce zaèiatok a koniec nejakého úseku odpovedajúceho písmenkám na hrane.\qed + +\s{Veta:} Sufixový strom pre slovo då¾ky $n$ sa dá zostroji» v èase $\O(n)$.\par +\s{Dôkaz:} Budú uvedené 2 kon¹trukcie v lineárnom èase.\qed + +\s{Aplikácie} (alebo èo doká¾eme v èase $\O(n)$):\par +\item{1.} inverzné vyhµadávanie (tj. vyhµadávanie µubovoµného výrazu v predspracovanom texte (nie predspracovaného výrazu (napr. koneèný automat) v µubovoµnom texte)) +\itemitem{-}v¹etky výskyty; ak u¾ máme strom postavený, doká¾eme nájs» v¹etkých $k$ výskytov podslova då¾ky $m$ v èase $\O(m+k)$ (vo vnútorných vrcholoch si budeme naviac udr¾iava» pointre na lexikograficky najmen¹í a najväè¹í list podstromu a v listoch pointer na ïal¹í list v lex. poradí) +\itemitem{-}poèet výskytov (v ka¾dom vnútornom vrchole budeme ma» predpoèítaný poèet listov, ktoré sa pod ním nachádzajú) +\item{2.} najdlh¹ie opakujúce sa podslovo +\itemitem{$\cong$} najhlb¹ie vetvenie (písmenkovo najhlb¹í vnútorný vrchol) +\item{3.} histogram $k$-podslov (èetnos» slov då¾ky $k$) +\itemitem{-} odre¾eme strom v písmenkovej håbke $k$ a spoèítame odrezané vetvièky +\item{4.}najdlh¹í spoloèný podre»azec slov $\alpha$ a $\beta$ ($LCS(\alpha, \beta)$) +\itemitem{-}postavíme strom pre slovo $\alpha\$_1\beta\$_2$; najhlb¹í vrchol, pod ktorým je $\alpha$-ový i $\beta$-ový sufix ($\$_1$ i $\$_2$) odpovedá $LCS(\alpha,\beta)$ +\item{5.}najdlh¹ie palindromické podslovo ($\beta$ je palindromické $\equiv \beta = \beta^{\rm R}$) +\itemitem{-} Postavíme sufixový strom pre $\alpha\$_1\alpha^R\$_2$. Postupne prechádzame cez v¹etky potenciálne stredy palindromu (je ich $2n-1$) a poèítame: +\itemitemitem{$\bullet$}$LCP(\alpha[i:], \alpha^{\rm R}[n-(i+1):])$, keï uva¾ujeme ako stred palindromu $i$-té písmenko (èíslované od 0) (tj. palindrom nepárnej då¾ky) +\itemitemitem{$\bullet$}$LCP(\alpha[i+1:], \alpha^{\rm R}[n-(i+1)])$, keï uva¾ujeme stred palindromu medzi $i$-tým a $(i+1)$-vým písmenkom (tj. palindrom párnej då¾ky). +\itemitem{}$LCP(\alpha,\beta)$ je najdlh¹í spoloèný prefix $\alpha$ a $\beta$ a v strome je to najhlb¹í spoloèný predchodca ($LCA$) listov odpovedajúcich $\alpha$ a $\beta$. +\itemitem{}Pritom treba ¹ikovne liez» po strome, aby nájdenie ïal¹ej odpovedajúcej si dvojice listov bolo kon¹tantné. +\itemitem{}Na nájdenie $LCA$ pou¾ijeme nejakú ¹truktúru, ktorá to po lineárnom predvýpoète zvládne v kon¹tantnom èase. +\item{6.}Burrows-Wheeler transform (BWT) + +\h{Rekurzívna kon¹trukcia sufixového stromu v lineárnom èase} +\s{Definícia:} {\it Suffix Array} $A$ pre slovo $\sigma$ je permutácia na sufixoch slova $\sigma$, ktorá ich zotriedi lexikograficky:\hfil\break +$\sigma[A[i]:]<_{lex}\sigma[A[i+1]:]$, kde $\sigma[j:]$ znaèí podslovo $\sigma$ poènúc $j$-tým písmenkom a¾ do konca. + +\s{Definícia:} {\it LCP Array} $L$ pre slovo $\sigma$:\hfil\break +$L[i]=\vert LCP(\sigma[A[i]:], \sigma[A[i+1]:])\vert$, kde $LCP(\alpha, \beta)$ je najdlh¹í spoloèný prefix $\alpha$ a $\beta$. + +\s{Definícia:} {\it Kartézsky strom} pre postupnos» kµúèov $x_1\ldots x_n$ je strom, ktorý je haldou podµa hodnôt kµúèov a vyhµadávacím stromom podµa poradia kµúèov v postupnosti. Pritom vrcholy s rovnakou hodnotou, ktoré by spolu susedili, zlúèime do jedného. + +Niektoré vrcholy majú voµné miesta, kde by mohol by» pripojený podstrom. Týmto voµným miestam budeme hovori» {\it voµné sloty}. + +\tabskip=0pt plus 1fil +\halign to\hsize{ +\hfil#\hfil&\hfil#\hfil\cr +\epsfbox{ct-35120024224.eps}&\epsfbox{ct-35120024224-fs.eps}\cr +Kartézsky strom pre $(3,5,1,2,0,0,2,4,2,2,4)$ & \dots s vyznaèenými voµnými slotmi\cr +} +\smallskip + +\s{Lemma:} Kartézsky strom pre $x_1\ldots x_n$ sa dá postavi» v èase $\O(n)$.\qed +\s{Lemma:} Sufixový strom (ST) pre $\sigma$ a $(A,L)$ pre $\sigma$ sú lineárne izomorfné.\par +\s{Dôkaz:}\par +${\rm ST}\longrightarrow(A,L)$: +\itemitem{}Prechádzame strom zµava doprava (tj. lexikograficky). V¾dy, keï sme v liste, opí¹eme do $A[i]$ index do $\sigma$, ktorý sme v liste na¹li; $i$ inicializujeme na $-1$ a pri ka¾dej náv¹teve listu zväè¹ujeme o $1$ (e¹te pred zápisom do $A[i]$). +\itemitem{}Medzi náv¹tevou 2 susedných listov v¾dy najskôr stúpame a potom sa znova ponoríme. Najvy¹¹í vrchol, po ktorý sme vystúpili medzi náv¹tevou listov $\alpha$ a $\beta$, odpovedá $LCP(\alpha,\beta)$, jeho håbka odpovedá $\vert LCP(\alpha, \beta)\vert$. Do $L[i]$ teda zapí¹eme håbku tohto najhlb¹ieho spoloèného predka, ktorú si poèítame v rekurzii. + +$(A,L)\longrightarrow{\rm ST}$: +\itemitem{}Staviame kartézsky strom pre $L$ a do voµných slotov privesujeme listy. Tento strom má tvar sufixového stromu pre $\sigma$. Indexy v listoch urèujeme podµa $A$. Nálepky na hranách urèujeme podµa indexov v listoch podstromu a (písmenkovej) håbky vrcholov (ktorú pre vnútorné vrcholy máme v $L$ a pre listy vypoèítame ako $\vert\sigma\vert - A[i]$).\qed + +\medskip +Ná¹ algoritmus bude kon¹truova» $(A,L)$, ktoré u¾ teraz vieme v lineárnom èase previes» na sufixový strom. + +\algo +\:(Z abecedy vyhodíme nepou¾ité znaky.) +\itemitem{}Pou¾ité znaky zotriedime priehradkovým triedením v èase $\O(n)$ a premenujeme na $1,\ldots,n'$, $n'\le n$. + +\:Definujeme slová $\sigma_0$, $\sigma_1$, $\sigma_2$ nasledujúcim spôsobom: +%\settabs\+\itemitemitem{}&$\sigma_2[i] := (\sigma[3i+2],$ &$\sigma[3i+3],$ &$\sigma[3i+4])$\cr +$$\eqalign{ +\sigma_0[i] &:= (\sigma[3i],\sigma[3i+1],\sigma[3i+2])\cr +\sigma_1[i] &:= (\sigma[3i+1],\sigma[3i+2],\sigma[3i+3])\cr +\sigma_2[i] &:= (\sigma[3i+2],\sigma[3i+3],\sigma[3i+4])\cr +}$$ +\itemitem{}$\sigma_0$, $\sigma_1$, $\sigma_2$ sú slová då¾ky $\approx{n\over3}$ nad abecedou $[n']^3$. (Opä» ale z nej pou¾ijeme najviac $n$ znakov.) + +\:Zavoláme sa rekurzívne na $\sigma_0\sigma_1$, získame $(A_{01},L_{01})$. Z $A_{01}$ doká¾eme jedným priechodom vyrobi» $A_0$, $A_1$, $A_{01}^{-1}$. ($A_{01}^{-1}$ je inverzná permutácia k $A_{01}$) + +\:Dopoèítame $A_2$.\par +\itemitem{}Vyu¾ijeme, ¾e $\sigma_2[i:]\approx\sigma[3i+2:]=\sigma[3i+2]\sigma[3i+3:]\approx\sigma[3i+2]\sigma_0[i+1:]$. +\itemitem{}Pre slová $\sigma_2[i:]\approx\sigma[3i+2]\sigma_0[i+1:]$ máme usporiadanie podµa druhej èasti (tj. podµa $\sigma_0[i+1:]$) v $A_0$. V tomto poradí ich nahád¾eme do priehradok podµa prvého znaku prvého znaku (tj. podµa $\sigma[3i+2]$) a vysypeme do $A_2$. + +\:$A_0,A_1,A_2\buildrel merge\over\longrightarrow A$ +\itemitem{}Nech $a$, $b$, $c$, sú aktuálne pozície v $A_0$, $A_1$, $A_2$ (v tomto poradí) pri zlievaní. Nech $i=A_0[a]$, $j=A_1[b]$, $k=A_2[c]$. Potrebujeme porovna» slová $\sigma_0[i:]$, $\sigma_1[j:]$, $\sigma_2[k:]$ v kon¹tantnom èase. +$$\eqalign{ +\sigma_0[i:] < \sigma_1[j:] &\equiv A_{01}^{-1}[i] < A_{01}^{-1}[\vert\sigma_0\vert+j]\cr +\sigma_0[i:] < \sigma_2[k:] &\equiv \sigma[3i]\,\sigma_1[i:] < \sigma[3k+2]\,\sigma_0[k+1:]\cr +&\Leftrightarrow (\sigma[3i] < \sigma[3k+2]) \vee (\sigma[3i] = \sigma[3k+2] \wedge \sigma_1[i:] < \sigma_0[k+1:])\cr +\sigma_1[j:]<\sigma_2[k:] &\equiv \sigma[3j+1]\,\sigma[3j+2]\,\sigma_0[j+1:] < \sigma[3k+2]\,\sigma[3k+3]\,\sigma_1[k+1:] +}$$ + +\:Dopoèítame $L$. +\itemitem{} Pripomeòme definíciu $L[i]=\vert LCP(\sigma[A[i]:], \sigma[A[i+1]:])\vert$. +\itemitem{} Nech +\tabskip=3\parindent +\halign{\hfil#\tabskip=0pt&#\hfil&#\hfil\cr +$\sigma[A[i]:]$ &$\approx \sigma_0[j:]$,\quad&tj. $A[i]=3j$ pre nejaké $j$,\cr +$\sigma[A[i+1]:]$ &$\approx \sigma_0[k:]$,&tj. $A[i+1]=3k$ pre nejaké $k$.\cr +} +\itemitem{} Oznaème tento prípad $\vs{\sigma_0}{\sigma_0}$. Potom $L[i]=L_{01}[A_{01}^{-1}[A[i] \div 3]]$. +\itemitem{} Prípad $\vs{\sigma_0}{\sigma_1}$ vyrie¹ime rovnako. +\itemitem{} Prípady $\vs{\sigma_1}{\sigma_0}$ a $\vs{\sigma_1}{\sigma_1}$: $L[i]=L_{01}[A_{01}^{-1}[A[i] \div 3 + \vert\sigma_0\vert]]$ +\+\cleartabs\itemitem{} &$\vs{\sigma_2}{\sigma_2}$: &a$)$ lí¹ia sa prvým znakom $\Rightarrow L[i]=0$\cr +\+&&b$)$ $L[i]=1+(\vs{\sigma_0}{\sigma_0})$\cr +\+&$\vs{\sigma_2}{\sigma_0}$: &a$)$ lí¹ia sa prvým znakom $\Rightarrow L[i]=0$\cr +\+&&b$)$ $L[i]=1+(\vs{\sigma_0}{\sigma_1})$\cr +\+&$\vs{\sigma_2}{\sigma_1}$: &a$)$ lí¹ia sa prvým znakom $\Rightarrow L[i]=0$\cr +\+&&b$)$ lí¹ia sa druhým znakom $\Rightarrow L[i]=1$\cr +\+&&c$)$ $L[i]=2+(\vs{\sigma_1}{\sigma_0})$\cr + +\endalgo + +\s{Odhad èasovej zlo¾itosti}\par +$T(n) = T({2\over3}n) + \O(n) = \O(n)$ + +\h{Ukkonenova inkrementální konstrukce} + +Pomocí Ukkonnenovy konstrukce doká¾eme sestrojit suffixový strom v lineárním èase. Algoritmus je navíc inkrementální, v ka¾dém kroku tak ze stávajícího suffixového stromu ($ST$ pro $\sigma$) vyrobí strom odpovídající roz¹íøenému slovu ($\sigma a$). Vychází pøitom ze stromu pro prázdné slovo (prázdný strom), který postupnì roz¹iøuje. + +Roz¹íøení suffixového stromu doká¾e algoritmus provést v amortizovanì konstantním èase. + +\s{Pozorování:}Následující pozorování platí pro roz¹iøování suffixového stromu pro $\sigma$ na suffixový strom pro $\sigma a$: +\numlist\ndotted +\:Pokud bylo slovo vìtvící v $\sigma$, pak bude stale vìtvící +\:Pokud byl uzel nevnoøený, bude stále nevnoøený +\:listy zùstávají jako listy (musím na hranu, ktera do nìj vede pøipsat $a$) -- øe¹íme otevøenými hranami (ne nálepka odsud sem, ale odsud dokonce) - slo¾itost - $O(0)$ +\:vnitøní vrcholy $\to$ vnitøní vrcholy +\:Mohou vznikat nové vrcholy (listy i vnitøní), slovo nevìtvící se tak mù¾e stát vìtvícím +\endlist + +\s{Definice:Aktivni suffix ($\alpha(\sigma)$)} nazýváme nejdel¹í vnoøený suffix $\sigma$ + +\s{Lemma:} Pro ka¾dé $\sigma$, $a$ platí: $\alpha(\sigma a)$ je suffixem $\alpha(\sigma)a$ + +\s{Dùkaz:} $\alpha(\sigma a)$, $\alpha(\sigma)a$ jsou suffixy $\sigma a$, z toho plyne, ¾e staèí porovnat délky abychom lemma ovìøili. +Platí: $ \vert\alpha(\sigma a)\vert \le \vert\alpha(\sigma)a\vert$ (pøidáním písmene nemù¾u prodlou¾it prefix o více ne¾ jeden znak). + +\s{Definice:Zralé suffixy} jsou ty prefixy $\alpha$, pro ktere platí: +$\forall \sigma, a,\beta: \beta a$ suffix $\sigma a$ je {\it zralý} právì kdy¾ $ \vert\alpha(\sigma)a\vert \ge \vert\beta a\vert > \vert\alpha(\sigma a)\vert$ + +Update je $O(1)$ amortizovanì na $1$ roz¹íøení $\sigma$ + +$\alpha(\sigma)$ reprezentuji jako kanonický (neexistuje jiný referenèní pár s krat¹ím $\alpha$) referenèní pár $(v, \alpha)$ kde $v$ je vrchol $ST$ a $\alpha$ ke cesta kudy dál. + +\s{Definice: $back[v]$} je nejdel¹í vlastní suffix $v$, ke kterému existuje vrchol. + +\algo +\:Vstup: $\sigma, a, (v, \alpha)$ + +// 1. Zalo¾ení listù/Podrozdìlení hran +\:if $\alpha = \epsilon$: +\::if $\exists (v, a* )$ +\:::konec +\::else: +\:::zalo¾ím list +\:else if $\alpha \ne \epsilon$: +\::if $\exists (v, \alpha a*)$: +\:::konec +\::else: +\:::podrozdìlím hranu na které le¾í $\alpha$ // za $\alpha$ vlo¾ím odboèku na $a$, kam dám list a pokraèuju + +// 2. Pøechod na dal¹í vrchol +\:zkrátim $\alpha$ zleva o znak +\:if $v = \epsilon$: +\::pøejdu do $( \epsilon, \alpha bez 1. znaku)$ +\:else: +\::pøejdu do $( back[v], \alpha )$ + +// 3. +\:kanonikalizuji // "jdu z $v$ pøes alpha do co nejdal" +\endalgo + + +\s{Èasová slo¾itost:} +\numlist\ndotted +\:Zalo¾ení listu/Podrozdìlení hrany -- $O(1)$ +\:Pøechod na dal¹í vrchol -- $O(1)$ za pøedpokladu existence $back(v)$ +\:Kanonikalizace -- amortizovanì za $O(1)$ +\:Update $back[v]$ -- jen pro vnitøní vrcholy, které vznikly v 1. podrozdìlením hrany. "\\bigbreak\\bigbreak\n"; +} +print <=\noindent + +% Sazba algoritmu: +% \algo +% \:krok +% \:krok +% \::vnoreny krok +% \endalgo + +\def\algo{ +\interlistskip +\begingroup +\let\:=\algoitem +\let\*=\algohang +\parskip=1pt plus 1pt minus 0.3pt +\itemcount=0 +} +\def\endalgo{\interlistskip\endgroup} +\def\algoitem{\par +\parindent=2em +\hangindent=4em +\hangafter=1 +\advance\itemcount by 1 +\leavevmode\hbox to 2em{\hss \the\itemcount. }% +\futurelet\next\algoitemh} +\def\algoitemh{\ifx\next:\let\next=\algohang\else\let\next=\relax\fi\next} +\def\algohang:{\advance\hangindent by 2em \hskip 2em\futurelet\next\algoitemh} + +% Nekolikapismenkova promenna (mozno pouzit v textovem i math modu) +\def\<#1>{\hbox{\it #1}} + +% Asymptoticke O-cko +\def\O{{\cal O}} + +% Vlozeni obrazku {obrazek}{popisek}{sirka} +\def\figure#1#2#3{\bigskip\vbox{\centerline{\epsfxsize=#3\epsfbox{#1}}\smallskip\centerline{#2}}\bigskip}