7 \IpeInput{treepic/t#1.ipe}
12 \centerline{\epsfxsize=0.7\hsize\epsfbox{abpic/#1.eps}}
17 \centerline{\epsfxsize=0.4\hsize\epsfbox{abpic/#1.eps}\qquad\epsfxsize=0.4\hsize\epsfbox{abpic/#2.eps}}
21 \prednaska{7}{Vyhledávací stromy}{zapsali M. Øezáè, ©. Masojídek, B. Urbancová}
23 \h{Pár obrázkù, které by stály za pøesun do~pøedchozí kapitoly:}
29 \h{Vyvá¾ené binární vyhledávací stromy}
31 V minulé kapitole jsme se zabývali problematikou pøidávání a ubírání prvkù
32 binárního vyhledávacího stromu a jeho slo¾itostí a zjistili, ¾e v¹e zále¾í
33 na~hloubce stromu. Víme, ¾e chceme hloubku logaritmickou, ale jak ji mù¾eme
34 udr¾et pøi~operacích? Øe¹ením je následující definice:
36 \s{Definice:} {\I Dokonale vyvá¾ení} je takové vyvá¾ení, ve~kterém pro v¹echny vrcholy~$v$ platí $\left\vert \vert L(v)\vert - \vert P(v)\vert \right \vert \leq 1 $.
38 Toto nám jistì zaji¹»uje logaritmickou hloubku, ale je velmi pracné na udr¾ování.
39 Zkusíme proto slab¹í podmínku:
41 \s{Definice:} {\I Hloubkové vyvá¾ení} je takové vyvá¾ení, ve~kterém pro v¹echny vrcholy~$v$ platí $\left \vert h(L(v)) - h(P(v)) \right \vert \leq 1 $.
42 Stromùm s hloubkovým vyvá¾ením se øíká {\I AVL stromy} a platí o nich následující lemma.
44 \s{Lemma:} AVL strom o $n$ vrcholech má hloubku $ \O(\log{n}) $.
47 Uva¾me $a_k = $ minimální poèet vrcholù AVL stromu o~hloubce $k$.
54 a_k &= 1 + a_{k - 1} + a_{k - 2}. \cr
57 Rekurentní vzorec jsme dostali rekurzivním stavìním stromu hloubky $k$: nový koøen a 2 podstromy o hloubce $k - 1$ a $k - 2$.
59 Indukcí doká¾eme, ¾e $ a_k \geq 2^{k \over 2} $.
60 První indukèní krok jsme si u¾ ukázali, teï pro $ k \geq 2 $ platí:
61 $ a_k = 1 + a_{k - 1} + a_{k - 2} > 2^{{k - 1} \over 2} + 2^{{k - 2} \over 2} = 2^{k \over 2} \cdot (2^{-{1 \over 2}} + 2^{-1}) \cong 2^{k \over 2} \cdot 1.21 > 2^{k \over 2} $
63 Tímto jsme dokázali, ¾e na ka¾dé hladinì je minimálnì exponenciálnì vrcholù, co¾ nám zaruèuje hloubku $ \O(\log{n})$
66 \s{Operace s AVL stromy}
68 \<Find> se neli¹í od~operace find v~binárních stromech.
70 Dùraz klademe na operace \<Insert> a \<Delete>, proto¾e pøi~nich musíme o¹etøit udr¾ení struktury AVL~stromù.
72 První nutnou podmínkou je, ¾e si musíme {\I pamatovat stav} v~ka¾dém vrcholu tohoto stromu. A~to {\I vyvá¾ení} hloubky jeho podstromù.
74 Umluvíme~se napø. na~tomto oznaèení:
76 \>Dostaneme tøi typy vrcholù, které se mohou v~AVL~stromu vyskytnout:
78 \:{\I Vrchol typu~$\oplus$}, pokud je pravý podstrom hlub¹í
79 \:{\I Vrchol typu~$\ominus$}, pokud je levý podstrom hlub¹í a
80 \:{\I Vrchol typu~$\odot$ (nulou)}, který má oba syny schodné hloubky.
83 \s {Sestavení} \rm AVL stromu:
85 Postupujeme po~struktuøe binárního stromu od~listù ke~koøeni a~kontrolujeme, zda jsou vrcholy v~jednom ze~tøí uvedených stavù. Pokud ne, opravíme ho operací jménem rotace.
91 Jde o~pøevrácení hrany mezi pùvodním otcem (koøenem podstromu) a nevyvá¾eným vrcholem tak, aby byli i po pøeskupení synové vzhledem k~otcùm správnì uspoøádáni.
94 \s {Insert} \rm - vlo¾ení vrcholu do~AVL~stromu.
96 Vlo¾íme jej jako list. Nový list má v¾dy \uv{znaménko} nula $\odot$. Pøedpokládáme, ¾e patøí nalevo od posledního otce. Podíváme~se na~znaménko jeho otce:
98 \:{\I mìl~$\odot$ (nemìl syna) $\rightarrow$ teï má~$\ominus$}, po struktuøe stromu nahoru posíláme informaci, ¾e se podstrom prohloubil o~1, co¾ mù¾e mít samozøejmì vliv na~znaménka vrcholù na~cestì ke~koøeni.
99 \:{\I mìl~$\oplus$ (mìl pravého syna, který je listem) $\rightarrow$ teï má~$\odot$}, hloubka podstromu se~nemìní
100 \:{\I mìl $\ominus$} -- nenastane, proto¾e v binární struktuøe nemohou být dva leví synové
102 \>Pøipadne-li pøidaný list napravo, øe¹íme zrcadlovì.
107 \>{\I Prohloubil-li se strom} vlo¾ením nového listu, musíme pracovat s vyvá¾ením:
109 \:Informace o~prohloubení pøi¹la zleva {\I do~vrcholu typu~$\odot$} $\rightarrow$ mìní jej na~vrchol se~znaménkem~$\ominus$ a informace o~prohloubení je tøeba poslat o~úroveò vý¹.
110 \:Informace o~prohloubení pøi¹la zleva {\I do~vrcholu typu~$\oplus$} $\rightarrow$ mìní jej na~vrchol se~znaménkem~$\odot$, hloubka je vyrovnána, dál nic neposíláme.
111 \:Informace o~prohloubení pøi¹la zleva {\I do vrcholu s~$\ominus$} $\rightarrow$
113 \>rozebereme na~tøi pøípady podle znaménka vrcholu, ze~kterého pøi¹la informace o~prohloubení:
115 \:Informace pøi¹la {\I z~vrcholu typu~$\ominus$} $\rightarrow$ provedeme rotaci doprava tak, ¾e novým koøenem se~stane vrchol~$y$, ze~kterého pøi¹la informace o~prohloubení.
119 {\I Pozorování 1:} znaménko vrcholù~$y$ a~$x$ je~$\odot$\
121 {\I Pozorování 2:} hloubka pøed vkládáním byla $h+1$ a~nyní je také $h+1$, tedy nemusíme dále posílat informaci o~prohloubení a mù¾eme skonèit
122 \:Informace pøi¹la {\I z~vrcholu typu~$\oplus$}
124 \:uva¾me je¹te vrchol~$z$ jako pravého syna vrcholu~$y$, ze~kterého pri¹la informace o~prohloubení, a~jeho podstromy~$B$ a~$C$
125 \:vrcholy~$B$ a~$C$ mají hloubku~$h$ nebo $h-1$ $\rightarrow$ oznaème~ji tedy $h-$ (to zøejmì proto¾e vrchol~$y$ má znaménko~$\oplus$, tedy jeho pravý podstrom s~koøenem~$z$ má hloubku~$h+1$ )
126 \:provedeme dvojrotaci tak, ¾e novým koøenem se stane vrchol~$z$
130 {\I Pozorování 1:} znaménko vrcholu~$z$ bude~$\odot$\
132 {\I Pozorování 2:} znaménka vrcholu~$x$ a~$y$ se~dopoèítají v~závislosti na~hloubce~$B$ a~$C$\
134 {\I Pozorování 3:} rozdíl hloubky pravého a~levého podstromu bude u~tìchto vrcholù $0$ nebo~$1$\
136 {\I Pozorování 4:} hloubka pøed vkládáním byla $h+2$ a~nyní je také $h+2$, tedy nemusíme dále posílat informaci o~prohloubení a~mù¾eme skonèit
137 \:informace pøi¹la {\I z~vrcholu typu~$\odot$} -- to nemù¾e nastat, proto¾e v~tom pøípadì by ne¹lo o~prohloubení
141 \s {Delete} -- odebrání vrcholu z~AVL~stromu
142 \> Buï ma¾eme list nebo ma¾eme vrchol, který mìl nìjaké syny.
145 \:pokud ma¾eme list, podíváme~se na~typ otce. Pøedpokládáme mazání levého syna.
147 \:byl typu $\ominus$ (nemìl pravého syna) $\rightarrow$ zmìní~se na~$\odot$ (vrchol teï nemá ¾ádné syny)
148 \:byl typu $\odot$ (mìl oba syny) $\rightarrow$ zmìní~se na~$\oplus$
150 (ma¾eme-li pravý list, øe¹íme zrcadlovì)
151 \:ma¾eme vrchol s~jedním (levým nebo pravým) synem $\rightarrow$ syn nastupuje na~místo otce a~získává typ~$\odot$\
153 \>V~obou pøípadech posílame informaci o~zmìnì hloubky stromu...
154 \:mazaný vrchol mìl oba syny (listy) $\rightarrow$ vybereme jednoho ze~synù na~místo smazaného otce. Hloubka se nemìní.
155 \:mazaný vrchol mìl syny podstromy $\rightarrow$ na~jeho místo vezmeme nejvìt¹í prvek levého podstromu (nebo nejmen¹í prvek pravého podstromu) a od~odebraného (nahrazujícího) listu kontrolujeme vyvá¾ení podstromu.
161 \>{\I Úprava vyvá¾ení} stromu po~odebrání listu z~podstromu
163 \:informace o~zmìnì hloubky pøi¹la z~levého podstromu do~vrcholu typu~$\odot$ $\rightarrow$ vrchol se~zmìní na~$\oplus$ a~dál se hloubka nemìní
165 \:informace pøi¹la zleva do~vrcholu s~$\ominus$ $\rightarrow$ mìní~se na~$\odot$ a~posíláme informaci o~zmìnì hloubky.
170 \:problémová situace nastává, kdy¾ informace o~zmìnì pøi¹la zleva do~vrcholu se~znaménkem~$\oplus$
172 \>Rozebereme na~tøi~pøípady podle znaménka pravého syna nevyvá¾eného vrcholu
174 \:{\I pravý syn je typu~$\oplus$} $\rightarrow$ provedeme rotaci vlevo, novým koøenem se~stává~$y$ (pravý syn), oba vrcholy zmìní typ na~$\odot$ a~posíláme informaci o~zmìnì hloubky.
178 \:{\I pravý syn je typu~$\odot$} $\rightarrow$ provedeme opìt rotaci vlevo, koøenem se~stává~$y$, následnì se u~$y$ zmìní typ na~$\ominus$ , u~vrcholu~$x$ se typ nemìní. Hloubka stromu se~nemìní, tudí¾ není tøeba posílat informaci.
182 \:{\I pravý syn je typu~$\ominus$} $\rightarrow$ v~tomto pøípadì uva¾ujeme je¹tì vrchol~$z$ jako levého syna vrcholu~$y$, s~podstromy $B$ a~$C$, podstromy $B$ a~$C$ mají hloubku~$h$ nebo~$h-1$. Provedeme dvojrotaci, napøed vpravo rotujeme vrcholy $z$ a~$y$, potom vlevo vrcholy~$x$ a~$z$ tak, ¾e se $z$ stane novým koøenem, typ vecholu~$x$ bude potom~$\ominus$ nebo~$\odot$, typ~$y$~$\oplus$ nebo~$\odot$ (podle toho, jaké znaménko mìl pùvodnì vrchol~$z$), typ~$z$ bude~$\odot$ a~opìt posíláme informaci o~zmìnì hloubky stromu.
187 \h{Obecné vyhledávací stromy}
189 Pøi ulo¾ení dat na~disku se~sna¾íme, aby~se ètení z~disku provádìlo pokud mo¾no
190 co nejménìkrát a~nezále¾í nám tolik na~tom, kolik operací se~vykoná v~jednom
191 uzlu. (Èasovì je operace porovnávání zanedbatelná oproti ètení z~disku.)
193 \s{Definice:} {\I $(a,b)$-strom} pro parametry $a,b$, $a \geq 2$, $b\geq 2a - 1$ je zakoøenìný strom s~uspoøádanými syny a~vnìj¹ími vrcholy, pro který platí
196 \:Data jsou ulo¾ena ve~vnitøních vrcholech a~ka¾dý vrchol obsahuje o~1 ménì klíèù ne¾ má synù.
197 \:Platí stromové uspoøádání, tedy ¾e $ A < x_1 < B < x_2 < C < x_3 < D $.
198 \:Koøen má $2$ a¾~$b$ synù, ostatní vnitøní vrcholy $a$ a¾ $b$ synù.
199 \:V¹echny vnìj¹í vrcholy jsou ve~stejné hloubce (vnìj¹í vrchol$=$list).
201 \>{\I Poznámka:} kdekoli~by mohl být syn a~není, pøipojíme vrchol, kterému øíkáme vnìj¹í vrchol)
205 \s{Lemma:} $(a,b)$-strom na~$n$~vrcholech má hloubku~$O(\log_a n)$.
208 Zjistíme jeho minimální poèet listù (oznaème jej $m$): ka¾dý vrchol a¾ na~koøen má alespoò $a$ synù, hloubku si oznaèíme~$d$ $\rightarrow$
210 $$\log_a m \geq d -1$$
211 $$d \leq 1+ \log_a m$$
212 \centerline{co¾ je øádovì $O(\log_a n)$, kde $n$ je poèet vrcholù.}\
214 \s{Operace s (a,b)-stromy:}
217 \item{-}V¾dy zjistíme, mezi které 2 klíèe hledaný vrchol patøí a potom se zanoøíme hloubìji.\
219 \>Èasová slo¾itost nalezení prvku v $(a,b)$-stromu je $O(\log b \cdot \log_a n)$, kde $\log b$ je èas strávený na~jednom vrcholu pro zji¹tení, mezi které 2 vrcholy hledaný patøí, $\log_a n$ je hloubka stromu.
223 \>Jako Find, pøièem¾ jestli¾e nena¹el, skonèí na~posledním patøe a~pøidáme klíè
225 \:pokud pøidáním nepøesáhneme maximální poèet klíèù mù¾eme skonèit
227 \:pokud pøidáním pøesáhneme maximální poèet klíèù
230 \:rozdìlíme vrchol na~3 èásti: $L$,$x$,$P$
231 \:$L$ a $P$ jsou nové vrcholy
232 \:$x$ je hodnota mezi $L$ a $P$, kterou vlo¾íme o patro vý¹ jako klíè oddìlující novì vzniklé vrcholy $L$ a $P$
233 \:tím jsme pøevedli problém o patro vý¹ a opakujeme algoritmus
236 \abpics{b-klicu1}{b-klicu2}
238 \s{Poznámka:} Jestli¾e se dostaneme a¾ do koøene, rozdìlí se koøen na dvì èásti, vznikne nám nový koøen se dvìma syny (co¾ je povoleno) a celému stromu vzroste hloubka o jedna.
242 $$\vert L\vert \geq a-1$$
243 $$\vert P\vert \geq a-1$$
244 po seètení obou nerovností a~priètení 1 na~obì strany rovnice:
245 $$\vert L\vert +\vert P\vert +1\geq 2a-2+1=2a-1$$
246 pravá strana je rovna $b$ a~to podle definice $\geq 2a-1$. \par
247 \s{Èasová slo¾itost:} vkládání prvku do $(a,b)$-stromu je $O(b\cdot \log_a n)$.
251 \item{-} pøevedeme na~delete z~listu (stejný postup jako u~stromu: jestli¾e to není list, prohodíme tuto hodnotu s~nejmen¹í hodnotou podstromu jeho pravého syna) -- v tomto pøípadì na~klíè posledního vnitøního vrcholu, proto¾e listy jsou vnìj¹í vrcholy bez dat.
253 \:pokud má vrchol, ze~kterého odebíráme stále $a-1$ klíèù, mù¾eme skonèit
254 \:pokud má vrchol($V$), ze~kterého odebíráme $a-2$ klíèù a~jeho levý sousední vrchol($L$) alespoò $a$ klíèù (klíè otce oddìlující tyto vrcholy oznaème $x$):
257 \:sma¾eme nejvìt¹í klíè levého sousedního vrcholu ($L$) a~nahradíme tím klíè otce obou vrcholù (nahradíme $x$ za~tuto hodnotu)
258 \:pùvodní klíè otce($x$) pøidáme jako nejmen¹í klíè odebíranému vrcholu ($V$)
259 \:tím mají oba tyto vrcholy $a-1$ klíèù a mù¾eme skonèit
261 \abpics{delete21}{delete22}
263 \:pokud má vrchol, z kterého odebíráme($V$) $a-2$ klíèù a jeho levý sousední vrchol($L$) $a-1$ klíèù (klíè otce oddìlující tyto vrcholy oznaème $x$):
266 \:slouèíme $V$,$x$,$L$ do jednoho vrcholu
267 \:tím jsme problém pøevedli o patro vý¹ a opakujeme algoritmus \par
269 \abpics{delete31}{delete32}
271 \>{\I Poznámka:} Dojdeme-li takto a¾ do koøene, na místo klíèe odebraného z koøene lze pou¾ít nejmen¹í nebo nejvìt¹í klíè novì slouèeného podstromu. Ten odebrat lze, proto¾e po slouèení (které bylo pøíèinou této situace), je v nejni¾¹ím vrcholu $2a-2$ klíèù.
273 \>{\I Èasová slo¾itost:} $$O(b\cdot \log_a n)$$