]> mj.ucw.cz Git - ads1.git/blob - 7-stromy/7-stromy.tex
30173fad477aaec6c268fc9e603339d882be7b2d
[ads1.git] / 7-stromy / 7-stromy.tex
1 \input ../lecnotes.tex
2
3 % Vkladani obrazku
4 \input ../mjipe.tex
5 \def\treepic#1{
6 \medskip
7 \IpeInput{treepic/t#1.ipe}
8 \medskip
9 }
10
11 \prednaska{7}{Vyhledávací stromy}{zapsali M. Øezáè, ©. Masojídek, B. Urbancová}
12
13 \h{Pár obrázkù, které by stály za pøesun do~pøedchozí kapitoly:}
14
15 \treepic{1}
16 \treepic{2}
17 \treepic{3}
18
19 \h{Binární}
20
21 V minulé kapitole jsme se zabývali problematikou pøidávání a ubírání prvkù binárního vyhledávacího stromu a jeho slo¾itostí a zjistili, ¾e v¹e zále¾í na~hloubce stromu. Víme, ¾e chceme hloubku logaritmickou, ale jak ji mù¾eme udr¾et pøi~operacích? Øe¹ením je následující definice:
22
23
24 \s{Definice:} {\I Dokonalé vyvá¾ení} je takové vyvá¾ení, kde platí $ \forall v: \left\vert \vert L(v)\vert - \vert P(v)\vert \right \vert \leq 1 $
25
26 Toto nám jistì zaji¹»uje logaritmickou hloubku, ale je velmi pracné na udr¾ování.
27
28 \h{AVL stromy}
29
30 \s{Definice:} {\I Hloubkové vyvá¾ení} je takové vyvá¾ení, kde platí $ \forall  v: \left \vert h(L(v)) - h(P(v)) \right \vert \leq 1 $
31
32 \>Jsou to tedy stromy, hloubka jejich\v z prav\'eho a lev\'eho podstromu se~li\v s\'\i{} maxim\'aln\v e o~jednotku
33
34 \>Stromùm s hloubkovým vyvá¾ením se øíká AVL stromy. A o nich si doká¾eme následující lemma.
35
36 \s{Lemma: } AVL strom o $n$ vrcholech má hloubku $ \O(\log{n}) $.
37
38 \proof
39 Uva¾me $a_k = $ minimální poèet vrcholù stromu o~hloubce $k$.
40
41 Lehce spoèteme:
42
43 % FIXME neni spravne a chova se divne
44 \itemize\ibull
45 \next $ a_0 = 0 $
46
47 \next $ a_1 = 1 $
48
49 \next $ a_2 = 2 $
50
51 \next $ \vdots $
52
53 \next $ a_k = 1 + a_{k - 1} + a_{k - 2} $
54
55 \endlist
56
57 Rekurentní vzorec jsme dostali rekurzivním stavìním stromu hloubky $k$: nový koøen a dva podstromy o hloubce $k - 1$ a $k - 2$.
58
59 Indukcí doká¾eme, ¾e $ a_k \geq 2^{k \over 2} $.
60 První indukèní krok jsme si u¾ ukázali, teï pro $ k \geq 2 $ platí:
61 $ a_k = 1 + a_{k - 1} + a_{k - 2} > 2^{{k - 1} \over 2} + 2^{{k - 2} \over 2} = 2^{k \over 2} \cdot (2^{-{1 \over 2}} + 2^{-1}) \cong 2^{k \over 2} \cdot 1.21 > 2^{k \over 2} $
62
63 Tímto jsme dokázali, ¾e na ka¾dé hladinì je minimálnì exponenciálnì vrcholù, co¾ nám zaruèuje hloubku $ \O(\log{n})$
64
65 \qed
66
67
68
69 \>{\I Operace s AVL stromy:}
70
71 \s{Find}
72
73 \>se~neli¹í od~operace find v~binárních stromech.\
74
75
76 Dùraz klademe na operace {\I Insert} a \<Delete>, proto¾e pøi~nich musíme o¹etøit udr¾ení struktury AVL~stromù..
77
78
79 První nutnou podmínkou je, ¾e si musíme {\I pamatovat stav} v~ka¾dém vrcholu tohoto stromu. A~to {\I vyvá¾ení} hloubky jeho podstromù.
80
81 Umluvíme~se napø. na~tomto oznaèení:
82
83 \>Dostaneme tøi typy vrcholù, které se mohou v~AVL~stromu vyskytnout:
84 \itemize\ibull
85 \:{\I Vrchol typu~$\oplus$}, pokud je pravý podstrom hlub¹í
86 \:{\I Vrchol typu~$\ominus$}, pokud je levý podstrom hlub¹í a
87 \:{\I Vrchol typu~$\odot$ (nulou)}, který má oba syny schodné hloubky.
88 \endlist
89
90 \s {Sestavení} \rm AVL stromu:
91
92 Postupujeme po~struktuøe binárního stromu od~listù ke~koøeni a~kontrolujeme, zda jsou vrcholy v~jednom ze~tøí uvedených stavù. Pokud ne, opravíme ho operací jménem rotace.
93
94 \s {Rotace}
95 \treepic{4}
96 \treepic{5}
97
98 Jde o~pøevrácení hrany mezi pùvodním otcem (koøenem podstromu) a nevyvá¾eným vrcholem tak, aby byli i po pøeskupení synové vzhledem k~otcùm správnì uspoøádáni.
99
100
101 \s {Insert} \rm - vlo¾ení vrcholu do~AVL~stromu.
102
103 Vlo¾íme jej jako list. Nový list má v¾dy \uv{znaménko} nula $\odot$. Pøedpokládáme, ¾e patøí nalevo od posledního otce. Podíváme~se na~znaménko jeho otce:
104 \itemize\ibull
105 \:{\I mìl~$\odot$ (nemìl syna) $\rightarrow$ teï má~$\ominus$}, po struktuøe stromu nahoru posíláme informaci, ¾e se podstrom prohloubil o~1, co¾ mù¾e mít samozøejmì vliv na~znaménka vrcholù na~cestì ke~koøeni.
106 \:{\I mìl~$\oplus$ (mìl pravého syna, který je listem) $\rightarrow$ teï má~$\odot$}, hloubka podstromu se~nemìní
107 \:{\I mìl $\ominus$} --- nenastane, proto¾e v binární struktuøe nemohou být dva leví synové
108 \endlist
109 \>Pøipadne-li pøidaný list napravo, øe¹íme zrcadlovì.
110
111 \treepic{6}
112 \treepic{7}
113
114 \>{\I Prohloubil-li se strom} vlo¾ením nového listu, musíme pracovat s vyvá¾ením:
115 \itemize\ibull
116 \:Informace o~prohloubení pøi¹la zleva {\I do~vrcholu typu~$\odot$} $\rightarrow$ mìní jej na~vrchol se~znaménkem~$\ominus$ a informace o~prohloubení je tøeba poslat o~úroveò vý¹.
117 \:Informace o~prohloubení pøi¹la zleva {\I do~vrcholu typu~$\oplus$} $\rightarrow$ mìní jej na~vrchol se~znaménkem~$\odot$, hloubka je vyrovnána, dál nic neposíláme.
118 \:Informace o~prohloubení pøi¹la zleva {\I do vrcholu s~$\ominus$} $\rightarrow$
119
120 \>rozebereme na~tøi pøípady podle znaménka vrcholu, ze~kterého pøi¹la informace o~prohloubení:
121 \itemize\ibull
122 \:Informace pøi¹la {\I z~vrcholu typu~$\ominus$} $\rightarrow$ provedeme rotaci doprava tak, ¾e novým koøenem se~stane vrchol~$y$, ze~kterého pøi¹la informace o~prohloubení.
123
124 \treepic{8}
125
126 {\I Pozorování 1:} znaménko vrcholù~$y$ a~$x$ je~$\odot$\
127
128 {\I Pozorování 2:} hloubka pøed vkládáním byla $h+1$ a~nyní je také $h+1$, tedy nemusíme dále posílat informaci o~prohloubení a mù¾eme skonèit
129 \:Informace pøi¹la {\I z~vrcholu typu~$\oplus$}
130 \itemize\ibull
131 \:uva¾me je¹te vrchol~$z$ jako pravého syna vrcholu~$y$, ze~kterého pri¹la informace o~prohloubení, a~jeho podstromy~$B$ a~$C$
132 \:vrcholy~$B$ a~$C$ mají hloubku~$h$ nebo $h-1$ $\rightarrow$ oznaème~ji tedy $h-$ (to zøejmì proto¾e vrchol~$y$ má znaménko~$\oplus$, tedy jeho pravý podstrom s~koøenem~$z$ má hloubku~$h+1$ )
133 \:provedeme dvojrotaci tak, ¾e novým koøenem se~stane vrchol~$z$
134 \endlist
135 \treepic{9}
136
137 {\I Pozorování 1:} znaménko vrcholu~$z$ bude~$\odot$\
138
139 {\I Pozorování 2:} znaménka vrcholu~$x$ a~$y$ se~dopoèítají v~závislosti na~hloubce~$B$ a~$C$\
140
141 {\I Pozorování 3:} rozdíl hloubky pravého a~levého podstromu u~tìchto vrcholù bude~$0$ nebo~$1$\
142
143 {\I Pozorování 4:} hloubka pøed vkládáním byla $h+2$ a~nyní je také $h+2$, tedy nemusíme dále posílat informaci o~prohloubení a~mù¾eme skonèit
144 \:informace pøi¹la {\I z~vrcholu typu~$\odot$} --- to nemù¾e nastat, proto¾e v~tom pøípadì by ne¹lo o~prohloubení
145 \endlist
146 \endlist
147
148 \s {Delete} - odebrání vrcholu z~AVL~stromu
149 \> Buï ma¾eme list nebo ma¾eme vrchol, který mìl nìjaké syny.
150
151 \itemize\ibull
152 \:pokud ma¾eme list, podíváme~se na~typ otce. Pøedpokládáme mazání levého syna.
153 \itemize\ibull
154 \:byl typu $\ominus$ (nemìl pravého syna) $\rightarrow$ zmìní~se na~$\odot$ (vrchol teï nemá ¾ádné syny)
155 \:byl typu $\odot$ (mìl oba syny) $\rightarrow$ zmìní~se na~$\oplus$
156 \endlist
157 (ma¾eme-li pravý list, øe¹íme zrcadlovì)
158 \:ma¾eme vrchol s~jedním (levým nebo pravým) synem $\rightarrow$ syn nastupuje na~místo otce a~získává typ~$\odot$\
159
160 \>V~obou pøípadech posílame informaci o~zmìnì hloubky stromu...
161 \:mazaný vrchol mìl oba syny (listy) $\rightarrow$ vybereme jednoho ze~synù na~místo smazaného otce. Hloubka se nemìní.
162 \:mazaný vrchol mìl syny podstromy $\rightarrow$ na~jeho místo vezmeme nejvìt¹í prvek levého podstromu (nebo nejmen¹í prvek pravého podstromu) a od~odebraného (nahrazujícího) listu kontrolujeme vyvá¾ení podstromu.
163 \endlist
164
165
166
167
168 \>{\I Úprava vyvá¾ení} stromu po~odebrání listu z~podstromu
169 \itemize\ibull
170 \:informace o~zmìnì hloubky pøi¹la z~levého podstromu do~vrcholu typu~$\odot$ $\rightarrow$ vrchol se~zmìní na~$\oplus$ a~dál se hloubka nemìní
171
172 \:informace pøi¹la zleva do~vrcholu s~$\ominus$ $\rightarrow$ mìní~se na~$\odot$ a~posíláme informaci o~zmìnì hloubky.
173
174 \treepic{10}
175 \treepic{11}
176
177 \:problémová situace nastává, kdy¾ informace o~zmìnì pøi¹la zleva do~vrcholu se~znaménkem~$\oplus$
178 \endlist
179 \>rozebereme na~tøi~pøípady podle znaménka pravého syna nevyvá¾eného vrcholu
180 \itemize\ibull
181 \:{\I pravý syn je typu~$\oplus$} $\rightarrow$ provedeme rotaci vlevo, novým koøenem se~stává~$y$ (pravý syn), oba vrcholy zmìní typ na~$\odot$ a~posíláme informaci o~zmìnì hloubky
182
183 \treepic{12}
184
185 \:{\I pravý syn je typu~$\odot$} $\rightarrow$ provedeme opìt rotaci vlevo, koøenem se~stává~$y$, následnì se u~$y$ zmìní typ na~$\ominus$ , u~vrcholu~$x$ se typ nemìní. Hloubka stromu se~nemìní, tudí¾ není tøeba posílat informaci..
186
187 \treepic{12y}
188
189 \:{\I pravý syn je typu~$\ominus$} $rightarrow$ v~tomto pøípadì uva¾ujeme je¹tì vrchol~$z$ jako levého syna vrcholu~$y$, s~podstromy $B$ a~$C$, podstromy $B$ a~$C$ mají hloubku~$h$ nebo~$h-1$. Provedeme dvojrotaci, napøed vpravo rotujeme vrcholy $z$ a~$y$, potom vlevo vrcholy~$x$ a~$z$ tak, ¾e se $z$ stane novým koøenem, typ vecholu~$x$ bude potom~$\ominus$ nebo~$\odot$, typ~$y$~$\oplus$ nebo~$\odot$ (podle toho, jaké znaménko mìl pùvodnì vrchol~$z$), typ~$z$ bude~$\odot$ a~opìt posíláme informaci o~zmìnì hloubky stromu.
190
191 \treepic{13}
192 \endlist
193
194 \h{Obecné stromy}
195 (Stromy s více vìtvemi)
196
197 \>{\I Proè se tímto zabývat?}
198
199 Pøi ulo¾ení dat na~disku se~sna¾íme, aby~se ètení z~disku provádìlo pokud mo¾no co nejménìkrát a~nezále¾í nám tolik na~tom, kolik operací se~vykoná v~jednom uzlu. (Èasovì je operace porovnávání zanedbatelná oproti ètení z~disku)
200
201 \s{Definice:}{\I (a,b)-strom} pro parametry $a,b$, $a \geq 2$, $b\geq 2a - 1$ je zakoøenìný strom s~uspoøádanými syny a~vnìj¹ími vrcholy, pro který platí:
202 \itemize\ibull
203 \:{Ax 1)}data jsou ulo¾ena ve~vnitøních vrcholech a~ka¾dý vrchol obsahuje o~1 ménì klíèù ne¾ má synù
204 \:{Ax 2)}platí stromové uspoøádání, tedy ¾e $ A < x_1 < B < x_2 < C < x_3 < D $
205 \:{Ax 3)}koøen má $2$ a¾~$b$ synù, ostatní vnitøní vrcholy $a$ a¾ $b$ synù
206 \:{Ax 4)}v¹echny vnìj¹í vrcholy jsou ve~stejné hloubce (vnìj¹í vrchol$=$list)
207 \endlist
208 \>{\I Poznámka:} kdekoli~by mohl být syn a~není, pøipojíme vrchol, kterému øíkáme vnìj¹í vrchol)
209 \vglue 2 in
210
211 \centerline {Prosím vlo¾it obrázek "ab strom11.gif"}
212
213 \s{Lemma:} $(a,b)$-strom na~$n$~vrcholech má hloubku~$O(\log_a n)$.
214
215 \proof
216 Zjistíme jeho minimální poèet listù (oznaème jej $m$): ka¾dý vrchol a¾ na~koøen má alespoò $a$ synù $\rightarrow$\
217 $$m\geq~a^{(hloubka -1)}$$
218 $$\log_a m \geq hloubka -1$$
219 $$hloubka \leq 1+ \log_a m$$
220 \centerline{co¾ je øádovì  $O(\log_a n)$, kde $n$ je poèet vrcholù.}\
221
222 \s{Operace s (a,b) stromy:}
223
224 \s{Find}
225 \item{-}V¾dy zjistíme, mezi které 2 klíèe hledaný vrchol patøí a potom se zanoøíme hloubìji.\
226
227 \>Èasová slo¾itost nalezení prvku v $(a,b)$-stromu je $O(\log b \cdot \log_a n)$, kde $\log b$ je èas strávený na~jednom vrcholu pro zji¹tení, mezi které 2 vrcholy hledaný patøí, $\log_a n$ je hloubka stromu.
228
229 \s{Insert}
230
231 \>Jako Find, pøièem¾ jestli¾e nena¹el, skonèí na~posledním patøe a~pøidáme klíè
232 \itemize\ibull
233 \:pokud pøidáním nepøesáhneme maximální poèet klíèù mù¾eme skonèit
234 \vglue 2 in
235 \centerline {Prosím vlo¾it obrázek "insert1.gif"}
236 \:pokud pøidáním pøesáhneme maximální poèet klíèù
237 \endlist
238 \algo
239 \:rozdìlíme vrchol na~3 èásti: $L$,$x$,$P$
240 \:$L$ a $P$ jsou nové vrcholy
241 \:$x$ je hodnota mezi $L$ a $P$, kterou vlo¾íme o patro vý¹ jako klíè oddìlující novì vzniklé vrcholy $L$ a $P$
242 \:tím jsme pøevedli problém o patro vý¹ a opakujeme algoritmus
243 \endalgo
244 \vglue 2 in
245
246 \centerline{Prosím vlo¾it obrázek "b klicu1.gif" a "b klicu2.gif"}
247
248
249 \s{Poznámka:} Jestli¾e se dostaneme a¾ do koøene, rozdìlí se koøen na dvì èásti, vznikne nám nový koøen se dvìma syny (co¾ je povoleno) a celému stromu vzroste hloubka o jedna.
250
251 \s{Korektnost:}
252 Potøebujeme, aby
253 $$\vert L\vert \geq a-1$$
254 $$\vert P\vert \geq a-1$$
255 po seètení obou nerovností a~priètení 1 na~obì strany rovnice:
256 $$\vert L\vert +\vert P\vert +1\geq 2a-2+1=2a-1$$
257 pravá strana je rovna $b$ a~to podle definice $\geq 2a-1$. \par
258 \s{Èasová slo¾itost:} vkládání prvku do $(a,b)$-stromu je $O(b\cdot \log_a n)$.
259
260
261 \s{Delete}
262 \item{-} pøevedeme na~delete z~listu (stejný postup jako u~stromu: jestli¾e to není list, prohodíme tuto hodnotu s~nejmen¹í hodnotou podstromu jeho pravého syna) --- v tomto pøípadì na~klíè posledního vnitøního vrcholu, proto¾e listy jsou vnìj¹í vrcholy bez dat.
263 \itemize\ibull
264 \:pokud má vrchol, ze~kterého odebíráme stále $a-1$ klíèù, mù¾eme skonèit
265 \:pokud má vrchol($V$), ze~kterého odebíráme $a-2$ klíèù a~jeho levý sousední vrchol($L$) alespoò $a$ klíèù (klíè otce oddìlující tyto vrcholy oznaème $x$):
266 \endlist
267 \algo
268 \:sma¾eme nejvìt¹í klíè levého sousedního vrvholu($L$) a~nahradíme tím klíè otce obou vrcholù (nahradíme $x$ za~tuto hodnotu)
269 \:pùvodní klíè otce($x$) pøidáme jako nejmen¹í klíè odebíranému vrcholu($V$)
270 \:tím mají oba tyto vrcholy $a-1$ klíèù a mù¾eme skonèit
271 \endalgo
272 \vglue 2 in
273 \centerline{Prosím vlo¾it obrázek "delete21.gif" a "delete22.gif"}
274 \itemize\ibull
275 \:pokud má vrchol, z kterého odebíráme($V$) $a-2$ klíèù a jeho levý sousední vrchol($L$) $a-1$ klíèù (klíè otce oddìlující tyto vrcholy oznaème $x$):
276 \endlist
277 \algo
278 \:slouèíme $V$,$x$,$L$ do jednoho vrcholu
279 \:tím jsme problém pøevedli o patro vý¹ a opakujeme algoritmus \par
280 \endalgo
281 \vglue 2 in
282 \centerline{Prosím vlo¾it obrázek "delete31.gif" a "delete32.gif"}
283
284 \>{\I Poznámka:} Dojdeme-li takto a¾ do koøene, na místo klíèe odebraného z koøene lze pou¾ít nejmen¹í nebo nejvìt¹í klíè novì slouèeného podstromu. Ten odebrat lze, proto¾e po slouèení (které bylo pøíèinou této situace), je v nejni¾¹ím vrcholu $2a-2$ klíèù.
285
286 \>{\I Èasová slo¾itost:} $$O(b\cdot \log_a n)$$
287
288 \bye