]> mj.ucw.cz Git - ads1.git/blob - 2007/7-stromy/7-stromy.tex
1510efa3375c08e405e8fd0ed10e0e7205c432a6
[ads1.git] / 2007 / 7-stromy / 7-stromy.tex
1 \input ../lecnotes.tex
2
3 % Vkladani obrazku
4 \input ../mjipe.tex
5 \def\treepic#1{
6 \medskip
7 \IpeInput{treepic/t#1.ipe}
8 \medskip
9 }
10 \def\abpic#1{
11 \medskip
12 \centerline{\epsfxsize=0.7\hsize\epsfbox{abpic/#1.eps}}
13 \medskip
14 }
15 \def\abpics#1#2{
16 \medskip
17 \centerline{\epsfxsize=0.4\hsize\epsfbox{abpic/#1.eps}\qquad\epsfxsize=0.4\hsize\epsfbox{abpic/#2.eps}}
18 \medskip
19 }
20
21 \prednaska{7}{Vyhledávací stromy}{zapsali M. Øezáè, ©. Masojídek, B. Urbancová}
22
23 \h{Pár obrázkù, které by stály za pøesun do~pøedchozí kapitoly:}
24
25 \treepic{1}
26 \treepic{2}
27 \treepic{3}
28
29 \h{Vyvá¾ené binární vyhledávací stromy}
30
31 V minulé kapitole jsme se zabývali problematikou pøidávání a ubírání prvkù
32 binárního vyhledávacího stromu a jeho slo¾itostí a zjistili, ¾e v¹e zále¾í
33 na~hloubce stromu. Víme, ¾e chceme hloubku logaritmickou, ale jak ji mù¾eme
34 udr¾et pøi~operacích? Øe¹ením je následující definice:
35
36 \s{Definice:} {\I Dokonale vyvá¾ení} je takové vyvá¾ení, ve~kterém pro v¹echny vrcholy~$v$ platí $\left\vert \vert L(v)\vert - \vert P(v)\vert \right \vert \leq 1 $.
37
38 Toto nám jistì zaji¹»uje logaritmickou hloubku, ale je velmi pracné na udr¾ování.
39 Zkusíme proto slab¹í podmínku:
40
41 \s{Definice:} {\I Hloubkové vyvá¾ení} je takové vyvá¾ení, ve~kterém pro v¹echny vrcholy~$v$ platí $\left \vert h(L(v)) - h(P(v)) \right \vert \leq 1 $.
42 Stromùm s hloubkovým vyvá¾ením se øíká {\I AVL stromy} a platí o nich následující lemma.
43
44 \s{Lemma:} AVL strom o $n$ vrcholech má hloubku $ \O(\log{n}) $.
45
46 \proof
47 Uva¾me $a_k = $ minimální poèet vrcholù AVL stromu o~hloubce $k$.
48 Lehce spoèteme:
49 $$\eqalign{
50 a_0 &= 0 \cr
51 a_1 &= 1 \cr
52 a_2 &= 2 \cr
53 &\vdots \cr
54 a_k &= 1 + a_{k - 1} + a_{k - 2}. \cr
55 }$$
56
57 Rekurentní vzorec jsme dostali rekurzivním stavìním stromu hloubky $k$: nový koøen a 2 podstromy o hloubce $k - 1$ a $k - 2$.
58
59 Indukcí doká¾eme, ¾e $ a_k \geq 2^{k \over 2} $.
60 První indukèní krok jsme si u¾ ukázali, teï pro $ k \geq 2 $ platí:
61 $ a_k = 1 + a_{k - 1} + a_{k - 2} > 2^{{k - 1} \over 2} + 2^{{k - 2} \over 2} = 2^{k \over 2} \cdot (2^{-{1 \over 2}} + 2^{-1}) \cong 2^{k \over 2} \cdot 1.21 > 2^{k \over 2} $
62
63 Tímto jsme dokázali, ¾e na ka¾dé hladinì je minimálnì exponenciálnì vrcholù, co¾ nám zaruèuje hloubku $ \O(\log{n})$
64 \qed
65
66 \s{Operace s AVL stromy}
67
68 \<Find> se neli¹í od~operace find v~binárních stromech.
69
70 Dùraz klademe na operace \<Insert> a \<Delete>, proto¾e pøi~nich musíme o¹etøit udr¾ení struktury AVL~stromù.
71
72 První nutnou podmínkou je, ¾e si musíme {\I pamatovat stav} v~ka¾dém vrcholu tohoto stromu. A~to {\I vyvá¾ení} hloubky jeho podstromù.
73
74 Umluvíme~se napø. na~tomto oznaèení:
75
76 \>Dostaneme tøi typy vrcholù, které se mohou v~AVL~stromu vyskytnout:
77 \itemize\ibull
78 \:{\I Vrchol typu~$\oplus$}, pokud je pravý podstrom hlub¹í
79 \:{\I Vrchol typu~$\ominus$}, pokud je levý podstrom hlub¹í a
80 \:{\I Vrchol typu~$\odot$ (nulou)}, který má oba syny schodné hloubky.
81 \endlist
82
83 \s {Sestavení} \rm AVL stromu:
84
85 Postupujeme po~struktuøe binárního stromu od~listù ke~koøeni a~kontrolujeme, zda jsou vrcholy v~jednom ze~tøí uvedených stavù. Pokud ne, opravíme ho operací jménem rotace.
86
87 \s {Rotace}
88 \treepic{4}
89 \treepic{5}
90
91 Jde o~pøevrácení hrany mezi pùvodním otcem (koøenem podstromu) a nevyvá¾eným vrcholem tak, aby byli i po pøeskupení synové vzhledem k~otcùm správnì uspoøádáni.
92
93
94 \s {Insert} \rm - vlo¾ení vrcholu do~AVL~stromu.
95
96 Vlo¾íme jej jako list. Nový list má v¾dy \uv{znaménko} nula $\odot$. Pøedpokládáme, ¾e patøí nalevo od posledního otce. Podíváme~se na~znaménko jeho otce:
97 \itemize\ibull
98 \:{\I mìl~$\odot$ (nemìl syna) $\rightarrow$ teï má~$\ominus$}, po struktuøe stromu nahoru posíláme informaci, ¾e se podstrom prohloubil o~1, co¾ mù¾e mít samozøejmì vliv na~znaménka vrcholù na~cestì ke~koøeni.
99 \:{\I mìl~$\oplus$ (mìl pravého syna, který je listem) $\rightarrow$ teï má~$\odot$}, hloubka podstromu se~nemìní
100 \:{\I mìl $\ominus$} -- nenastane, proto¾e v binární struktuøe nemohou být dva leví synové
101 \endlist
102 \>Pøipadne-li pøidaný list napravo, øe¹íme zrcadlovì.
103
104 \treepic{6}
105 \treepic{7}
106
107 \>{\I Prohloubil-li se strom} vlo¾ením nového listu, musíme pracovat s vyvá¾ením:
108 \itemize\ibull
109 \:Informace o~prohloubení pøi¹la zleva {\I do~vrcholu typu~$\odot$} $\rightarrow$ mìní jej na~vrchol se~znaménkem~$\ominus$ a informace o~prohloubení je tøeba poslat o~úroveò vý¹.
110 \:Informace o~prohloubení pøi¹la zleva {\I do~vrcholu typu~$\oplus$} $\rightarrow$ mìní jej na~vrchol se~znaménkem~$\odot$, hloubka je vyrovnána, dál nic neposíláme.
111 \:Informace o~prohloubení pøi¹la zleva {\I do vrcholu s~$\ominus$} $\rightarrow$
112
113 \>rozebereme na~tøi pøípady podle znaménka vrcholu, ze~kterého pøi¹la informace o~prohloubení:
114 \itemize\ibull
115 \:Informace pøi¹la {\I z~vrcholu typu~$\ominus$} $\rightarrow$ provedeme rotaci doprava tak, ¾e novým koøenem se~stane vrchol~$y$, ze~kterého pøi¹la informace o~prohloubení.
116
117 \treepic{8}
118
119 {\I Pozorování 1:} znaménko vrcholù~$y$ a~$x$ je~$\odot$\
120
121 {\I Pozorování 2:} hloubka pøed vkládáním byla $h+1$ a~nyní je také $h+1$, tedy nemusíme dále posílat informaci o~prohloubení a mù¾eme skonèit
122 \:Informace pøi¹la {\I z~vrcholu typu~$\oplus$}
123 \itemize\ibull
124 \:uva¾me je¹te vrchol~$z$ jako pravého syna vrcholu~$y$, ze~kterého pri¹la informace o~prohloubení, a~jeho podstromy~$B$ a~$C$
125 \:vrcholy~$B$ a~$C$ mají hloubku~$h$ nebo $h-1$ $\rightarrow$ oznaème~ji tedy $h-$ (to zøejmì proto¾e vrchol~$y$ má znaménko~$\oplus$, tedy jeho pravý podstrom s~koøenem~$z$ má hloubku~$h+1$ )
126 \:provedeme dvojrotaci tak, ¾e novým koøenem se stane vrchol~$z$
127 \endlist
128 \treepic{9}
129
130 {\I Pozorování 1:} znaménko vrcholu~$z$ bude~$\odot$\
131
132 {\I Pozorování 2:} znaménka vrcholu~$x$ a~$y$ se~dopoèítají v~závislosti na~hloubce~$B$ a~$C$\
133
134 {\I Pozorování 3:} rozdíl hloubky pravého a~levého podstromu bude u~tìchto vrcholù $0$ nebo~$1$\
135
136 {\I Pozorování 4:} hloubka pøed vkládáním byla $h+2$ a~nyní je také $h+2$, tedy nemusíme dále posílat informaci o~prohloubení a~mù¾eme skonèit
137 \:informace pøi¹la {\I z~vrcholu typu~$\odot$} -- to nemù¾e nastat, proto¾e v~tom pøípadì by ne¹lo o~prohloubení
138 \endlist
139 \endlist
140
141 \s {Delete} -- odebrání vrcholu z~AVL~stromu
142 \> Buï ma¾eme list nebo ma¾eme vrchol, který mìl nìjaké syny.
143
144 \itemize\ibull
145 \:pokud ma¾eme list, podíváme~se na~typ otce. Pøedpokládáme mazání levého syna.
146 \itemize\ibull
147 \:byl typu $\ominus$ (nemìl pravého syna) $\rightarrow$ zmìní~se na~$\odot$ (vrchol teï nemá ¾ádné syny)
148 \:byl typu $\odot$ (mìl oba syny) $\rightarrow$ zmìní~se na~$\oplus$
149 \endlist
150 (ma¾eme-li pravý list, øe¹íme zrcadlovì)
151 \:ma¾eme vrchol s~jedním (levým nebo pravým) synem $\rightarrow$ syn nastupuje na~místo otce a~získává typ~$\odot$\
152
153 \>V~obou pøípadech posílame informaci o~zmìnì hloubky stromu...
154 \:mazaný vrchol mìl oba syny (listy) $\rightarrow$ vybereme jednoho ze~synù na~místo smazaného otce. Hloubka se nemìní.
155 \:mazaný vrchol mìl syny podstromy $\rightarrow$ na~jeho místo vezmeme nejvìt¹í prvek levého podstromu (nebo nejmen¹í prvek pravého podstromu) a od~odebraného (nahrazujícího) listu kontrolujeme vyvá¾ení podstromu.
156 \endlist
157
158
159
160
161 \>{\I Úprava vyvá¾ení} stromu po~odebrání listu z~podstromu
162 \itemize\ibull
163 \:informace o~zmìnì hloubky pøi¹la z~levého podstromu do~vrcholu typu~$\odot$ $\rightarrow$ vrchol se~zmìní na~$\oplus$ a~dál se hloubka nemìní
164
165 \:informace pøi¹la zleva do~vrcholu s~$\ominus$ $\rightarrow$ mìní~se na~$\odot$ a~posíláme informaci o~zmìnì hloubky.
166
167 \treepic{10}
168 \treepic{11}
169
170 \:problémová situace nastává, kdy¾ informace o~zmìnì pøi¹la zleva do~vrcholu se~znaménkem~$\oplus$
171 \endlist
172 \>Rozebereme na~tøi~pøípady podle znaménka pravého syna nevyvá¾eného vrcholu
173 \itemize\ibull
174 \:{\I pravý syn je typu~$\oplus$} $\rightarrow$ provedeme rotaci vlevo, novým koøenem se~stává~$y$ (pravý syn), oba vrcholy zmìní typ na~$\odot$ a~posíláme informaci o~zmìnì hloubky.
175
176 \treepic{12}
177
178 \:{\I pravý syn je typu~$\odot$} $\rightarrow$ provedeme opìt rotaci vlevo, koøenem se~stává~$y$, následnì se u~$y$ zmìní typ na~$\ominus$ , u~vrcholu~$x$ se typ nemìní. Hloubka stromu se~nemìní, tudí¾ není tøeba posílat informaci.
179
180 \treepic{12y}
181
182 \:{\I pravý syn je typu~$\ominus$} $\rightarrow$ v~tomto pøípadì uva¾ujeme je¹tì vrchol~$z$ jako levého syna vrcholu~$y$, s~podstromy $B$ a~$C$, podstromy $B$ a~$C$ mají hloubku~$h$ nebo~$h-1$. Provedeme dvojrotaci, napøed vpravo rotujeme vrcholy $z$ a~$y$, potom vlevo vrcholy~$x$ a~$z$ tak, ¾e se $z$ stane novým koøenem, typ vecholu~$x$ bude potom~$\ominus$ nebo~$\odot$, typ~$y$~$\oplus$ nebo~$\odot$ (podle toho, jaké znaménko mìl pùvodnì vrchol~$z$), typ~$z$ bude~$\odot$ a~opìt posíláme informaci o~zmìnì hloubky stromu.
183
184 \treepic{13}
185 \endlist
186
187 \h{Obecné vyhledávací stromy}
188
189 Pøi ulo¾ení dat na~disku se~sna¾íme, aby~se ètení z~disku provádìlo pokud mo¾no
190 co nejménìkrát a~nezále¾í nám tolik na~tom, kolik operací se~vykoná v~jednom
191 uzlu. (Èasovì je operace porovnávání zanedbatelná oproti ètení z~disku.)
192
193 \s{Definice:} {\I $(a,b)$-strom} pro parametry $a,b$, $a \geq 2$, $b\geq 2a - 1$ je zakoøenìný strom s~uspoøádanými syny a~vnìj¹ími vrcholy, pro který platí
194 následující axiomy:
195 \numlist\nparen
196 \:Data jsou ulo¾ena ve~vnitøních vrcholech a~ka¾dý vrchol obsahuje o~1 ménì klíèù ne¾ má synù.
197 \:Platí stromové uspoøádání, tedy ¾e $ A < x_1 < B < x_2 < C < x_3 < D $.
198 \:Koøen má $2$ a¾~$b$ synù, ostatní vnitøní vrcholy $a$ a¾ $b$ synù.
199 \:V¹echny vnìj¹í vrcholy jsou ve~stejné hloubce (vnìj¹í vrchol$=$list).
200 \endlist
201 \>{\I Poznámka:} kdekoli~by mohl být syn a~není, pøipojíme vrchol, kterému øíkáme vnìj¹í vrchol)
202
203 \abpic{ab-strom11}
204
205 \s{Lemma:} $(a,b)$-strom na~$n$~vrcholech má hloubku~$O(\log_a n)$.
206
207 \proof
208 Zjistíme jeho minimální poèet listù (oznaème jej $m$): ka¾dý vrchol a¾ na~koøen má alespoò $a$ synù, hloubku si oznaèíme~$d$ $\rightarrow$
209 $$m\geq~a^{(d -1)}$$
210 $$\log_a m \geq d -1$$
211 $$d \leq 1+ \log_a m$$
212 \centerline{co¾ je øádovì  $O(\log_a n)$, kde $n$ je poèet vrcholù.}\
213
214 \s{Operace s (a,b)-stromy:}
215
216 \s{Find}
217 \item{-}V¾dy zjistíme, mezi které 2 klíèe hledaný vrchol patøí a potom se zanoøíme hloubìji.\
218
219 \>Èasová slo¾itost nalezení prvku v $(a,b)$-stromu je $O(\log b \cdot \log_a n)$, kde $\log b$ je èas strávený na~jednom vrcholu pro zji¹tení, mezi které 2 vrcholy hledaný patøí, $\log_a n$ je hloubka stromu.
220
221 \s{Insert}
222
223 \>Jako Find, pøièem¾ jestli¾e nena¹el, skonèí na~posledním patøe a~pøidáme klíè
224 \itemize\ibull
225 \:pokud pøidáním nepøesáhneme maximální poèet klíèù mù¾eme skonèit
226 \abpic{insert1}
227 \:pokud pøidáním pøesáhneme maximální poèet klíèù
228 \endlist
229 \algo
230 \:rozdìlíme vrchol na~3 èásti: $L$,$x$,$P$
231 \:$L$ a $P$ jsou nové vrcholy
232 \:$x$ je hodnota mezi $L$ a $P$, kterou vlo¾íme o patro vý¹ jako klíè oddìlující novì vzniklé vrcholy $L$ a $P$
233 \:tím jsme pøevedli problém o patro vý¹ a opakujeme algoritmus
234 \endalgo
235
236 \abpics{b-klicu1}{b-klicu2}
237
238 \s{Poznámka:} Jestli¾e se dostaneme a¾ do koøene, rozdìlí se koøen na dvì èásti, vznikne nám nový koøen se dvìma syny (co¾ je povoleno) a celému stromu vzroste hloubka o jedna.
239
240 \s{Korektnost:}
241 Potøebujeme, aby
242 $$\vert L\vert \geq a-1$$
243 $$\vert P\vert \geq a-1$$
244 po seètení obou nerovností a~priètení 1 na~obì strany rovnice:
245 $$\vert L\vert +\vert P\vert +1\geq 2a-2+1=2a-1$$
246 pravá strana je rovna $b$ a~to podle definice $\geq 2a-1$. \par
247 \s{Èasová slo¾itost:} vkládání prvku do $(a,b)$-stromu je $O(b\cdot \log_a n)$.
248
249
250 \s{Delete}
251 \item{-} pøevedeme na~delete z~listu (stejný postup jako u~stromu: jestli¾e to není list, prohodíme tuto hodnotu s~nejmen¹í hodnotou podstromu jeho pravého syna) -- v tomto pøípadì na~klíè posledního vnitøního vrcholu, proto¾e listy jsou vnìj¹í vrcholy bez dat.
252 \itemize\ibull
253 \:pokud má vrchol, ze~kterého odebíráme stále $a-1$ klíèù, mù¾eme skonèit
254 \:pokud má vrchol($V$), ze~kterého odebíráme $a-2$ klíèù a~jeho levý sousední vrchol($L$) alespoò $a$ klíèù (klíè otce oddìlující tyto vrcholy oznaème $x$):
255 \endlist
256 \algo
257 \:sma¾eme nejvìt¹í klíè levého sousedního vrcholu ($L$) a~nahradíme tím klíè otce obou vrcholù (nahradíme $x$ za~tuto hodnotu)
258 \:pùvodní klíè otce($x$) pøidáme jako nejmen¹í klíè odebíranému vrcholu ($V$)
259 \:tím mají oba tyto vrcholy $a-1$ klíèù a mù¾eme skonèit
260 \endalgo
261 \abpics{delete21}{delete22}
262 \itemize\ibull
263 \:pokud má vrchol, z kterého odebíráme($V$) $a-2$ klíèù a jeho levý sousední vrchol($L$) $a-1$ klíèù (klíè otce oddìlující tyto vrcholy oznaème $x$):
264 \endlist
265 \algo
266 \:slouèíme $V$,$x$,$L$ do jednoho vrcholu
267 \:tím jsme problém pøevedli o patro vý¹ a opakujeme algoritmus \par
268 \endalgo
269 \abpics{delete31}{delete32}
270
271 \>{\I Poznámka:} Dojdeme-li takto a¾ do koøene, na místo klíèe odebraného z koøene lze pou¾ít nejmen¹í nebo nejvìt¹í klíè novì slouèeného podstromu. Ten odebrat lze, proto¾e po slouèení (které bylo pøíèinou této situace), je v nejni¾¹ím vrcholu $2a-2$ klíèù.
272
273 \>{\I Èasová slo¾itost:} $$O(b\cdot \log_a n)$$
274
275 \bye