3 \prednaska{2}{Slo¾itost, grafové algoritmy}
4 {(zapsal Martin Koutecký)}
8 Pøi analýze algoritmu bychom chtìli nìjak popsat jeho slo¾itost. Abychom mohli
9 udìlat toto, potøebujeme nejprve definovat výpoèetní model. Výpoèetních modelù
10 je více, my vybereme jeden pomìrnì blízký skuteèným poèítaèùm:
12 \s{Definice:} Random Access Machine ({\sc Ram})
14 {\sc Ram} poèítá jen s celými èísly -- znaky, stringy a podobnì reprezentujeme
15 èísly, jejich posloupnostmi atd. Pamì» je tvoøena buòkami, které obsahují
16 èísla. Pamì»ové buòky jsou adresované takté¾ èísly. A program samotný je
17 koneèná posloupnost instrukcí následujících druhù:
19 \:Aritmetické a logické:
20 $X$ |<-| $Y \oplus Z, \oplus\in\{|+|, |-|, |*|, |div|, |mod|, \&,
21 {\tt\char124}, |<<|, |>>|\}$
22 \:Øídící: |goto| \<label>, |halt|
23 \:Podmínky: pro libovolnou nepodmínìnou instrukci mù¾u pou¾ít \hfil \break
24 if~$X$~|<|~$Y$~|==>|~instrukce % Tady to prosím je¹tì zkontroluj. Myslím, ¾e
25 % zápis je správný, ale sází se to divnì a vidím èerný obdélníèek na konci
29 \s{Poznámka} (operandy):
31 \:Konstanty (1, 2, \dots)
32 \:Adresované pøímo -- M[konst.] -- budeme pou¾ívat písmena {\tt A-Z} jako aliasy
34 buòky pamìti $-1$ a¾ $-26$, které nazýváme registry.
36 \:Adresované nepøímo -- {\tt M[M[konst.]]} -- budeme pou¾ívat zkratku [[konst.]]
39 Samotný výpoèet probíhá takto:
41 \:Do smluvených bunìk umístíme vstup, obsah zbylých pamì»ových bunìk není
43 \:Provádíme program postupnì po instrukcích, dokud nedojdeme k haltu nebo konci
45 \:Pokud se program nezacyklil, tedy pokud skonèil, ze smluvených bunìk pøeèteme
51 \> Jak dobøe popsat slo¾itost?
53 \:{\I {\sc Ram} s jednotkovou cenou}: èas $\approx$ \#instrukcí, prostor
55 maximální èíslo buòky minus minimální èíslo buòky pou¾ité pøi výpoètu.
56 Toto není moc dobrý nápad, proto¾e není nijak penalizována napøíklad práce s
57 velmi dlouhými èísly -- poøád je to jedna instrukce, tak¾e cena je stejná, ale
58 poèítaèe se tak pøece nechovají. Velikost èísel ale omezit nesmíme, proto¾e
59 bychom omezili pamì» (èísly ji adresujeme).
60 \:{\I{\sc Ram} s logaritmickou cenou}: cena instrukce $\approx$ \#bitù
62 prostor $\approx$ \# bitù v¹ech pou¾itých bunìk. To je teoreticky pøesné, ale
63 dost nepraktické (ve v¹ech slo¾itostech by byly logaritmy).
64 \:{\I{\sc Ram} s omezenými èísly}: jednotková cena instrukcí, ale èísla omezíme
65 nìjakým polynomem $P(n)$. Tím zmizí paradoxy prvního modelu, ale
66 mù¾eme adresovat jen polynomiální prostor (to nám ov¹em obvykle nevadí).
69 Nadále tedy budeme pøedpokládat tøetí zmínìný model.
74 \:{\I Èas bìhu algoritmu} $t(x)$ pro vstup~$x$ mìøíme jako sumu èasù provedených
75 operací, které program provedl pøi zpracování vstupu
77 \:{\I Prostor bìhu algoritmu} $s(x)$ je analogicky poèet pamì»ových
78 bunìk spotøebovaných pøi výpoètu se vstupem~$x$.
79 \:{\I Èasová slo¾itost} (v~nejhor¹ím pøípadì) je:
80 $$T(n) := \max \{t(x) ; \hbox{$x$ je vstup délky $n$}\}.$$
81 \:{\I Prostorová slo¾itost} (v~nejhor¹ím pøípadì) je:
82 $$S(n) := \max \{s(x) ; \hbox{$x$ je vstup délky $n$}\}.$$
85 Nyní zkusíme zanalyzovat nìjaký konkrétní algoritmus. Vezmìme napøíklad øazení
86 pomocí pøímeho výbìru (selection sort). Na vstupu dostaneme poèet èísel $n$ (v
87 registru {\tt N}), v buòkách $1,\dots, n$ je nesetøídìná posloupnost èísel. Ta
89 tøídíme následujícím algoritmem zapsaným v pseudokódu:
94 \:::Je-li $[k]<[j]\Rightarrow j\leftarrow k$
95 \::$[i]$ prohodíme s $[j]$.
98 Jak by takový algoritmus vypadal zapsaný v instrukcích {\sc Ram}? Budeme muset
99 pou¾ít návì¹tí a goto místo cyklù, jména registrù místo promìnných a
100 tøeba prohození musíme provést pøes tøetí promìnnou. Nìjak takto:
105 MIN: IF [J]>=[M] ==> GOTO NEXT
113 IF I<=N ==> GOTO LOOP
116 Pojïme se podívat, jaká je èasová slo¾itost jednotlivých èástí algoritmu.
117 Cyklus |MIN| provede za prùchod 3 nebo 4 instrukce, ale zajímá nás nejhor¹í
118 pøípad, tak¾e 4. Zavolá se $(N-I+1)$-krát, tedy celkem provede $4\cdot (N-I+1)$
121 Mimo cyklu |MIN| je v |LOOP| je¹tì 7 instrukcí, tedy celý |LOOP| provede
122 $4\cdot (N-I+1)+7 = 4(N-1) + 11$ instrukcí.
124 Celkovì se dostáváme k souètu $$1+(\sum_{I=1}^{N} 4(N-I) + 11) = 1 + 11N +
125 4\cdot{N(N-1)\over 2} = 2N^2+9N + 1.$$
127 Na multiplikativních konstantách ale nezále¾í -- Na reálných strojích se
128 ceny jednotlivých (pro nás jednotkových) instrukcí stejnì li¹í, tak¾e
129 nemá cenu se multiplikativními konstantami zabývat (alespoò pøi prvním
130 pøiblí¾ení k problému).
132 $$2N^2 + 9N + 1 \approx N^2 + N$$
134 Navíc asymptoticky pomalej¹í funkce nakonec pro velké $N$ v¾dy prohraje. Tím
135 pádem nezále¾í ani na èlenech ni¾¹ích øádù:
137 $$N^2 + N \approx N^2$$
139 Kdy¾ u¾ toto víme, mù¾eme zanedbávat konstanty prùbì¾nì: $N$ cyklù po
140 $\approx\nobreak N$~krocích $\Rightarrow~\approx N^2$ krokù. To nás vede k zavedení
141 tzv. {\I asymptotické notace:}
143 \h{Asymptotická notace}
144 \s{Definice:} Pro funkce $f,g: {\bb N} \rightarrow {\bb R}^+$ øekneme,
145 ¾e $f$ je $\O(g)$ právì tehdy, kdy¾ $\exists c>0: \forall ^{*} n \in {\bb N}:
146 f(n) \leq c \cdot g(n)$.
147 Zde $\forall^* n \in {\bb N}$ je zkratka za \uv{$\exists n_0 \in {\bb N}:
148 \forall n \geq n_0$}, tedy
149 \uv{pro v¹echna~$n$ a¾ na~koneènì mnoho výjimek.}
151 \s{Poznámka:} $\O$-notace tedy vyjadøuje, ¾e funkce~$f$ je skoro v¹ude men¹í
152 nebo nejvý¹e rovná nìjakému reálnému násobku funkce~$g$. Aèkoliv zápis vypadá
153 jako rovnost, rozhodnì není symetrický: napøíklad platí $\log n=\O(n)$, ale
154 neplatí $n=\O(\log n)$. Formálnì by bylo lep¹í pova¾ovat $\O(g)$ za tøídu
155 funkcí, pro které platí, ¾e se dají shora odhadnout kladným násobkem funkce~$g$,
156 a~psát tedy~$f\in\O(g)$, ale zvyk je bohu¾el ¾elezná ko¹ile.
158 \s{Pøíklady:} $2{,}5n^{2} = \O(n^{2})$, $2{,}5n^{2}+30n = \O(n^{2})$.
162 \O(f)+\O(g) \in \O(f+g),
164 èím¾ myslíme, ¾e pokud vezmeme libovolnou $f'=O(f)$ a $g'=O(g)$, bude
166 To platí, jeliko¾ skoro v¹ude je $f' \leq cf$, $g'\leq dg$, a~tedy $f'+g' \le
167 cf+dg \le (c+d)(f+g)$.
169 \s{Cvièení:} Uka¾te, ¾e:
171 \:$\O(f) \cdot \O(g)=\O(f \cdot g)$,
172 \:$\O(f+g)=\O(\max(f,g))$,
173 \:$\O(n^{2})+\O(n)=\O(n^{2}+n)=\O(n^{2})$.
176 $\O$-notace popisuje horní odhad asymptotického chování funkce. Mnohdy v¹ak
177 potøebujeme také odhadnout funkci zespodu (chceme-li øíci, ¾e algoritmus
178 potøebuje {\I alespoò} nìjaké mno¾ství èasu nebo pamìti), pøípadnì z~obou stran:
183 \:$f=\Omega(g) \equiv \exists c>0:\forall^* n \in {\bb N}: f(n) \geq c\cdot
186 $\Omega$-notace tedy øíká, ¾e hodnota funkce $f$ je v¾dy stejná nebo vy¹¹í ne¾
187 nìjaký $c$-násobek funkce $g$, a tedy $g=\O(f)$.
188 \:$f=\Theta(g) \equiv f=\O(g) \wedge f=\Omega(g)$
192 $f=\Theta(g) \equiv \exists$ $c_{1},c_{2} > 0: \forall^* n \in {\bb
193 N}: c_{1}\cdot g(n) \leq f(n) \leq
194 c_{2}\cdot g(n)$ To znamená, ¾e existují nezáporné reálné konstanty
195 $c_{1},c_{2}$ takové, ¾e se funkce $f(n)$ dá ohranièit $c_{1}$- a
196 $c_{2}$-násobkem funkce $g(n)$.
199 \>{\sl Poznámka:} Ona rovnost je dost zavádìjící. Není to toti¾ rovnost, není
200 to symetrické. Jiný, mo¾ná rozumnìj¹í pohled, je zavedení $\O(g)$ jako mno¾iny.
201 Pak by se dalo psát $f \in \O(g)$, nebo tøeba $\O(n) \subseteq \O(n^2)$.
203 \s{Porovnání rùstu funkcí:} (aneb jak moc máme algoritmy rádi podle jejich
204 chování od~nejlep¹ích k~nejhor¹ím)
207 \:$\Theta(1) \ldots$ funkce zespoda i shora ohranièené konstantami
208 \:$\Theta(\log{( \log{n} )})$
209 \:$\Theta(\log{n})$ \dots\ logaritmická
210 \:$\Theta(n^{\varepsilon}), \varepsilon \in (0,1)$ \dots\ sublineární
211 \:$\Theta(n)$ \dots\ lineární
212 \:$\Theta(n^{2})$ \dots\ kvadratická
213 \:$\Theta(n^{k})$ \dots\ polynomiální
214 \:$\Theta(2^{n})$ \dots\ exponenciální pøi základu $2$
215 \:$\Theta(3^{n})$ \dots\ exponenciální pøi základu $3$
216 \:$\Theta(k^{n})$ \dots\ exponenciální pøi základu $k>1$
217 \:$\Theta(n!)$ \dots\ faktoriálová
219 \:\dots\ nekoneènì mnoho dal¹ích tøíd (i mezi tìmi vý¹e uvedenými)
222 \>{\sl Poznámka:} Pokud se v~odhadu slo¾itosti vyskytne logaritmus (jinde ne¾
223 v~exponentu), nezále¾í na tom, jaký má základ, proto¾e platí:
225 \log_k{n}={{\log_c{n}}\over{\log_c{k}}}={{1}\over{\log_c{k}}}\cdot \log_c{n},
227 kde $1/\log_c{k}$ je jen konstanta, tak¾e ji mù¾eme \uv{schovat do~$\O$}.
229 \s{Pøíklad:} Select sort (rozebraný vý¹e):
230 Kdy¾ jej pustíme na $n$ èísel, pak èasová slo¾itost je $T(n) = \Theta(n^2)$ a
231 prostorová $S(n) = \Theta(n)$.
233 \h{Úvod do grafových algoritmù}
234 Dal¹í dùle¾itou a zajímavou kapitolou jsou grafové algoritmy. Napøíklad
235 následující pøíklady lze (i kdy¾ to tak obèas na první pohled nevypadá) øe¹it
236 nìjakým grafovým algoritmem:
238 \:Mám mapku silnièní sítì, v ní místa (vrcholy) oznaèená \uv{Doma} a \uv{©kola}.
240 ¹koly (le¾í ve stejné komponentì souvislosti)? Dostanu se do ¹koly, kdy¾ v zimì
241 napadne hodnì snìhu a nìkteré cesty budou neprùjezdné? A jaký nejkrat¹í úsek
242 cest musí silnièáøi prohrnout, aby byla v¹echna místa na mapì dostupná?
243 \:Mìjme hlavolam \uv{Lloydova devítka} -- krabièku $3\times3$ se ètvereèky
244 oznaèenými èísly od jedné do osmi a jednou mezerou, ètvereèky jsou zamíchané a
245 na¹ím úkolem je správnì je seøadit pomocí pøesouvání ètvereèkù sousedících s
246 mezerou do této mezery. Jak to udìlat? Kolik nejménì krokù nám na
247 to staèí? Jde to vùbec se zadáním, které jsme dostali?
248 \:Jaké je nejkrat¹í (kladné, celé) èíslo v desítkové soustavì zapsané jen
249 èíslicemi 1, 0, které je dìlitelné tøinácti? Nakreslíme orientovaný graf s
251 a hranami $(x,y),$ $y=10\cdot x \mod 13$ a $y=(10\cdot x + 1) \mod 13$
252 (z~ka¾dého vrcholu vychází jedna hrana za pøidání èíslice 1 a dal¹í za èíslici
253 0). Hledané èíslo existuje právì tehdy, kdy¾ graf obsahuje orientovaný sled
254 z~1~do~0. Jakým algoritmem takový sled najdeme?
256 Podobné a dal¹í úlohy budeme øe¹it v následujících kapitolách.