]> mj.ucw.cz Git - ads1.git/blob - 2-ram/2-ram.tex
Sazba.
[ads1.git] / 2-ram / 2-ram.tex
1 \input ../lecnotes.tex
2
3 \prednaska{2}{Slo¾itost, grafové algoritmy}
4 {(zapsal Martin Koutecký)}
5
6 \h{Model {\sc Ram}}
7
8 Pøi analýze algoritmu bychom chtìli nìjak popsat jeho slo¾itost. Abychom mohli
9  udìlat toto, potøebujeme nejprve definovat výpoèetní model. Výpoèetních modelù
10 je více, my vybereme jeden pomìrnì blízký skuteèným poèítaèùm:
11
12 \s{Definice:} Random Access Machine ({\sc Ram})
13
14 {\sc Ram} poèítá jen s celými èísly -- znaky, stringy a podobnì reprezentujeme
15 èísly, jejich posloupnostmi atd. Pamì» je tvoøena buòkami, které obsahují
16 èísla. Pamì»ové buòky jsou adresované takté¾ èísly. A program samotný je
17 koneèná posloupnost instrukcí následujících druhù:
18 \itemize\ibull
19 \:Aritmetické a logické:
20 $X$ |<-| $Y \oplus Z, \oplus\in\{|+|, |-|, |*|, |div|, |mod|, \&,
21 {\tt\char124}, |<<|, |>>|\}$
22 \:Øídící: |goto| \<label>, |halt|
23 \:Podmínky: pro libovolnou nepodmínìnou instrukci mù¾u pou¾ít \hfil \break
24 if~$X$~|<|~$Y$~|==>|~instrukce % Tady to prosím je¹tì zkontroluj. Myslím, ¾e
25 % zápis je správný, ale sází se to divnì a vidím èerný obdélníèek na konci
26 % øádku. Díky.
27 \endlist
28
29 \s{Poznámka} (operandy):
30 \itemize\ibull
31 \:Konstanty (1, 2, \dots)
32 \:Adresované pøímo -- M[konst.] -- budeme pou¾ívat písmena {\tt A-Z} jako aliasy
33 pro
34 buòky pamìti $-1$ a¾ $-26$, které nazýváme registry.
35 (tedy A={\tt M[-1]})
36 \:Adresované nepøímo -- {\tt M[M[konst.]]} -- budeme pou¾ívat zkratku [[konst.]]
37 \endlist
38
39 Samotný výpoèet probíhá takto:
40 \algo
41 \:Do smluvených bunìk umístíme vstup, obsah zbylých pamì»ových bunìk není
42 definován.
43 \:Provádíme program postupnì po instrukcích, dokud nedojdeme k haltu nebo konci
44 programu.
45 \:Pokud se program nezacyklil, tedy pokud skonèil, ze smluvených bunìk pøeèteme
46 výstup.
47 \endalgo
48
49
50 \h{Slo¾itost}
51 \> Jak dobøe popsat slo¾itost?
52 \numlist\ndotted
53 \:{\I {\sc Ram} s jednotkovou cenou}: èas $\approx$ \#instrukcí, prostor
54 $\approx$
55 maximální èíslo buòky minus minimální èíslo buòky pou¾ité pøi výpoètu.
56 Toto není moc dobrý nápad, proto¾e není nijak penalizována napøíklad práce s
57 velmi dlouhými èísly -- poøád je to jedna instrukce, tak¾e cena je stejná, ale
58 poèítaèe se tak pøece nechovají. Velikost èísel ale omezit nesmíme, proto¾e
59 bychom omezili pamì» (èísly ji adresujeme).
60 \:{\I{\sc Ram} s logaritmickou cenou}: cena instrukce $\approx$ \#bitù
61 zpracovávaných èísel,
62 prostor $\approx$ \# bitù v¹ech pou¾itých bunìk. To je teoreticky pøesné, ale
63 dost nepraktické (ve v¹ech slo¾itostech by byly logaritmy).
64 \:{\I{\sc Ram} s omezenými èísly}: jednotková cena instrukcí, ale èísla omezíme
65 nìjakým polynomem $P(n)$. Tím zmizí paradoxy prvního modelu, ale
66 mù¾eme adresovat jen polynomiální prostor (to nám ov¹em obvykle nevadí).
67 \endlist
68
69 Nadále tedy budeme pøedpokládat tøetí zmínìný model.
70
71 % Z minulých zápiskù.
72 \s{Definice:}
73 \itemize\ibull
74 \:{\I Èas bìhu algoritmu} $t(x)$ pro vstup~$x$ mìøíme jako sumu èasù provedených
75 operací, které program provedl pøi zpracování vstupu
76 $x$.
77 \:{\I Prostor bìhu algoritmu} $s(x)$ je analogicky poèet pamì»ových
78 bunìk spotøebovaných pøi výpoètu se vstupem~$x$.
79 \:{\I Èasová slo¾itost} (v~nejhor¹ím pøípadì) je:
80 $$T(n) := \max \{t(x) ; \hbox{$x$ je vstup délky $n$}\}.$$
81 \:{\I Prostorová slo¾itost} (v~nejhor¹ím pøípadì) je:
82 $$S(n) := \max \{s(x) ; \hbox{$x$ je vstup délky $n$}\}.$$
83 \endlist
84
85 Nyní zkusíme zanalyzovat nìjaký konkrétní algoritmus. Vezmìme napøíklad øazení
86 pomocí pøímeho výbìru (selection sort). Na vstupu dostaneme poèet èísel $n$ (v
87 registru {\tt N}), v buòkách $1,\dots, n$ je nesetøídìná posloupnost èísel. Ta
88 pak
89 tøídíme následujícím algoritmem zapsaným v pseudokódu:
90 \algo
91 \:Pro $i=1$ do $n$:
92 \::$j\leftarrow i$
93 \::Pro $k=i$ do $n$:
94 \:::Je-li $[k]<[j]\Rightarrow j\leftarrow k$
95 \::$[i]$ prohodíme s $[j]$.
96 \endalgo
97
98 Jak by takový algoritmus vypadal zapsaný v instrukcích {\sc Ram}? Budeme muset
99 pou¾ít návì¹tí a goto místo cyklù, jména registrù místo promìnných a
100 tøeba prohození musíme provést pøes tøetí promìnnou. Nìjak takto:
101
102 \verbatim{      I <- 1
103 LOOP:   J <- I
104         M <- I
105 MIN:    IF [J]<[M] ==> M <- J
106         J <- J+1
107         IF J<=N ==> GOTO MIN
108         X <- [I]
109         [I] <- [M]
110         [M] <- X
111         I <- I+1
112         IF I<=N ==> GOTO LOOP
113 }
114
115 Pojïme se podívat, jaká je èasová slo¾itost jednotlivých èástí algoritmu.
116 Cyklus |MIN| provede $3\cdot (N-I+1)$ instrukcí. Mimo cyklu |MIN| je v |LOOP|
117 je¹tì 7 instrukcí, tedy celý |LOOP| provede $3\cdot (N-I+1)+7$ instrukcí.
118 Celkovì se dostáváme k souètu
119 $$1+3\cdot N+7+3\cdot (N-1)+7+3\cdot (N-2)+7+3\cdot (N-3)+\dots +3\cdot 1+7 =$$
120 $$1+7\cdot N+3\cdot {{N(N+1)}\over{2}} = {{3}\over{2}}N^2 + 8{,}5N + 1$$
121
122 Na multiplikativních konstantách ale nezále¾í -- zaprvé se na reálných strojích
123 ceny jednotlivých (pro nás jednotkových) instrukcí stejnì li¹í, zadruhé
124 asymptoticky pomalej¹í funkce nakonec pro velké $N$ v¾dy prohraje, tak¾e nemá
125 cenu
126 (alespoò pøi prvním pøiblí¾ení k problému) multiplikativními konstantami se
127 zabývat. Tím pádem nezále¾í ani na èlenech ni¾¹í øádù:
128 $$1{,}5N^2 + 8{,}5N + 1 \leq 1{,}5N^2 + 8{,}5N^2 + N^2 = 11N^2\approx N^2$$
129 Kdy¾ u¾ toto víme, mù¾eme zanedbávat konstanty prùbì¾nì: $N$ cyklù po
130 ${}\approx~N$~krocích $\Rightarrow~\approx~N^2$ krokù. To nás vede k zavedení
131 tzv.
132 {\I asymptotické notace:}
133
134 \h{Asymptotická notace}
135 \s{Definice:} Pro funkce $f,g: {\bb N} \rightarrow {\bb R}^+$ øekneme,
136 ¾e $f$ je $\O(g)$ právì tehdy, kdy¾ $\exists c>0: \forall ^{*} n \in {\bb N}:
137 f(n) \leq c \cdot g(n)$.
138 Zde $\forall^* n \in {\bb N}$ je zkratka za \uv{$\exists n_0 \in {\bb N}:
139 \forall n \geq n_0$}, tedy
140 \uv{pro v¹echna~$n$ a¾ na~koneènì mnoho výjimek.}
141
142 \s{Poznámka:} $\O$-notace tedy vyjadøuje, ¾e funkce~$f$ je skoro v¹ude men¹í
143 nebo nejvý¹e rovná nìjakému reálnému násobku funkce~$g$. Aèkoliv zápis vypadá
144 jako rovnost, rozhodnì není symetrický: napøíklad platí $\log n=\O(n)$, ale
145 neplatí $n=\O(\log n)$. Formálnì by bylo lep¹í pova¾ovat $\O(g)$ za tøídu
146 funkcí, pro které platí, ¾e se dají shora odhadnout kladným násobkem funkce~$g$,
147 a~psát tedy~$f\in\O(g)$, ale zvyk je bohu¾el ¾elezná ko¹ile.
148
149 \s{Pøíklady:} $2{,}5n^{2} = \O(n^{2})$, $2{,}5n^{2}+30n = \O(n^{2})$.
150
151 \>Také platí:
152 $$
153 \O(f)+\O(g) \in \O(f+g),
154 $$
155 èím¾ myslíme, ¾e pokud vezmeme libovolnou $f'=O(f)$ a $g'=O(g)$, bude
156 $f'+g'=O(f+g)$.
157 To platí, jeliko¾ skoro v¹ude je $f' \leq cf$, $g'\leq dg$, a~tedy $f'+g' \le
158 cf+dg \le (c+d)(f+g)$.
159
160 \s{Cvièení:} Uka¾te, ¾e:
161 \itemize\ibull
162 \:$\O(f) \cdot \O(g)=\O(f \cdot g)$,
163 \:$\O(f+g)=\O(\max(f,g))$,
164 \:$\O(n^{2})+\O(n)=\O(n^{2}+n)=\O(n^{2})$.
165 \endlist
166
167 $\O$-notace popisuje horní odhad asymptotického chování funkce. Mnohdy v¹ak
168 potøebujeme také odhadnout funkci zespodu (chceme-li øíci, ¾e algoritmus
169 potøebuje {\I alespoò} nìjaké mno¾ství èasu nebo pamìti), pøípadnì z~obou stran:
170
171 \s{Definice:}
172
173 \itemize\ibull
174 \:$f=\Omega(g) \equiv \exists c>0:\forall^* n \in {\bb N}: f(n) \geq c\cdot
175 g(n)$.
176
177 $\Omega$-notace tedy øíká, ¾e hodnota funkce $f$ je v¾dy stejná nebo vy¹¹í ne¾
178 nìjaký $c$-násobek funkce $g$, a tedy $g=\O(f)$.
179 \:$f=\Theta(g) \equiv f=\O(g) \wedge f=\Omega(g)$
180
181 nebo výøeènìji:
182
183 $f=\Theta(g) \equiv \exists$ $c_{1},c_{2} > 0: \forall^* n \in {\bb
184 N}: c_{1}\cdot g(n) \leq f(n) \leq
185 c_{2}\cdot g(n)$ To znamená, ¾e existují nezáporné reálné konstanty
186 $c_{1},c_{2}$ takové, ¾e se funkce $f(n)$ dá ohranièit $c_{1}$- a
187 $c_{2}$-násobkem funkce $g(n)$.
188 \endlist
189
190 \s{Porovnání rùstu funkcí:} (aneb jak moc máme algoritmy rádi podle jejich
191 chování od~nejlep¹ích k~nejhor¹ím)
192
193 \itemize\ibull
194 \:$\Theta(1) \ldots$ funkce zespoda i shora ohranièené konstantami
195 \:$\Theta(\log{( \log{n} )})$
196 \:$\Theta(\log{n})$ \dots\ logaritmická
197 \:$\Theta(n^{\varepsilon}), \varepsilon \in (0,1)$ \dots\ sublineární
198 \:$\Theta(n)$ \dots\ lineární
199 \:$\Theta(n^{2})$ \dots\ kvadratická
200 \:$\Theta(n^{k})$ \dots\ polynomiální
201 \:$\Theta(2^{n})$ \dots\ exponenciální pøi základu $2$
202 \:$\Theta(3^{n})$ \dots\ exponenciální pøi základu $3$
203 \:$\Theta(k^{n})$ \dots\  exponenciální pøi základu $k>1$
204 \:$\Theta(n!)$ \dots\ faktoriálová
205 \:$\Theta(n^{n})$
206 \:\dots\ nekoneènì mnoho dal¹ích tøíd (i mezi tìmi vý¹e uvedenými)
207 \endlist
208
209 \>{\sl Poznámka:} Pokud se v~odhadu slo¾itosti vyskytne logaritmus (jinde ne¾
210 v~exponentu), nezále¾í na tom, jaký má základ, proto¾e platí:
211 $$
212 \log_k{n}={{\log_c{n}}\over{\log_c{k}}}={{1}\over{\log_c{k}}}\cdot \log_c{n},
213 $$
214 kde $1/\log_c{k}$ je jen konstanta, tak¾e ji mù¾eme \uv{schovat do~$\O$}.
215
216 \s{Pøíklad:} Select sort (rozebraný vý¹e):
217 Kdy¾ jej pustíme na $n$ èísel, pak èasová slo¾itost je $T(n) = \Theta(n^2)$ a
218 prostorová $S(n) = \Theta(n)$.
219
220 \h{Úvod do grafových algoritmù}
221 Dal¹í dùle¾itou a zajímavou kapitolou jsou grafové algoritmy. Napøíklad
222 následující pøíklady lze (i kdy¾ to tak obèas na první pohled nevypadá) øe¹it
223 nìjakým grafovým algoritmem:
224 \itemize\ibull
225 \:Mám mapku silnièní sítì, v ní místa (vrcholy) oznaèená \uv{Doma} a \uv{©kola}.
226 Dostanu se do
227 ¹koly (le¾í ve stejné komponentì souvislosti)? Dostanu se do ¹koly, kdy¾ v zimì
228 napadne hodnì snìhu a nìkteré cesty budou neprùjezdné? A jaký nejkrat¹í úsek
229 cest musí silnièáøi prohrnout, aby byla v¹echna místa na mapì dostupná?
230 \:Mìjme hlavolam \uv{Lloydova devítka} -- krabièku $3\times3$ se ètvereèky
231 oznaèenými èísly od jedné do osmi a jednou mezerou, ètvereèky jsou zamíchané a
232 na¹ím úkolem je správnì je seøadit pomocí pøesouvání ètvereèkù sousedících s
233 mezerou do této mezery. Jak to udìlat? Kolik nejménì krokù nám na
234 to staèí? Jde to vùbec se zadáním, které jsme dostali?
235 \:Jaké je nejkrat¹í (kladné, celé) èíslo v desítkové soustavì zapsané jen
236 èíslicemi 1, 0, které je dìlitelné tøinácti? Nakreslíme orientovaný graf s
237 vrcholy 0 a¾ 12
238 a hranami $(x,y),$ $y=10\cdot x \mod 13$ a $y=(10\cdot x + 1) \mod 13$
239 (z~ka¾dého vrcholu vychází jedna hrana za pøidání èíslice 1 a dal¹í za èíslici
240 0). Hledané èíslo existuje právì tehdy, kdy¾ graf obsahuje orientovaný sled
241 z~1~do~0. Jakým algoritmem takový sled najdeme?
242 \endlist
243 Podobné a dal¹í úlohy budeme øe¹it v následujících kapitolách.
244
245 \bye