]> mj.ucw.cz Git - ga.git/blob - 14-floyd/14-floyd.tex
APSP: Prepsana cast o regularnich vyrazech a nasobeni matic
[ga.git] / 14-floyd / 14-floyd.tex
1 \input ../sgr.tex
2
3 \prednaska{13}{Nejkrat¹í cesty: Maticové metody}{}
4
5 V~pøedchozí kapitole jsme se zabývali algoritmy pro hledání nejkrat¹ích
6 cest z~daného poèáteèního vrcholu. Nyní se zamìøíme na výpoèet celé
7 metriky grafu, tedy matice vzdáleností, která pro ka¾dou dvojici vrcholù
8 obsahuje délku nejkrat¹í cesty mezi nimi.
9
10 Jeden zpùsob se ihned nabízí: postupnì spustit Dijkstrùv algoritmus pro v¹echny
11 mo¾né volby poèáteèního vrcholu, pøípadnì se pøed tím je¹tì pomocí potenciálù
12 zbavit záporných hran. Tak dosáhneme èasové slo¾itosti $\O(mn + n^2\log n)$,
13 co¾ je pro øídké grafy nejlep¹í známý výsledek -- jen $\O(\log n)$-krát
14 pomalej¹í, ne¾ je velikost výstupu.
15
16 Pro husté grafy obvykle pracují rychleji algoritmy zalo¾ené na maticích a zejména
17 na jejich násobení. Nìkolik takových si nyní pøedvedeme. Vrcholy grafu budou
18 v¾dy oèíslované èísly 1 a¾~$n$ a graf doplníme na úplný, pøièem¾ hrany, které
19 pùvodnì neexistovaly, obdr¾í délku $+\infty$.
20
21 \h{Floydùv-Warshallùv algoritmus}
22
23 Zaènìme algoritmem, který nezávisle na sobì objevili Floyd a Warshall.
24 Funguje pro libovolný orientovaný graf bez záporných cyklù.
25
26 Oznaème $D^k_{ij}$ délku nejkrat¹í cesty z~vrcholu~$i$ do vrcholu~$j$ pøes
27 vrcholy 1 a¾~$k$ (tím myslíme, ¾e v¹echny vnitøní vrcholy cesty le¾í v~mno¾inì $\{1,\ldots,k\}$).
28 Jako obvykle polo¾íme $D^k_{ij}=+\infty$, pokud ¾ádná taková cesta neexistuje.
29 Pak platí:
30 $$\eqalign{
31 D^0_{ij} &= \hbox{délka hrany $ij$,} \cr
32 D^n_{ij} &= \hbox{vzdálenost z~$i$ do~$j$,} \cr
33 D^k_{ij} &= \min( D^{k-1}_ij, D^{k-1}_{ik} + D^{k-1}_{kj} ). \cr
34 }$$
35 První dvì rovnosti dostaneme pøímo z~definice. Tøetí rovnost dostaneme rozdìlením
36 cest z~$i$ do~$j$ pøes 1 a¾~$k$ na ty, které se vrcholu~$k$ vyhnou (a~jsou tedy
37 cestami pøes 1 a¾~$k-1$), a ty, které ho pou¾ijí -- ka¾dou takovou mù¾eme slo¾it
38 z~cesty z~$i$ do~$k$ a cesty z~$k$ do~$j$, obojí pøes 1 a¾~$k-1$.
39
40 Zbývá vyøe¹it jednu malièkost: slo¾ením cesty z~$i$ do~$k$ s~cestou z~$k$ do~$j$
41 nemusí nutnì vzniknout cesta, proto¾e se nìjaký vrchol mù¾e opakovat. V~grafech
42 bez záporných cyklù nicménì takový sled nemù¾e být krat¹í ne¾ nejkrat¹í cesta,
43 tak¾e tím fale¹né øe¹ení nevyrobíme. (Pøesnìji: ze sledu $i\alpha v\beta k\gamma v\delta j$,
44 kde $v\not\in\beta,\gamma$, mù¾eme vypu¹tìním èásti $v\beta k\gamma v$ nezáporné
45 délky získat sled z~$i$ do~$j$ pøes 1 a¾~$k-1$, jeho¾ délka nemù¾e být men¹í
46 ne¾~$D^{k-1}{ij}$.)
47
48 Samotný algoritmus pak postupnì poèítá matice $D^0, D^1, \ldots, D^n$:
49
50 \algo
51 \:$D^0 \leftarrow \hbox{matice délek hran}$
52 \:Pro $k=1,\ldots,n$:
53 \::Pro $i,j=1,\ldots,n$:
54 \:::$D^k_{ij} = \min( D^{k-1}_ij, D^{k-1}_{ik} + D^{k-1}_{kj} )$.
55 \:$\hbox{Matice vzdáleností} \leftarrow D^n.$
56 \endalgo
57
58 Èasová slo¾itost tohoto algoritmu èiní $\Theta(n^3)$. Kubickou prostorovou
59 slo¾itost mù¾eme snadno sní¾it na~kvadratickou: Buï si uvìdomíme, ¾e v~ka¾dém
60 okam¾iku potøebujeme jen aktuální matici~$D^k$ a pøedchozí~$D^{k-1}$. Anebo
61 nahlédneme, ¾e mù¾eme $D^{k-1}$ na~$D^k$ pøepisovat na místì. U~hodnot $D_{ik}$
62 a~$D_{kj}$ je toti¾ podle definice stará i nová hodnota stejná. Algoritmu tedy
63 staèí $\Theta(n^2)$ pamìti.
64
65 \h{Regulární výrazy}
66
67 Pøedchozí algoritmus lze zajímavì zobecnit, toti¾ tak, aby pro ka¾dou dvojici
68 vrcholù sestrojil vhodnou reprezentaci mno¾iny v¹ech sledù vedoucích mezi touto
69 dvojicí. Tato reprezentace bude velice podobná regulárním výrazùm známým
70 z~teorie automatù. Zadaný orientovaný graf pøitom mù¾e obsahovat i smyèky
71 a násobné hrany.
72
73 \s{Definice:} {\I Svazek} je mno¾ina sledù, které mají spoleèný poèáteèní
74 a koncový vrchol. {\I Typem} svazku nazveme uspoøádanou dvojici tìchto vrcholù.
75 Místo \uv{svazek typu $(u,v)$} budeme obvykle øíkat prostì {\I $uv$-svazek.}
76
77 Triviálními pøípady svazkù jsou prázdná mno¾ina~$\emptyset$, hrana~$uv$ a pro
78 $u=v$ také sled~$\varepsilon$ nulové délky. Svazky mù¾eme kombinovat
79 následujícími operacemi:
80
81 \itemize\ibull
82 \:$A\cup B$ -- {\I sjednocení} dvou svazkù tého¾ typu,
83 \:$AB$ nebo $A\cdot B$ -- {\I zøetìzení} $uv$-svazku~$A$ s~$vw$-svazkem~$B$: výsledkem je $uw$-svazek
84 obsahující v¹echna spojení sledu z~$A$ se sledem z~$B$,
85 \:$A^*$ -- {\I iterace} $uu$-svazku: výsledkem je $uu$-svazek
86 $\varepsilon \cup A \cup AA \cup AAA \cup \ldots$ (tedy v¹echna mo¾ná
87 spojení koneènì mnoha sledù z~$A$).
88 \endlist
89
90 \>Ve~výrazu definujícím~$A^*$ jsme vyu¾ili, ¾e operace sjednocení a zøetìzení
91 jsou asociativní, tak¾e je nemusíme závorkovat. Navíc sjednocení má ve~výrazech
92 ni¾¹í prioritu ne¾ zøetìzení.
93
94 \>Svazky budeme obvykle reprezentovat {\I sledovými výrazy,} co¾ jsou
95 výrazy koneèné délky sestávající se z~triviálních svazkù a vý¹e uvedených
96 operací.
97
98 \s{Pozorování:} Sledy mù¾eme reprezentovat øetìzci nad abecedou, její¾
99 symboly jsou identifikátory hran. Sledové výrazy pak odpovídají regulárním
100 výrazùm nad touto abecedou.
101
102 Uká¾eme, jak pro v¹echny dvojice vrcholu $i,j$ sestrojit sledový výraz $R_{ij}$
103 popisující svazek v¹ech sledù z~$i$ do~$j$. Podobnì jako u~Floydova-Warshallova
104 algoritmu zavedeme $R^k_{ij}$ coby výraz popisující sledy z~$i$ do~$j$ pøes 1 a¾~$k$
105 a nahlédneme, ¾e platí:
106 $$\eqalign{
107 R^0_{ij} &= \hbox{mno¾ina v¹ech hran z~$i$ do~$j$}, \cr
108 R^n_{ij} &= \hbox{hledané $R_{ij}$}, \cr
109 R^k_{ij} &= R^{k-1}_{ij} \cup R^{k-1}_{ik}(R^{k-1}_{kk})^*R^{k-1}_{kj}. \cr
110 }$$
111 První dvì rovnosti opìt dostaneme pøímo z~definice (mno¾inu v¹ech hran zapí¹eme
112 buï jako prázdnou nebo ji vytvoøíme sjednocováním z~jednoprvkových mno¾in). Tøetí
113 rovnost vychází z~toho, ¾e ka¾dý sled z~$i$ do~$j$ buï neobsahuje~$k$, nebo ho
114 mù¾eme rozdìlit na~èásti mezi jednotlivými náv¹tìvami vrcholu~$k$.
115
116 Algoritmus tedy bude postupnì budovat matice $R^0, R^1, \ldots, R^n$ podle tìchto
117 pravidel. Provedeme pøi tom $\Theta(n^3)$ operací, ov¹em s~výrazy, jejich¾ délka
118 mù¾e být a¾ øádovì~$4^n$. Radìji ne¾ jako øetìzce je budeme ukládat v~podobì
119 acyklických orientovaných grafù: vrcholy budou operace, hrany je budou pøipojovat
120 k~operandùm.
121
122 K~pøímému pou¾ití se takový exponenciálnì dlouhý výraz hodí málokdy, ale mù¾e
123 nám pomoci odpovídat na rùzné otázky týkající se sledù s~danými koncovými vrcholy.
124 Máme-li nìjakou funkci~$f$ pøiøazující hodnoty mno¾inám sledù kódovaným sledovými
125 výrazy, staèí umìt vyhodnotit:
126 \itemize\ibull
127 \:výsledek pro triviální výrazy $f(\emptyset)$, $f(\varepsilon)$ a $f(e)$ pro hranu~$e$,
128 \:hodnoty $f(\alpha\cup\beta)$, $f(\alpha\beta)$ a $f(\alpha^*)$, známe-li ji¾ $f(\alpha)$ a $f(\beta)$.
129 \endlist
130 \>Pro výpoèet v¹ech $f(R_{ij})$ nám pak staèí $\Theta(n^3)$ vyhodnocení funkce~$f$.
131
132 \s{Poznámka pro ctitele algebry:} Vý¹e uvedená konstrukce není nic jiného, ne¾ popis
133 homomorfismu~$f$ z~algebry $({\cal S},\emptyset,\varepsilon_1,\ldots,\varepsilon_n,
134 e_1,\ldots,e_m,\cup,\cdot,{}^*)$ nad mno¾inou~${\cal S}$ v¹ech svazkù do~nìjaké
135 algebry $(X,{\bf 0},c_1,\ldots,c_n,h_1,\ldots,h_m,\oplus,\otimes,\circledast)$, kde~$X$ je mno¾ina
136 v¹ech ohodnocení sledù, {\bf 0}, $c_1,\ldots,c_n$ a $h_1,\ldots,h_m$ jsou konstanty,
137 $\oplus$ a~$\otimes$ binární operace a $\circledast$ unární operace. Prùbìh výpoètu
138 upraveného algoritmu je pak homomorfním obrazem prùbìhu výpoètu pùvodního algoritmu
139 pracujícího pøímo se svazky.
140
141 \s{Pøíklady:}
142
143 \>{\I Nejkrat¹í sled:}
144 $$\eqalign{
145 f(\emptyset)&=+\infty \cr
146 f(\varepsilon)&=0 \cr
147 f(e)&=\ell(e) \hbox{\quad (délka hrany)} \cr
148 f(\alpha\cup\beta) &= \min(f(\alpha),f(\beta)) \cr
149 f(\alpha\beta) &= f(\alpha) + f(\beta) \cr
150 f(\alpha^*) &= \cases{0 & \hbox{pro $f(\alpha)\ge 0$} \cr -\infty & \hbox{pro $f(\alpha)<0$} \cr} \cr
151 }$$
152 (Pokud pøedpokládáme, ¾e v~grafu nejsou záporné cykly, je $f(\alpha^*)$ v¾dy nulové
153 a dostaneme pøesnì Floydùv-Warshallùv algoritmus.)
154
155 \>{\I Nej¹ir¹í cesta} (hranám jsou pøiøazeny ¹íøky, ¹íøka cesty je minimum z~¹íøek hran):
156 $$\eqalign{
157 f(\emptyset)&=0 \cr
158 f(\varepsilon)&=\infty \cr
159 f(e)&=w(e) \hbox{\quad (¹íøka hrany)} \cr
160 f(\alpha\cup\beta) &= \max(f(\alpha),f(\beta)) \cr
161 f(\alpha\beta) &= \min(f(\alpha),f(\beta)) \cr
162 f(\alpha^*) &= \infty \cr
163 }$$
164
165 \>{\I Pøevod koneèného automatu na regulární výraz:} Vrcholy multigrafu budou odpovídat
166 stavùm automatu, hrany mo¾ným pøechodùm mezi stavy. Ka¾dou hranu ohodnotíme symbolem
167 abecedy, po jeho¾ pøeètení automat pøechod provede. Funkce~$f$ pak pøiøadí $uv$-svazku~$\psi$
168 regulární výraz popisující mno¾inu v¹ech øetìzcù, po jejich¾ pøeètení automat pøejde
169 ze~stavu~$u$ do stavu~$v$ po pøechodech z~mno¾iny~$\psi$. Vyhodnocování funkce~$f$
170 odpovídá pøímoèarým operacím s~øetìzci.
171
172 \h{Násobení matic}
173
174 Øe¹íme-li grafové problémy pomocí matic, nabízí se pou¾ít známé subkubické algoritmy
175 pro lineárnì algebraické úlohy. Ty jsou obvykle zalo¾eny na efektivním násobení
176 matic -- dvì matice $n\times n$ mù¾eme vynásobit v~èase $\O(n^2.808)$ Strassenovým
177 algoritmem~\cite{strassen:matmult}, pøípadnì asymptoticky nejrychlej¹ím známým algoritmem od Coppersmithe
178 a Winograda~\cite{coppersmith:matmult} v~èase $\O(n^{2.376})$. Slavná hypotéza øíká,
179 ¾e pro ka¾dé $\omega>2$ existuje algoritmus násobící matice se slo¾itostí $\O(n^\omega)$
180 (blí¾e o~tomto fascinujícím tématu viz \cite{szegedy:matmult}). Oznaème tedy~$\omega$
181 nejni¾¹í exponent, kterého jsme schopni dosáhnout.
182
183 Co se stane, kdy¾ mocníme matici sousednosti~$A$ grafu? V~matici $A^k$ se na pozici
184 $i,j$ nachází poèet sledù délky~$k$, které vedou z~vrcholu~$i$ do vrcholu~$j$.
185 (Snadný dùkaz indukcí vynecháváme.) Pro libovolné $k\ge n-1$ jsou tedy v~$(A+E)^k$
186 (kde $E$ znaèí jednotkovou matici; doplnili jsme tedy do grafu smyèky) nenuly
187 pøesnì tam, kde z~$i$ do~$j$ vede cesta.
188
189 To nám dává jednoduchý algoritmus pro výpoèet matice dosa¾itelnosti~$R$ ($R_{ij}$
190 je 1 nebo~0 podle toho, zda z~$i$ do~$j$ vede cesta). Do~matice~$A$ doplníme
191 na diagonálu jednièky a poté ji $\lceil \log_2 n\rceil$-krát umocníme na~druhou.
192 Abychom se vyhnuli velkým èíslùm, nahradíme po ka¾dém umocnìní nenuly jednièkami.
193 Celkem tedy provedeme $\O(\log n)$ násobení matic obsahující polynomiálnì velká
194 èísla, co¾ trvá $\O(n^\omega\log n)$.
195
196 Na~tento postup se mù¾eme dívat i~obecnìji:
197
198 \s{Definice:} {\I $(\oplus,\otimes)$-souèin} matic~$A,B \in X^{n\times n}$
199 kde $\oplus$ a~$\otimes$ jsou dvì asociativní binární operace na~mno¾inì~$X$,
200 je matice~$C$ taková, ¾e
201 $$
202 C_{ij} = \bigoplus_{k=1}^n A_{ik}\otimes B_{kj}.
203 $$
204 Klasické násobení matic je tedy $(+,\cdot)$-souèin.
205
206 \s{Pozorování:} Pokud $A$ a~$B$ jsou matice svazkù ($A_{ij}$ a $B_{ij}$
207 jsou $ij$-svazky) a $C$ jejich $(\cup,\cdot)$-souèin, pak $C_{ij}$ je
208 svazek v¹ech sledù vzniklých spojením nìjakého sledu z~$A$ zaèínajícího
209 v~$i$ a nìjakého sledu z~$B$ konèícího v~$j$.
210
211 Podobnì jako v~pøedchozí sekci si tedy mù¾eme poøídit funkci~$f$ pøiøazující
212 svazkùm hodnoty z~nìjaké mno¾iny~$X$ a operace $\oplus$ a $\otimes$ na~$X$,
213 pro nì¾ platí $f(\alpha\cup\beta) = f(\alpha) \oplus f(\beta)$ a $f(\alpha\beta)
214 = f(\alpha) \otimes f(\beta)$. Pak staèí vzít matici popisující ohodnocení
215 v¹ech sledù délky 0 nebo~1 (to je obdoba matice sousednosti), a provést $\O(\log n)$
216 $(\oplus,\otimes)$-souèinù k~tomu, abychom znali ohodnocení svazkù sledù délky
217 právì~$k$ pro nìjaké $k\ge n$.
218
219 S~$(\lor,\land)$-souèiny a maticí sousednosti s~jednièkami na diagonále získáme
220 algoritmus pro výpoèet dosa¾itelnosti (ka¾dý souèin pøitom mù¾eme provést jako
221 násobení matic následované pøepsáním nenul na jednièky).
222
223 Podobnì mù¾eme poèítat i matici vzdáleností: zaèneme s~maticí délek hran doplnìnou o~nuly na~diagonále
224 a pou¾ijeme $(\min,+)$-souèiny. Tyto souèiny ale bohu¾el neumíme pøevést na klasické násobení matic.
225 Pøesto je známo nìkolik algoritmù efektivnìj¹ích ne¾ $\Theta(n^3)$, by» pouze o~málo:
226 napøíklad Zwickùv \cite{zwick:apsp} v~èase $\O(n^3\sqrt{\log\log n}/\log n)$
227 (zalo¾ený na dekompozici a pøedpoèítání malých blokù) nebo Chanùv \cite{chan:apsp} v~$\O(n^3/\log n)$
228 (pou¾ívající geometrické techniky). Abychom porazili Floydùv-Warshallùv algoritmus,
229 potøebovali bychom ov¹em vìt¹í ne¾ logaritmické zrychlení, proto¾e souèinù potøebujeme
230 vypoèítat logaritmicky mnoho.
231
232 Dodejme je¹tì, ¾e pro grafy ohodnocené malými celými èísly je mo¾né vyu¾ít
233 celou øadu dal¹ích trikù. Zájemce o~tento druh algoritmù odkazujeme na Zwickùv
234 èlánek~\cite{zwick:apspint}.
235
236 \h{Seidelùv algoritmus}
237
238 \h{Rozdìl a panuj}
239
240 \references
241 \bye