14-floyd/14-floyd.tex

   1 \input ../sgr.tex
   2
   3 \prednaska{13}{Nejkrat¹í cesty: Maticové metody}{}
   4
   5 {\bf POZOR: Pracovní verze. Zacházet opatrnì.}
   6
   7 V~pøedchozí kapitole jsme se zabývali algoritmy pro hledání nejkrat¹ích
   8 cest z~daného poèáteèního vrcholu. Nyní se zamìøíme na výpoèet celé
   9 metriky grafu, tedy matice vzdáleností, která pro ka¾dou dvojici vrcholù
  10 obsahuje délku nejkrat¹í cesty mezi nimi.
  11
  12 Jeden zpùsob se ihned nabízí: postupnì spustit Dijkstrùv algoritmus pro v¹echny
  13 mo¾né volby poèáteèního vrcholu, pøípadnì se pøed tím je¹tì pomocí potenciálù
  14 zbavit záporných hran. Tak dosáhneme èasové slo¾itosti $\O(mn + n^2\log n)$,
  15 co¾ je pro øídké grafy nejlep¹í známý výsledek -- jen $\O(\log n)$-krát
  16 pomalej¹í, ne¾ je velikost výstupu.
  17
  18 Pro husté grafy obvykle pracují rychleji algoritmy zalo¾ené na maticích a zejména
  19 na jejich násobení. Nìkolik takových si nyní pøedvedeme. Vrcholy grafu budou
  20 v¾dy oèíslované èísly 1 a¾~$n$ a graf doplníme na úplný, pøièem¾ hrany, které
  21 pùvodnì neexistovaly, obdr¾í délku $+\infty$.
  22
  23 \h{Floydùv-Warshallùv algoritmus}
  24
  25 Zaènìme algoritmem, který nezávisle na sobì objevili Floyd a Warshall.
  26 Funguje pro libovolný orientovaný graf bez záporných cyklù.
  27
  28 Oznaème $D^k_{ij}$ délku nejkrat¹í cesty z~vrcholu~$i$ do vrcholu~$j$ pøes
  29 vrcholy 1 a¾~$k$ (tím myslíme, ¾e v¹echny vnitøní vrcholy cesty le¾í v~mno¾inì $\{1,\ldots,k\}$).
  30 Jako obvykle polo¾íme $D^k_{ij}=+\infty$, pokud ¾ádná taková cesta neexistuje.
  31 Pak platí:
  32 $$\eqalign{
  33 D^0_{ij} &= \hbox{délka hrany $ij$,} \cr
  34 D^n_{ij} &= \hbox{vzdálenost z~$i$ do~$j$,} \cr
  35 D^k_{ij} &= \min( D^{k-1}_ij, D^{k-1}_{ik} + D^{k-1}_{kj} ). \cr
  36 }$$
  37 První dvì rovnosti dostaneme pøímo z~definice. Tøetí rovnost dostaneme rozdìlením
  38 cest z~$i$ do~$j$ pøes 1 a¾~$k$ na ty, které se vrcholu~$k$ vyhnou (a~jsou tedy
  39 cestami pøes 1 a¾~$k-1$), a ty, které ho pou¾ijí -- ka¾dou takovou mù¾eme slo¾it
  40 z~cesty z~$i$ do~$k$ a cesty z~$k$ do~$j$, obojí pøes 1 a¾~$k-1$.
  41
  42 Zbývá vyøe¹it jednu malièkost: slo¾ením cesty z~$i$ do~$k$ s~cestou z~$k$ do~$j$
  43 nemusí nutnì vzniknout cesta, proto¾e se nìjaký vrchol mù¾e opakovat. V~grafech
  44 bez záporných cyklù nicménì takový sled nemù¾e být krat¹í ne¾ nejkrat¹í cesta,
  45 tak¾e tím fale¹né øe¹ení nevyrobíme. (Pøesnìji: ze sledu $i\alpha v\beta k\gamma v\delta j$,
  46 kde $v\not\in\beta,\gamma$, mù¾eme vypu¹tìním èásti $v\beta k\gamma v$ nezáporné
  47 délky získat sled z~$i$ do~$j$ pøes 1 a¾~$k-1$, jeho¾ délka nemù¾e být men¹í
  48 ne¾~$D^{k-1}{ij}$.)
  49
  50 Samotný algoritmus pak postupnì poèítá matice $D^0, D^1, \ldots, D^n$:
  51
  52 \algo
  53 \:$D^0 \leftarrow \hbox{matice délek hran}$
  54 \:Pro $k=1,\ldots,n$:
  55 \::Pro $i,j=1,\ldots,n$:
  56 \:::$D^k_{ij} = \min( D^{k-1}_ij, D^{k-1}_{ik} + D^{k-1}_{kj} )$.
  57 \:$\hbox{Matice vzdáleností} \leftarrow D^n.$
  58 \endalgo
  59
  60 Èasová slo¾itost tohoto algoritmu èiní $\Theta(n^3)$. Kubickou prostorovou
  61 slo¾itost mù¾eme snadno sní¾it na~kvadratickou: Buï si uvìdomíme, ¾e v~ka¾dém
  62 okam¾iku potøebujeme jen aktuální matici~$D^k$ a pøedchozí~$D^{k-1}$. Anebo
  63 nahlédneme, ¾e mù¾eme $D^{k-1}$ na~$D^k$ pøepisovat na místì. U~hodnot $D_{ik}$
  64 a~$D_{kj}$ je toti¾ podle definice stará i nová hodnota stejná. Algoritmu tedy
  65 staèí $\Theta(n^2)$ pamìti.
  66
  67 \h{Regulární výrazy}
  68
  69 Pøedchozí algoritmus lze zajímavì zobecnit, toti¾ tak, aby pro ka¾dou dvojici
  70 vrcholù sestrojil vhodnou reprezentaci mno¾iny v¹ech sledù vedoucích mezi touto
  71 dvojicí. Tato reprezentace bude velice podobná regulárním výrazùm známým
  72 z~teorie automatù. Zadaný orientovaný graf pøitom mù¾e obsahovat i smyèky
  73 a násobné hrany.
  74
  75 \s{Definice:} {\I Svazek} je mno¾ina sledù, které mají spoleèný poèáteèní
  76 a koncový vrchol. {\I Typem} svazku nazveme uspoøádanou dvojici tìchto vrcholù.
  77 Místo \uv{svazek typu $(u,v)$} budeme obvykle øíkat prostì {\I $uv$-svazek.}
  78
  79 Triviálními pøípady svazkù jsou prázdná mno¾ina~$\emptyset$, hrana~$uv$ a pro
  80 $u=v$ také sled~$\varepsilon$ nulové délky. Svazky mù¾eme kombinovat
  81 následujícími operacemi:
  82
  83 \itemize\ibull
  84 \:$A\cup B$ -- {\I sjednocení} dvou svazkù tého¾ typu,
  85 \:$AB$ nebo $A\cdot B$ -- {\I zøetìzení} $uv$-svazku~$A$ s~$vw$-svazkem~$B$: výsledkem je $uw$-svazek
  86 obsahující v¹echna spojení sledu z~$A$ se sledem z~$B$,
  87 \:$A^*$ -- {\I iterace} $uu$-svazku: výsledkem je $uu$-svazek
  88 $\varepsilon \cup A \cup AA \cup AAA \cup \ldots$ (tedy v¹echna mo¾ná
  89 spojení koneènì mnoha sledù z~$A$).
  90 \endlist
  91
  92 \>Ve~výrazu definujícím~$A^*$ jsme vyu¾ili, ¾e operace sjednocení a zøetìzení
  93 jsou asociativní, tak¾e je nemusíme závorkovat. Navíc sjednocení má ve~výrazech
  94 ni¾¹í prioritu ne¾ zøetìzení.
  95
  96 \>Svazky budeme obvykle reprezentovat {\I sledovými výrazy,} co¾ jsou
  97 výrazy koneèné délky sestávající se z~triviálních svazkù a vý¹e uvedených
  98 operací.
  99
 100 \s{Pozorování:} Sledy mù¾eme reprezentovat øetìzci nad abecedou, její¾
 101 symboly jsou identifikátory hran. Sledové výrazy pak odpovídají regulárním
 102 výrazùm nad touto abecedou.
 103
 104 Uká¾eme, jak pro v¹echny dvojice vrcholu $i,j$ sestrojit sledový výraz $R_{ij}$
 105 popisující svazek v¹ech sledù z~$i$ do~$j$. Podobnì jako u~Floydova-Warshallova
 106 algoritmu zavedeme $R^k_{ij}$ coby výraz popisující sledy z~$i$ do~$j$ pøes 1 a¾~$k$
 107 a nahlédneme, ¾e platí:
 108 $$\eqalign{
 109 R^0_{ij} &= \hbox{mno¾ina v¹ech hran z~$i$ do~$j$}, \cr
 110 R^n_{ij} &= \hbox{hledané $R_{ij}$}, \cr
 111 R^k_{ij} &= R^{k-1}_{ij} \cup R^{k-1}_{ik}(R^{k-1}_{kk})^*R^{k-1}_{kj}. \cr
 112 }$$
 113 První dvì rovnosti opìt dostaneme pøímo z~definice (mno¾inu v¹ech hran zapí¹eme
 114 buï jako prázdnou nebo ji vytvoøíme sjednocováním z~jednoprvkových mno¾in). Tøetí
 115 rovnost vychází z~toho, ¾e ka¾dý sled z~$i$ do~$j$ buï neobsahuje~$k$, nebo ho
 116 mù¾eme rozdìlit na~èásti mezi jednotlivými náv¹tìvami vrcholu~$k$.
 117
 118 Algoritmus tedy bude postupnì budovat matice $R^0, R^1, \ldots, R^n$ podle tìchto
 119 pravidel. Provedeme pøi tom $\Theta(n^3)$ operací, ov¹em s~výrazy, jejich¾ délka
 120 mù¾e být a¾ øádovì~$4^n$. Radìji ne¾ jako øetìzce je budeme ukládat v~podobì
 121 acyklických orientovaných grafù: vrcholy budou operace, hrany je budou pøipojovat
 122 k~operandùm.
 123
 124 K~pøímému pou¾ití se takový exponenciálnì dlouhý výraz hodí málokdy, ale mù¾e
 125 nám pomoci odpovídat na rùzné otázky týkající se sledù s~danými koncovými vrcholy.
 126 Máme-li nìjakou funkci~$f$ pøiøazující hodnoty mno¾inám sledù kódovaným sledovými
 127 výrazy, staèí umìt vyhodnotit:
 128 \itemize\ibull
 129 \:výsledek pro triviální výrazy $f(\emptyset)$, $f(\varepsilon)$ a $f(e)$ pro hranu~$e$,
 130 \:hodnoty $f(\alpha\cup\beta)$, $f(\alpha\beta)$ a $f(\alpha^*)$, známe-li ji¾ $f(\alpha)$ a $f(\beta)$.
 131 \endlist
 132 \>Pro výpoèet v¹ech $f(R_{ij})$ nám pak staèí $\Theta(n^3)$ vyhodnocení funkce~$f$.
 133
 134 \s{Poznámka pro ctitele algebry:} Vý¹e uvedená konstrukce není nic jiného, ne¾ popis
 135 homomorfismu~$f$ z~algebry $({\cal S},\emptyset,\varepsilon_1,\ldots,\varepsilon_n,
 136 e_1,\ldots,e_m,\cup,\cdot,{}^*)$ nad mno¾inou~${\cal S}$ v¹ech svazkù do~nìjaké
 137 algebry $(X,{\bf 0},c_1,\ldots,c_n,h_1,\ldots,h_m,\oplus,\otimes,\circledast)$, kde~$X$ je mno¾ina
 138 v¹ech ohodnocení sledù, {\bf 0}, $c_1,\ldots,c_n$ a $h_1,\ldots,h_m$ jsou konstanty,
 139 $\oplus$ a~$\otimes$ binární operace a $\circledast$ unární operace. Prùbìh výpoètu
 140 upraveného algoritmu je pak homomorfním obrazem prùbìhu výpoètu pùvodního algoritmu
 141 pracujícího pøímo se svazky.
 142
 143 \s{Pøíklady:}
 144
 145 \>{\I Nejkrat¹í sled:}
 146 $$\eqalign{
 147 f(\emptyset)&=+\infty \cr
 148 f(\varepsilon)&=0 \cr
 149 f(e)&=\ell(e) \hbox{\quad (délka hrany)} \cr
 150 f(\alpha\cup\beta) &= \min(f(\alpha),f(\beta)) \cr
 151 f(\alpha\beta) &= f(\alpha) + f(\beta) \cr
 152 f(\alpha^*) &= \cases{0 & \hbox{pro $f(\alpha)\ge 0$} \cr -\infty & \hbox{pro $f(\alpha)<0$} \cr} \cr
 153 }$$
 154 (Pokud pøedpokládáme, ¾e v~grafu nejsou záporné cykly, je $f(\alpha^*)$ v¾dy nulové
 155 a dostaneme pøesnì Floydùv-Warshallùv algoritmus.)
 156
 157 \>{\I Nej¹ir¹í cesta} (hranám jsou pøiøazeny ¹íøky, ¹íøka cesty je minimum z~¹íøek hran):
 158 $$\eqalign{
 159 f(\emptyset)&=0 \cr
 160 f(\varepsilon)&=\infty \cr
 161 f(e)&=w(e) \hbox{\quad (¹íøka hrany)} \cr
 162 f(\alpha\cup\beta) &= \max(f(\alpha),f(\beta)) \cr
 163 f(\alpha\beta) &= \min(f(\alpha),f(\beta)) \cr
 164 f(\alpha^*) &= \infty \cr
 165 }$$
 166
 167 \>{\I Pøevod koneèného automatu na regulární výraz:} Vrcholy multigrafu budou odpovídat
 168 stavùm automatu, hrany mo¾ným pøechodùm mezi stavy. Ka¾dou hranu ohodnotíme symbolem
 169 abecedy, po jeho¾ pøeètení automat pøechod provede. Funkce~$f$ pak pøiøadí $uv$-svazku~$\psi$
 170 regulární výraz popisující mno¾inu v¹ech øetìzcù, po jejich¾ pøeètení automat pøejde
 171 ze~stavu~$u$ do stavu~$v$ po pøechodech z~mno¾iny~$\psi$. Vyhodnocování funkce~$f$
 172 odpovídá pøímoèarým operacím s~øetìzci.
 173
 174 \h{Násobení matic}
 175
 176 Øe¹íme-li grafové problémy pomocí matic, nabízí se pou¾ít známé subkubické algoritmy
 177 pro lineárnì algebraické úlohy. Ty jsou obvykle zalo¾eny na efektivním násobení
 178 matic -- dvì matice $n\times n$ mù¾eme vynásobit v~èase $\O(n^2.808)$ Strassenovým
 179 algoritmem~\cite{strassen:matmult}, pøípadnì asymptoticky nejrychlej¹ím známým algoritmem od Coppersmithe
 180 a Winograda~\cite{coppersmith:matmult} v~èase $\O(n^{2.376})$. Slavná hypotéza øíká,
 181 ¾e pro ka¾dé $\omega>2$ existuje algoritmus násobící matice se slo¾itostí $\O(n^\omega)$
 182 (blí¾e o~tomto fascinujícím tématu viz \cite{szegedy:matmult}). Oznaème tedy~$\omega$
 183 nejni¾¹í exponent, kterého jsme schopni dosáhnout.
 184
 185 Co se stane, kdy¾ mocníme matici sousednosti~$A$ grafu? V~matici $A^k$ se na pozici
 186 $i,j$ nachází poèet sledù délky~$k$, které vedou z~vrcholu~$i$ do vrcholu~$j$.
 187 (Snadný dùkaz indukcí vynecháváme.) Pro libovolné $k\ge n-1$ jsou tedy v~$(A+E)^k$
 188 (kde $E$ znaèí jednotkovou matici; doplnili jsme tedy do grafu smyèky) nenuly
 189 pøesnì tam, kde z~$i$ do~$j$ vede cesta.
 190
 191 To nám dává jednoduchý algoritmus pro výpoèet matice dosa¾itelnosti~$R$ ($R_{ij}$
 192 je 1 nebo~0 podle toho, zda z~$i$ do~$j$ vede cesta). Do~matice~$A$ doplníme
 193 na diagonálu jednièky a poté ji $\lceil \log_2 n\rceil$-krát umocníme na~druhou.
 194 Abychom se vyhnuli velkým èíslùm, nahradíme po ka¾dém umocnìní nenuly jednièkami.
 195 Celkem tedy provedeme $\O(\log n)$ násobení matic obsahující polynomiálnì velká
 196 èísla, co¾ trvá $\O(n^\omega\log n)$.
 197
 198 Na~tento postup se mù¾eme dívat i~obecnìji:
 199
 200 \s{Definice:} {\I $(\oplus,\otimes)$-souèin} matic~$A,B \in X^{n\times n}$
 201 kde $\oplus$ a~$\otimes$ jsou dvì asociativní binární operace na~mno¾inì~$X$,
 202 je matice~$C$ taková, ¾e
 203 $$
 204 C_{ij} = \bigoplus_{k=1}^n A_{ik}\otimes B_{kj}.
 205 $$
 206 Klasické násobení matic je tedy $(+,\cdot)$-souèin.
 207
 208 \s{Pozorování:} Pokud $A$ a~$B$ jsou matice svazkù ($A_{ij}$ a $B_{ij}$
 209 jsou $ij$-svazky) a $C$ jejich $(\cup,\cdot)$-souèin, pak $C_{ij}$ je
 210 svazek v¹ech sledù vzniklých spojením nìjakého sledu z~$A$ zaèínajícího
 211 v~$i$ a nìjakého sledu z~$B$ konèícího v~$j$.
 212
 213 Podobnì jako v~pøedchozí sekci si tedy mù¾eme poøídit funkci~$f$ pøiøazující
 214 svazkùm hodnoty z~nìjaké mno¾iny~$X$ a operace $\oplus$ a $\otimes$ na~$X$,
 215 pro nì¾ platí $f(\alpha\cup\beta) = f(\alpha) \oplus f(\beta)$ a $f(\alpha\beta)
 216 = f(\alpha) \otimes f(\beta)$. Pak staèí vzít matici popisující ohodnocení
 217 v¹ech sledù délky 0 nebo~1 (to je obdoba matice sousednosti), a provést $\O(\log n)$
 218 $(\oplus,\otimes)$-souèinù k~tomu, abychom znali ohodnocení svazkù sledù délky
 219 právì~$k$ pro nìjaké $k\ge n$.
 220
 221 S~$(\lor,\land)$-souèiny a maticí sousednosti s~jednièkami na diagonále získáme
 222 algoritmus pro výpoèet dosa¾itelnosti. Ka¾dý souèin pøitom mù¾eme provést jako
 223 obyèejné násobení matic následované pøepsáním nenul na jednièky, tak¾e celý
 224 výpoèet bì¾í v~èase $\O(n^\omega\log n)$.
 225
 226 Podobnì mù¾eme poèítat i matici vzdáleností: zaèneme s~maticí délek hran doplnìnou o~nuly na~diagonále
 227 a pou¾ijeme $(\min,+)$-souèiny. Tyto souèiny ale bohu¾el neumíme pøevést na klasické násobení matic.
 228 Pøesto je známo nìkolik algoritmù efektivnìj¹ích ne¾ $\Theta(n^3)$, by» pouze o~málo:
 229 napøíklad Zwickùv \cite{zwick:apsp} v~èase $\O(n^3\sqrt{\log\log n}/\log n)$
 230 (zalo¾ený na dekompozici a pøedpoèítání malých blokù) nebo Chanùv \cite{chan:apsp} v~$\O(n^3/\log n)$
 231 (pou¾ívající geometrické techniky). Abychom porazili Floydùv-Warshallùv algoritmus,
 232 potøebovali bychom ov¹em vìt¹í ne¾ logaritmické zrychlení, proto¾e souèinù potøebujeme
 233 vypoèítat logaritmicky mnoho.
 234
 235 Dodejme je¹tì, ¾e pro grafy ohodnocené malými celými èísly je mo¾né vyu¾ít
 236 celou øadu dal¹ích trikù. Zájemce o~tento druh algoritmù odkazujeme na Zwickùv
 237 èlánek~\cite{zwick:apspint}.
 238
 239 \h{Seidelùv algoritmus}
 240
 241 Pro neorientované neohodnocené grafy mù¾eme matici vzdáleností spoèítat v~èase $\O(n^\omega\log n)$
 242 Seidelovým algoritmem (FIXME: odkaz). Funguje následovnì:
 243
 244 \s{Definice:} {\I Druhá mocnina grafu~$G$} je graf~$G^2$ na té¾e mno¾inì vrcholù,
 245 v~nìm¾ jsou vrcholy~$i$ a~$j$ spojeny hranou právì tehdy, existuje-li v~$G$ sled
 246 délky nejvý¹e~2 vedoucí z~$i$ do~$j$.
 247
 248 \s{Pozorování:} Matici sousednosti grafu~$G^2$ získáme z~matice sousednosti
 249 grafu~$G$ jedním $(\lor,\land)$-souèinem, tedy v~èase $\O(n^\omega)$.
 250
 251 Seidelùv algoritmus bude postupovat rekurzivnì: Sestrojí graf~$G^2$, rekurzí
 252 spoèítá jeho matici vzdáleností~$D'$ a z~ní pak rekonstruuje matici vzdáleností~$D$
 253 zadaného grafu. Rekurze konèí, pokud $G^2=G$ -- tehdy u¾ je ka¾dá komponenta
 254 souvislosti zahu¹tìna na~úplný graf, tak¾e matice vzdálenosti je rovna matici sousednosti.
 255
 256 Zbývá ukázat, jak z~matice~$D'$ spoèítat matici~$D$. Zvolme pevnì~$i$ a zamìøme
 257 se na funkce $d(v)=D_{iv}$ a $d'(v)=D'_{iv}$. Jistì platí $d'(v) = \lfloor d(v)/2 \rfloor$,
 258 proèe¾ $d(v)$ je buï rovno $2d'(v)$ nebo o~1 vy¹¹í. Nauèíme se rozpoznat, jestli
 259 $d(v)$ má být sudé nebo liché, a~z~toho v¾dy poznáme, jestli je potøeba jednièku pøièíst.
 260
 261 Jak vypadá funkce~$d$ na sousedech vrcholu~$v\ne i$? Pro alespoò jednoho souseda~$u$ je
 262 $d(u) = d(v)-1$ (to platí pro sousedy, kteøí le¾í na nìkteré z~nejkrat¹ích cest z~$v$ do~$i$).
 263 Pro v¹echny ostatní sousedy je $d(u)=d(v)$ nebo $d(u)=d(v)+1$.
 264
 265 Pokud $d(v)$ je liché, vyjde pro sousedy le¾ící na nejkrat¹ích cestách $d'(u)=d'(v)$
 266 a pro ostatní sousedy $d'(u)\ge d'(v)$, tak¾e prùmìr z~$d'(u)$ pøes sousedy je
 267 alespoò~$d'(v)$. Je-li naopak $d(v)$ sudé, musí být pro sousedy na nejkrat¹ích cestách
 268 $d'(u) < d(v)$ a pro v¹echny ostatní $d'(u) = d(v)$, tak¾e prùmìr klesne pod~$d'(v)$.
 269
 270 Prùmìry pøes sousedy pøitom mù¾eme spoèítat násobením matic: vynásobíme matici
 271 sousednosti grafu~$G$ maticí vzdáleností~$D'$. Na pozici~$i,j$ se objeví souèet
 272 hodnot $D_{ik}$ pøes v¹echny sousedy vrcholu~$j$. Ten staèí vydìlit stupòem
 273 vrcholu~$j$ a hledaný prùmìr je na svìtì.
 274
 275 Po~provedení jednoho násobení matic tedy dovedeme pro ka¾dou dvojici vrcholù
 276 v~konstantním èase spoèítat $D_{ij}$ z~$D'_{ij}$. Jedna úroveò rekurze proto
 277 trvá $\O(n^\omega)$ a jeliko¾ prùmìr grafu poka¾dé klesne alespoò dvakrát,
 278 je úrovní $\O(\log n)$ a celý algoritmus dobìhne ve~slíbeném èase $\O(n^\omega\log n)$.
 279
 280 \h{Rozdìl a panuj}
 281
 282 \references
 283 \bye