]> mj.ucw.cz Git - ga.git/blob - 12-randcut/12-randcut.tex
feb2c918a1ebc3444e2290b976cece1a22e0de3a
[ga.git] / 12-randcut / 12-randcut.tex
1 \input ../sgr.tex
2
3 \prednaska{12}{Pravděpodobnostní algoritmus na řezy}{}
4
5 Nahlédněme alespoň jednou kapitolou do~světa pravděpodobnostních algoritmů.
6 Není totiž výjimkou, že s~pomocí generátoru náhodných čísel vyřešíme některé
7 grafové problémy daleko snáze a často také efektivněji, než to dovedeme deterministicky.
8 Pravděpodobnostní přístup si předvedeme na~Kargerově-Steinově algoritmu \cite{karger:mincut}
9 pro hledání minimálního řezu v~neohodnoceném neorientovaném grafu. Připomeňme,
10 že s~deterministickými algoritmy jsme zatím dosáhli časové složitosti $\O(n^{5/3}m)$
11 pomocí toků nebo $\O(nm)$ Nagamochiho-Ibarakiho algoritmem.
12
13 \h{Náhodné kontrakce}
14
15 Uvažujme nejdříve následující algoritmus, který náhodně vybírá
16 hrany a kontrahuje je, dokud počet vrcholů neklesne na~danou hodnotu~$\ell$.
17
18 \s{Algoritmus} $\hbox{\sc Contract}(G_0,\ell)$:
19 \algo
20 \:$G \leftarrow G_0$.
21 \:Dokud $n>\ell$:
22 \::Vybereme hranu $e\in E$ rovnoměrně náhodně.
23 \::$G \leftarrow G/e$ (kontrahujeme hranu~$e$, smyčky odstraňujeme,
24   paralelní hrany ponecháme).
25 \:Vrátíme jako výsledek graf~$G$.
26 \endalgo
27
28 Jaká je pravděpodobnost, že výsledný graf~$G$ má stejně velký minimální řez
29 jako zadaný graf~$G_0$? Všimněme si nejprve, že každý řez v~grafu $G/e$ je i řezem
30 v~grafu~$G$ (až na přeznačení hran při kontrakci, ale předpokládejme, že hrany
31 mají nějaké identifikátory, které kontrakce zachovává). Podobně je-li v~grafu~$G$
32 řez neobsahující hranu~$e$, odpovídá mu stejně velký řez v~$G/e$. Velikost
33 minimálního řezu tedy kontrakcí nikdy neklesne -- může pouze stoupnout, pokud
34 skontrahujeme hranu ležící ve~všech minimálních řezech,
35
36 Zvolíme nyní pevně jeden z~minimálních řezů~$C$ v~zadaném grafu~$G_0$ a označíme~$k$ jeho
37 velikost. Pokud algoritmus ani jednou nevybere hranu ležící v~tomto řezu, velikost
38 minimálního řezu v~grafu~$G$ bude rovněž rovna~$k$. Jaká je pravděpodobnost, že
39 se tak stane?
40
41 Označme $G_i$ stav grafu~$G$ před $i$-tým průchodem cyklem a $n_i$ a $m_i$ počet jeho
42 vrcholů a hran. Zřejmě $n_i=n-i+1$ (každou kontrakcí přijdeme o~jeden vrchol).
43 Navíc každý vrchol má stupeň alespoň~$k$, jelikož jinak by triviální řez okolo
44 tohoto vrcholu byl menší než minimální řez. Proto platí $m_i \ge kn_i/2$. Hranu
45 ležící v~řezu~$C$ tedy vybereme s~pravděpodobností nejvýše $k/m_i \le k/(kn_i/2) = 2/n_i
46 = 2/(n-i+1)$. Všechny hrany z~řezu~$C$ proto postoupí do výsledného grafu~$G$
47 s~pravděpodobností
48 $$\eqalign{
49 p     &\ge \prod_{i=1}^{n-\ell} \left( 1 - {2\over n-i+1} \right)
50        = \prod_{i=1}^{n-\ell} {n-i-1 \over n-i+1} = \cr
51       &= {n-2\over n} \cdot {n-3\over n-1} \cdot {n-4\over n-2} \cdot \cdots \cdot {\ell+1\over \ell+3} \cdot {\ell\over \ell+2} \cdot {\ell-1 \over \ell+1}
52        = {\ell\cdot(\ell-1) \over n\cdot(n-1)}. \cr
53 }$$
54
55 Můžeme tedy zvolit pevně~$\ell$, spustit na~zadaný graf proceduru {\sc Contract}
56 a ve~vzniklém konstantně velkém grafu pak nalézt minimální řez hrubou silou
57 (to je obzvláště snadné pro $\ell=2$ -- tehdy stačí vzít všechny zbylé hrany).
58 Takový algoritmus nalezne minimální řez s~pravděpodobností alespoň $c/n^2$,
59 kde~$c$ je konstanta závislá na~$\ell$.
60
61 Nabízí se otázka, k~čemu je dobrý algoritmus, který vydá správný výsledek
62 s~pravděpodobností na~řádu $1/n^2$. To opravdu není mnoho, ale stejně jako
63 mnoho jiných randomizovaných algoritmů i tento můžeme iterovat: výpočet
64 zopakujeme $K$-krát a použijeme nejmenší z~nalezených řezů. Ten už bude
65 minimální s~pravděpodobností
66 $$
67 P_K \ge 1 - (1-c/n^2)^K \ge 1 - e^{-cK/n^2}.
68 $$
69 (Druhá nerovnost platí díky tomu, že $e^{-x} \ge 1-x$ pro všechna $x\ge 0$.)
70 Pokud tedy nastavíme počet opakování~$K$ na $\Omega(n^2)$, můžeme tím pravděpodobnost
71 chyby stlačit pod libovolnou konstantu, pro $K=\Omega(n^2\log n)$ pod převrácenou
72 hodnotu libovolného polynomu v~$n$ a pro $K=\Omega(n^3)$ už bude dokonce exponenciálně malá.
73
74 \h{Implementace}
75
76 Odbočme na chvíli k~implementačním záležitostem. Jak reprezentovat graf, abychom
77 stihli rychle provádět kontrakce? Bude nám stačit obyčejná matice sousednosti,
78 v~níž pro každou dvojici vrcholů budeme udržovat, kolik paralelních hran mezi těmito vrcholy
79 vede. Pokud chceme kontrahovat hranu~$uv$, stačí projít všechny hrany vedoucí
80 (řekněme) z~vrcholu~$u$ a zařadit je k~vrcholu~$v$. To zvládneme v~čase $\O(n)$
81 na jednu kontrakci.
82
83 Pro náhodný výběr hrany budeme udržovat pole stupňů vrcholů, vybereme náhodně
84 vrchol~$v$ s~pravděpodobností úměrnou stupni a poté projitím příslušného řádku
85 matice sousednosti druhý vrchol~$v$ s~pravděpodobností úměrnou počtu hran
86 mezi $u$ a~$v$. To opět trvá čas $\O(n)$.
87
88 Procedura {\sc Contract} tedy pracuje v~čase $\O((n-\ell)\cdot n)$ a celý
89 $K$-krát ziterovaný algoritmus v~$\O(Kn^2)$. Pokud se spokojíme s~převráceně
90 polynomiální pravděpodobností chyby, nalezneme minimální řez v~čase $\O(n^4\log n)$.
91
92 \h{Kargerův-Steinův algoritmus}
93
94 Předchozí prostinký algoritmus můžeme ještě podstatně vylepšit.
95 Všimněme si, že během kontrahování hran pravděpodobnost toho, že vybereme \uv{špatnou}
96 hranu ležící v~minimálním řezu, postupně rostla z~počátečních $2/n$ až po obrovské
97 $2/3$ v~poslední iteraci (pro $\ell=2$). Pomůže tedy zastavit kontrahování dříve
98 a~přejít na~spolehlivější způsob hledání řezu.
99
100 Pokud zvolíme $\ell=\lceil n/\sqrt2 +1\rceil$, pak řez~$C$ přežije kontrahování
101 s~pravděpodobností alespoň
102 $$
103 {\ell\cdot (\ell-1) \over n\cdot (n-1)}
104 \ge {(n/\sqrt2+1)\cdot n/\sqrt2 \over n\cdot (n-1)}
105 = {n/\sqrt2+1 \over \sqrt2 \cdot (n-1)}
106 = {n+\sqrt 2 \over 2\cdot (n-1)}
107 \ge {1\over 2}.
108 $$
109
110 Jako onen spolehlivější způsob hledání řezu následně zavoláme stejný algoritmus
111 rekurzivně, přičemž jak kontrakci, tak rekurzi provedeme dvakrát a z~obou
112 nalezených řezů vybereme ten menší, čímž pravděpodobnost chyby snížíme.
113
114 Hotový algoritmus bude vypadat následovně:
115
116 \s{Algoritmus} $\hbox{\sc MinCut}(G)$:
117 \algo
118 \:Pokud $n<7$, najdeme minimální řez hrubou silou.
119 \:$\ell\leftarrow \lceil n/\sqrt 2 + 1 \rceil$.\foot{To je méně než~$n$, kdykoliv $n\ge 7$.}
120 \:$C_1 \leftarrow \hbox{\sc MinCut}(\hbox{\sc Contract}(G,\ell))$.
121 \:$C_2 \leftarrow \hbox{\sc MinCut}(\hbox{\sc Contract}(G,\ell))$.
122 \:Vrátíme menší z~řezů $C_1$, $C_2$.
123 \endalgo
124
125 Jakou bude mít tento algoritmus časovou složitost? Nejprve odhadněme hloubku
126 rekurze: v~každém kroku se velikost vstupu zmenší přibližně $\sqrt 2$-krát, takže strom
127 rekurze bude mít hloubku $\O(\log n)$. Na~$i$-té hladině zpracováváme $2^i$
128 podproblémů velikosti $n/2^{i/2}$. Při výpočtu každého podproblému voláme
129 dvakrát proceduru {\sc Contract}, která spotřebuje čas $\O((n/2^{i/2})^2)
130 = \O(n^2/2^i)$. Součet přes celou hladinu tedy činí $\O(n^2)$ a přes všechny
131 hladiny $\O(n^2\log n)$. Oproti původnímu kontrakčnímu algoritmu jsme si tedy
132 moc nepohoršili.
133
134 Zbývá spočítat, s~jakou pravděpodobností algoritmus skutečně nalezne minimální řez.
135 Označme $p_i$ pravděpodobnost, že algoritmus na~$i$-té hladině stromu
136 rekurze (počítáno od~nejhlubší, nulté hladiny) vydá správný výsledek
137 příslušného podproblému. Jistě je $p_0=1$ a platí rekurence
138 $p_i \ge 1 - (1 - 1/2 \cdot p_{i-1})^2$. Uvažujme posloupnost $g_i$, pro kterou
139 jsou tyto nerovnosti splněny jako rovnosti, a~všimněme si, že $p_i\ge g_i$.
140 Víme tedy, že $g_0=1$ a $g_i = 1-(1-1/2\cdot g_{i-1})^2 = g_{i-1} - g_{i-1}^2/4$.
141
142 Nyní zavedeme substituci $z_i = 4/g_i - 1$, čili $g_i=4/(z_i+1)$, a~tak získáme
143 novou rekurenci pro~$z_i$:
144 $$
145 {4 \over z_i+1} = {4\over z_{i-1}+1} - {4\over (z_{i-1}+1)^2},
146 $$
147 kterou už můžeme snadno upravovat:
148 $$\eqalign{
149 {1\over z_i+1} &= {z_{i-1} \over (z_{i-1}+1)^2}, \cr
150 z_i+1 &= {z_{i-1}^2 + 2z_{i-1} + 1 \over z_{i-1}}, \cr
151 z_i+1 &= z_{i-1} + 2 + {1\over z_{i-1}}. \cr
152 }$$
153 Jelikož $z_0=3$, a~tím pádem $z_i\ge 3$ pro všechna~$i$, získáme z~poslední
154 rovnosti vztah $z_i \le z_{i-1} + 2$, a~tudíž $z_i \le 2i+3$.
155 Zpětnou substitucí obdržíme $g_i \ge 4/(2i+4)$, tedy $p_i \ge g_i = \Omega(1/i)$.
156
157 Nyní si stačí vzpomenout, že hloubka rekurze činí $\O(\log n)$, a ihned získáme
158 odhad pro pravděpodobnost správného výsledku $\Omega(1/\log n)$. Náš algoritmus
159 tedy stačí ziterovat $\O(\log^2 n)$-krát, abychom pravděpodobnost chyby stlačili
160 pod převrácenou hodnotu polynomu. Dokázali jsme následující větu:
161
162 \s{Věta:} Iterováním algoritmu {\sc MinCut} nalezneme minimální řez v~neohodnoceném
163 neorientovaném grafu v~čase $\O(n^2\log^3 n)$ s~pravděpodobností chyby $\O(1/n^c)$
164 pro libovolnou konstantu $c>0$.
165
166 \h{Cvičení}
167
168 \numlist\ndotted
169 \:Zvolte lepší reprezentaci grafu, abyste prostorovou složitost snížili z~$\Theta(n^2)$ na~$\O(m)$.
170   Může se tím zmenšit časová složitost?
171 \:Dokažte, že z~našeho rozboru pravděpodobnosti chyby plyne, že v~každém grafu je nejvýše $\O(n^2)$
172   minimálních řezů.
173 \:Ukažte, jak algoritmus upravit pro grafy s~ohodnocenými hranami.
174 \endlist
175
176 \references
177 \bye