2007/11-np/11-np.tex

   1 \input lecnotes.tex
   2
   3 \prednaska{11}{NP-úplné problémy}{(zapsali F. Kaèmarik, R. Krivák, D. Remi¹)}
   4
   5 Dosud jsme zkoumali problémy, které se nás ptaly na to, jestli nìco existuje. Napøíklad jsme dostali formuli a problém splnitelnosti se nás ptal, zda existuje ohodnocení promìnných takové, ¾e formule platí. Nebo v~pøípade nezávislých mno¾in jsme dostali graf a èíslo $k$ a ptali jsme se, jestli v~grafu existuje nezávislá mno¾ina, která obsahuje alespoò~$k$ vrcholù. Tyto otázky mìly spoleèné to, ¾e kdy¾ nám nìkdo zadal nìjaký objekt, umìli jsme efektivnì øíci, zda je to objekt, který hledáme. Napøíklad pokud dostaneme ohodnocení promìnných logické formule, staèí jen dosadit a spoèítat, ¾e formule je \<true> nebo \<false>. Zjistit, ¾e nìjaký objekt je ten, který hledáme, umíme efektivnì. Tì¾ké na tom je takový objekt najít. Co¾ vede k~definici obecných vyhledávacích problémù, kterým se øíká tøída problémù NP. Definujeme si ji poøádnì, ale nejdøíve zaèneme tro¹ièku jednodu¹¹í tøídou.
   6
   7 \s{Definice:} P je {\I tøída rozhodovacích problémù}, které jsou øe¹itelné v~polynomiálním èase. Jinak øeèeno, problém
   8 $L \in P  \Leftrightarrow  \exists $ polynom $f$ a~$\exists$ algoritmus $A$ takový, ¾e $\forall x: L(x)=A(x)$ a $A(x)$ dobìhne v~èase $\O(f(x))$.
   9
  10 Tøída P odpovídá tomu, o èem jsme se shodli, ¾e umíme efektivnì øe¹it. Nadefinujme tedy tøídu NP:
  11
  12 \s{Definice:} NP je {\I tøída rozhodovacích problémù} takových, ¾e $L \in {\rm NP}$ právì tehdy, kdy¾ $\exists $ problém
  13 $K\in{\rm P}$ a $\exists$  polynom  $g$ takový, ¾e pro
  14 $\forall x$ platí $L(x)=1  \Leftrightarrow  \exists $ nápovìda $ y: \vert y \vert \leq g(\vert x \vert)$ a souèasnì $K(x,y)=1$.
  15
  16 \s{Pozorování:} Splnitelnost logických formulí je v~NP. Staèí si toti¾ nechat napovìdìt, jak
  17 ohodnotit jednotlivé promìnné a pak ovìøit, jestli je formule splnìna. Nápovìda je polynomiálnì
  18 velká (dokonce lineárnì), splnìní zkontrolujeme také v~lineárním èase. Odpovíme tedy ano právì
  19 tehdy, existuje-li nápovìda, která nás pøesvìdèí, tedy pokud je formule splnitelná.
  20
  21 \s{Pozorování:} Tøída P le¾í uvnitø NP.
  22 V~podstatì øíkáme, ¾e kdy¾ máme problém, který umíme øe¹it v~polynomiálním èase bez nápovìdy, tak to zvládneme v~polynomiálním èase i s~nápovìdou.
  23
  24 Nasbírali jsme problémy, které jsou v~NP, ale nevíme, jestli jsou v~P. Brzy uká¾eme, ¾e to jsou v jistém smyslu nejtì¾¹í problémy v~NP.
  25 Nadefinujme si:
  26
  27 \s{Definice:} Problém $L$ je NP-{\I tì¾ký} právì tehdy, kdy¾ je na~nìj pøevoditelný
  28 ka¾dý problém z~NP. (Viz definici pøevodù z minulé pøedná¹ky)
  29
  30 Také platí, ¾e pokud umíme øe¹it nìjaký NP-tì¾ký problém v~polynomiálním èase,
  31 pak umíme vyøe¹it v~polynomiálním èase v¹e v~NP, a tedy ${\rm P}={\rm NP}$.
  32 (To u¾ také víme z~minulé pøedná¹ky.)
  33
  34 My se budeme zabývat problémy, které jsou NP-tì¾ké a samotné jsou v~NP. Takovým problémùm se øíká NP-úplné.
  35
  36 \s{Definice:} Problém $L$ je NP-{\I úplný} právì tehdy, kdy¾ $L$ je NP-tì¾ký a $L \in {\rm NP}$.
  37
  38 NP-úplné problémy jsou tedy ve~své podstatì nejtì¾¹í problémy, které le¾í v~NP.
  39 Kdybychom umìli vyøe¹it nìjaký NP-úplný problém v~polynomiálním èase, pak
  40 v¹echno v~NP je øe¹itelné v~polynomiálním èase. Bohu¾el to, jestli nìjaký
  41 NP-úplný problém lze øe¹it v~polynomiálním èase, se neví. Otázka, jestli
  42 ${\rm P}={\rm NP}$, je asi nejznámìj¹í otevøený problém v~celé teoretické
  43 informatice.
  44
  45 Kde ale nìjaký NP-úplný problém vzít? K~tomu se nám bude velice hodit následující vìta:
  46
  47 \s{Vìta (Cookova):} SAT je NP-úplný.
  48
  49 \>Dùkaz je znaènì technický, pøibli¾nì ho naznaèíme pozdìji. Pøímým dùsledkem je, ¾e cokoli v~NP je pøevoditelné na SAT.
  50 K dokazování NP-úplnosti dal¹ích problémù pou¾ijeme následující vìtièku:
  51
  52 \s{Vìtièka:} Pokud problém $L$ je NP-úplný a $L$ se dá pøevést na $M\in{\rm NP}$ ($L \rightarrow M$), pak $M$ je také NP-úplný.
  53
  54 \proof
  55 Tuto vìtièku staèí dokázat pro NP-tì¾kost, NP-úplnost plyne okam¾itì z~toho, ¾e
  56 problémy jsou NP-tì¾ké a le¾í v~NP (podle pøedpokladu).
  57
  58 Víme, ¾e $L$ se dá pøevést na~$M$ nìjakou funkcí~$f$. Jeliko¾ $L$ je NP-úplný,
  59 pak pro ka¾dý problém $Q\in{\rm NP}$ existuje nìjaká funkce~$g$, která pøevede
  60 $Q$ na~$L$. Staèí tedy slo¾it funkci~$f$ s~funkcí~$g$, èím¾ získáme funkci pracující
  61 opìt v~polynomiálním èase, která pøevede~$Q$ na~$M$. Ka¾dý problém z~NP se tedy
  62 dá pøevést na problém~$M$.
  63 \qed
  64
  65 \s{Dùsledek:} Cokoliv, na co jsme umìli pøevést SAT, je také NP-úplné. Napøíklad nezávislá mno¾ina, rùzné varianty SATu, klika v~grafu~\dots
  66
  67 Jak taková tøída NP vypadá? Pøedstavme si v¹echny problémy tøídy NP, jakoby seøazené zhora nadolu podle obtí¾nosti problémù, kde porovnání dvou problémù urèuje pøevoditelnost (viz obrázek).
  68
  69 \figure{p-np.eps}{Struktura tøídy NP}{2.5cm}
  70
  71 Obecnì mohou nastat dvì situace. Proto¾e nevíme, jestli ${\rm P}={\rm NP}$.
  72 Jestli ano, pak v¹echno je jedna a ta samá tøída. To by bylo v nìkterých
  73 pøípadech nepraktické, napø. ka¾dá ¹ifra by byla jednodu¹e rozlu¹titelná.
  74 Jestli ne, NP-úplné problémy urèitì nele¾í v P, tak¾e P a NP-úplné problémy
  75 jsou dvì disjunktní èásti NP. Také se dá dokázat (to dìlat nebudeme, ale je
  76 dobré to vìdìt), ¾e je¹tì nìco le¾í mezi nimi, tedy ¾e existuje problém, který
  77 je v~NP, není v~P a není NP-úplný.
  78
  79 \s{Katalog NP-úplných problémù}
  80
  81 Uká¾eme si nìkolik základních NP-úplných problémù. O~nìkterých jsme to dokázali
  82 na~minulé pøedná¹ce, o~dal¹ích si to doká¾eme nyní, zbylým se na~zoubek podíváme
  83 na~cvièeních.
  84
  85 \itemize\ibull
  86 \:{\I logické:}
  87   \itemize\ibull
  88     \:SAT (splnitelnost logických formulí v~CNF)
  89     \:3-SAT (ka¾dá klauzule obsahuje max.~3 literály)
  90     \:3,3-SAT (a navíc ka¾dá promìnná se vyskytuje nejvý¹e tøikrát)
  91     \:SAT pro obecné formule (nejen CNF)
  92     \:Obvodový SAT (není to formule, ale obvod)
  93   \endlist
  94 \:{\I grafové:}
  95   \itemize\ibull
  96     \:Nezávislá mno¾ina (mno¾ina alespoò~$k$ vrcholù taková, ¾e ¾ádné dva nejsou propojeny hranou)
  97     \:Klika (úplný podgraf na~$k$ vrcholech)
  98     \:3D párování (tøi mno¾iny se zadanými trojicemi, najít takovou mno¾inu disjunktních trojic, ve~které jsou v¹echny prvky)
  99     \:Barvení grafu (obarvit vrcholy $k$~barvami tak, aby vrcholy stejné barvy nebyly nikdy spojeny hranou; NP-úplné u¾ pro~$k=3$)
 100     \:Hamiltonovská cesta (cesta obsahující v¹echny vrcholy [právì jednou])
 101     \:Hamiltonovská kru¾nice (kru¾nice, která nav¹tíví v¹echny vrcholy [právì jednou])
 102   \endlist
 103 \:{\I èíselné:}
 104   \itemize\ibull
 105     \:Batoh (nejjednodu¹¹í verze: dána mno¾ina èísel, zjistit, zda existuje podmno¾ina se zadaným souètem)
 106     \:Loupe¾níci (rozdìlit mno¾inu na~dvì podmno¾iny se stejným souètem)
 107     \:$Ax=b$ (soustava celoèíslených lineárních rovnic; $x_i$ mohou být pouze 0 nebo 1; NP-úplné i pokud $A_{ij}\in\{0,1\}$ a $b_i\in\{0,1\}$)
 108     \:Celoèíselné lineární programování (existuje vektor nezáporných celoèísených $x$ takový, ¾e $Ax \leq b$)
 109   \endlist
 110 \endlist
 111
 112 \h { Pøevoditelnost 3,3-SAT na 3D-párování }
 113
 114 Kdy¾ chceme ukázat, ¾e na nìco se dá pøevést SAT, potøebujeme obvykle dvì vìci. Konstrukci, která bude simulovat promìnné, tedy nìco, co nabývá dvou stavù \<true>/\<false>, a nìco, co bude reprezentovat klauzule a umí zaøídit, aby ka¾dá klauzule byla splnìna alespoò jednou promìnnou.
 115 Jenom pro pøipomenutí, máme mno¾inu klukù, dìvèat, zvíøátek a nìjaké trojice, kdo se s~kým snese, a chceme vybrat trojice tak, aby se v~nich ka¾dý kluk, holka, zvíøátko vyskytovalo právì jednou.
 116 Najdeme si takovouto konfiguraci:
 117
 118 \fig{3d.eps}{4cm}
 119
 120 \>4 zvíøátka, 2 kluci, 2 dívky a~takové 4 trojice, které oznaèíme $A, B, C, D$. Je¹tì pøedpokládáme, ¾e zvíøátka se mohou úèastnit nìjakých jiných trojic, ale tito ètyøi lidé se vyskytují pouze v~tìchto ètyøech trojicích a~nikde jinde.
 121 V¹imneme si, ¾e existují právì dvì mo¾nosti, jak tento obrázek spárovat. Abychom spárovali kluka $k_1$, tak si musíme vybrat $A$ nebo $B$. Kdy¾ si vybereme $A$, $k_1$ i $d_2$ u¾ jsou spárovaní tak¾e si nesmíme vybrat $B$ ani $D$. Pak jediná mo¾nost, jak spárovat $d_1$ a~$k_2$ je $C$. Jedna mo¾nost je tedy vybrat si $A$ a $C$ a jeliko¾ je obrázek symetrický, tak kdy¾ vybereme místo $A$ trojici $B$, dostaneme $B$ a~$D$. V¾dy si tedy vybereme dvì protìj¹í trojice v~obrázku.
 122
 123 Takovýto obrázek budeme pou¾ívat k~reprezentaci promìnných. Pro ka¾dou promìnnou si nakreslíme takový obrázek a~to, ¾e $A$ bude spárované s~$C$, bude odpovídat tomu, ¾e $x=1$, a~spárování $B$ a~$D$ odpovídá $x=0$. Pokud jsme pou¾ili $A$ a~$C$, zvíøata se sudými èísly, tj. $z_2$ a~$z_4$, horní a~dolní jsou nespárovaná a~pokud jsme pou¾ili $B$ a~$D$, zvíøátka $z_1$ a~$z_3$ zùstala nespárovaná. Pøes tyto nespárovaná zvíøátka mù¾eme pøedávat informaci, jestli promìnná $x$ má hodnotu \<true> nebo \<false> do dal¹ích èástí grafu.
 124
 125 Zbývá vymyslet, jak reprezentovat klauzule. Klauzule budou vypadat jako trojice literálù:
 126 $\kappa = (x \lor y \lor \lnot r) $
 127 Potøebujeme zajistit, aby $x$ bylo nastavené na $1$ nebo $y$ bylo nastavené na $1$ nebo $r$ na $0$.
 128
 129 \fig{klauzule.eps}{4cm}
 130
 131 \>Pro takovouto klauzuli si poøídíme dvojici kluk-dívka, kteøí budou figurovat ve tøech trojicích se tøemi rùznými zvíøátky, co¾ mají být volná zvíøátka z~obrázkù pro pøíslu¹né promìnné. A~zaøídíme to tak, aby ka¾dé zvíøátko bylo pou¾ité maximálnì v~jedné takové trojici, co¾ jde proto, ¾e ka¾dý literál se vyskytuje maximálnì dvakrát a~pro ka¾dý literál máme dvì volná zvíøátka, z~èeho¾ plyne, ¾e zvíøátek je dost pro v¹echny klauzule.
 132
 133 Je¹tì nám ale urèitì zbude $2p-k$ zvíøátek, kde $p$ je poèet promìnných, tak pøidáme je¹tì $2p-k$ párù kluk-dìvèe, kteøí milují v¹echna zvíøátka, a~ti vytvoøí zbývající páry.
 134
 135 Pokud formule byla splnitelná, pak ze splòujícího ohodnocení mù¾eme vyrobit párování s~na¹í konstrukcí. Obrázek pro ka¾dou promìnnou spárujeme podle ohodnocení, tj. promìnná je $0$ nebo $1$ a~pro ka¾dou klauzuli si vybereme nìkterou z~promìnných, kterými je ta klauzule splnìna. Funguje to také ale i~opaènì. Kdy¾ nám nìkdo dá párovaní v~na¹í konstrukci, pak z nìho doká¾eme vyrobit splòující ohodnocení dané formule. Podíváme se, v~jakém stavu je promìnná, a~to je v¹echno. Z~toho, ¾e jsou správnì spárované klauzule, u¾ okam¾itì víme, ¾e jsou v¹echny splnìné.
 136
 137 Zbývá ovìøit, ¾e na¹e redukce funguje v~polynomiálním èase. Pro ka¾dou klauzuli spotøebujeme konstantnì mnoho èasu, $2p-k$ je také polynomiálnì mnoho a~kdy¾ to seèteme, máme polynomiální èas vzhledem k~velikosti vstupní formule. Tím je pøevod hotový a~mù¾eme 3D-párování zaøadit mezi NP-úplné problémy.
 138
 139
 140 %RK
 141
 142
 143 \h{Náznak dùkazu Cookovy vìty}
 144
 145 Abychom mohli budovat teorii NP-úplnosti, potøebujeme alespoò jeden problém, o kterém doká¾eme, ¾e je NP-úplný, z definice. Cookova vìta øíká o NP-úplnosti SAT-u, ale nám se to hodí dokázat o tro¹ku jiném problému -- {\I obvodovém SAT-u}.
 146
 147 \>{\I Obvodový SAT} je splnitelnost, která nepracuje s~formulemi, ale s~booleovskými obvody. Ka¾dá formule se dá pøepsat do booleovského obvodu, který ji poèítá, tak¾e dává smysl zavést splnitelnost i pro obvody. Na¹e obvody budou mít nìjaké vstupy a~jenom jeden výstup. Budeme se ptát, jestli se vstupy tohoto obvodu dají nastavit tak, abychom na výstupu dostali \<true>.
 148
 149 \>Nejprve doká¾eme NP-úplnost {\I obvodového SAT-u} a~pak uká¾eme, ¾e se dá pøevést na obyèejný SAT v~CNF. Tím bude dùkaz Cookovy vìty hotový.
 150
 151 \s{Vìta:} Obvodový SAT je NP-úplný.
 152
 153 \proof
 154 Náznakem. Na základì zku¹eností z Principù poèítaèù intuitivnì chápeme poèítaèe
 155 jako nìjaké slo¾ité booleovské obvody, jejich¾ stav se mìní v~èase. Uva¾me nìjaký
 156 problém $L \in {\rm P}$ a polynomiální algoritmus, který ho øe¹í. Pro vstup velikosti~$n$
 157 tedy dobìhne v~èase~$T$ polynomiálním v~$n$ a spotøebuje $\O(T)$ bunìk pamìti.
 158 Staèí nám tedy \uv{poèítaè s~pamìtí velkou $\O(T)$}, co¾ je nìjaký booleovský obvod
 159 velikosti polynomiální v~$T$, a~tedy i v~$n$. Vývoj v~èase o¹etøíme tak, ¾e sestrojíme~$T$
 160 kopií tohoto obvodu, ka¾dá z~nich bude odpovídat jednomu kroku výpoètu a bude
 161 propojena s~\uv{minulou} a \uv{budoucí} kopií. Tím sestrojíme booleovský obvod,
 162 který bude øe¹it problém~$L$ pro vstupy velikosti~$n$ a bude polynomiálnì velký
 163 vzhledem k~$n$.
 164
 165 Je¹tì si dovolíme drobnou úpravu v~definici tøídy NP. Budeme chtít, aby nápovìda byla
 166 mìla pevnou velikost, závislou pouze na~velikosti vstupu (tedy: $\vert y \vert
 167 = g(\vert x \vert)$). Proè je taková úprava BÚNO? Jistì si dovedete pøedstavit,
 168 ¾e pùvodní nápovìdu doplníme na po¾adovanou délku nìjakými \uv{mezerami}, které
 169 program ignoruje. (Tedy upravíme program tak, aby mu nevadilo, ¾e dostane na
 170 konci nápovìdy nìjak kódované mezery.)
 171
 172 Máme tedy nìjaký problém $L$ z~NP a~chceme dokázat, ¾e $L$ se dá pøevést na obvodový
 173 SAT. Kdy¾ nám nìkdo pøedlo¾í nìjaký vstup $x$ (chápeme jako vektor $(x_1, x_2, \ldots, x_n)$),
 174 spoèítáme velikost nápovìdy $g(\vert x\vert)$. Víme, ¾e kontrolní
 175 algoritmus~$K$ (který kontroluje, zda nápovìda je správnì) je v~P. Vyu¾ijeme
 176 intuice o~obvodech, abychom získali obvod, který pro konkrétní velikost vstupu
 177 $x$ poèítá to, co kontrolní algoritmus $K$. Na vstupu tohoto obvodu bude $x$
 178 (vstup problému $L$) a~nápovìda~$y$. Na výstupu nám øekne, jestli je nápovìda
 179 správná. Velikost vstupu tohoto obvodu bude tedy $\vert x\vert + g(\vert x\vert)$, co¾ je polynom.
 180
 181 \fig{kobvod.eps}{2.3cm}
 182
 183 \>V tomto obvodu zafixujeme vstup $x$ (na místa vstupu dosadíme konkrétní hodnoty z $x$). Tím získáme obvod, jeho¾ vstup je jen $y$ a~ptáme se, zda za $y$ mù¾eme dosadit nìjaké hodnoty tak, aby na výstupu bylo \<true>. Jinými slovy, ptáme se, zda je tento obvod splnitelný.
 184
 185 \>Pro libovolný problém z~NP tak doká¾eme sestrojit funkci, která pro ka¾dý vstup~$x$ v~polynomiálním èase vytvoøí obvod, který je splnitelný pravì tehdy, kdy¾ odpovìï tohoto problému na vstup $x$ má být \<true>. Tedy libovolný problém z~NP se dá
 186 v~polynomiálním èase pøevést na obvodový SAT.
 187 \qed
 188
 189 \s{Lemma:} Obvodový SAT se dá pøevést na 3-SAT.
 190
 191 \proof
 192 Budeme postupnì budovat formuli v~konjunktivní normální formì. Pro ka¾dé hradlo v~obvodu zavedeme novou promìnnou popisující jeho výstup. Pøidáme klauzule, které nám kontrolují, ¾e toto hradlo máme ohodnocené konzistentnì. Ka¾dý booleovský obvod se dá pøevést na ekvivalentní obvod, ve~kterém se vyskytují jen hradla {\sc and} a {\sc not}, tak¾e staèí najít klauzule odpovídající tìmto hradlùm.
 193
 194 \>{\I Pøevod hradla \sc not}: na vstupu hradla budeme mít nìjakou promìnnou $x$ (která pøi¹la buïto pøímo ze~vstupu toho celého obvodu nebo je to promìnná, která vznikla na výstupu nìjakého hradla) a na výstupu promìnnou $y$. Pøidáme klauzule, které nám zaruèí, ¾e jedna promìnná bude negací té druhé:
 195 $$\matrix{ (x \lor y), \cr
 196   (\neg{x} \lor \neg{y}). \cr }
 197   \hskip 0.2\hsize
 198 \vcenter{\hbox{\epsfxsize=0.7cm\epsfbox{not.eps}}}
 199 $$
 200
 201 \>{\I Pøevod hradla \sc and}: Hradlo má vstupy $x, y$ a~výstup $z$. Potøebujeme pøidat klauzule, které nám popisují, jak se má hradlo {\sc and} chovat. Tyto vztahy pøepí¹eme do~konjunktivní normální formy:
 202 $$
 203 \left. \matrix{
 204   x\ \&\ y \Rightarrow z \cr
 205   \neg{x} \Rightarrow \neg{z} \cr
 206   \neg{y} \Rightarrow \neg{z} \cr
 207 }
 208 \ \quad
 209  \right\}
 210 \quad
 211 \matrix{
 212  (z \lor \neg{x} \lor \neg{y}) \cr
 213  (\neg{z} \lor x)              \cr
 214  (\neg{z} \lor y)              \cr
 215  }
 216  \hskip 0.1\hsize
 217 \vcenter{\hbox{\epsfxsize=0.7cm\epsfbox{and.eps}}}
 218 $$
 219
 220 \>Kdy¾ chceme pøevádìt obvodový SAT na 3-SAT, obvod nejdøíve pøelo¾íme na takový, ve~kterém jsou jen hradla {\sc and} a~{\sc not}, a~pak hradla tohoto obvodu pøelo¾íme na klauzule. Formule vzniklá z~takovýchto klauzulí je splnitelná pravì tehdy, kdy¾ je splnitelný daný obvod. Pøevod pracuje v polynomiálním èase.
 221 \qed
 222
 223 \s{Poznámka:}
 224 Kdy¾ jsme zavádìli SAT, omezili jsme se jen na formule, které jsou
 225 v~konjunktivní normální formì (CNF). Teï u¾ víme, ¾e splnitelnost obecné
 226 booleovské formule doká¾eme pøevést na obvodovou splnitelnost a tu pak
 227 pøevést na 3-SAT. Opaèný pøevod je samozøejmì triviální, tak¾e obecný SAT
 228 je ve~skuteènosti ekvivalentní s~na¹ím \uv{standardním} SATem pro CNF.
 229
 230 \bye
 231