9-fft/9-fft.tex

   1 \input lecnotes.tex
   2 \def\imply{\Rightarrow}
   3 \prednaska{8}{Fourierova transformace}{ \vbox{\hbox{(K.Jakubec, M.Polák
   4         a~G.Ocsovszky,}\hbox{\ V.Tùma, M.Kozák)}}}
   5
   6 Násobení polynomù mù¾e mnohým pøipadat jako pomìrnì (algoritmicky) snadný
   7 problém. Asi ka¾dého hned napadne \uv{hloupý} algoritmus -- vezmeme
   8 koeficienty prvního polynomu a~vynásobíme ka¾dý se v¹emi koeficienty druhého
   9 polynomu a~pøíslu¹nì u~toho seèteme i~exponenty (stejnì jako to dìláme, kdy¾
  10 násobíme polynomy na~papíøe). Pokud stupeò prvního polynomu je $n$ a~druhého
  11 $m$, strávíme tím èas $\Omega(mn)$. Pro $m=n$ je to kvadraticky pomalé.
  12 Na~první pohled se mù¾e zdát, ¾e rychleji to prostì nejde (pøeci musíme
  13 v¾dy vynásobit \uv{ka¾dý s~ka¾dým}). Ve skuteènosti to ale rychleji fungovat
  14 mù¾e, ale k~tomu je potøeba znát trochu tajemný algoritmus FFT neboli {\I Fast
  15 Fourier Transform}.
  16
  17
  18 \ss{Trochu algebry na~zaèátek:}
  19 \>Libovolný polynom $P$ stupnì $n$ lze reprezentovat dvìma rùznými zpùsoby:
  20
  21 \itemize\ibull
  22 \:svými koeficienty, èili èísly $p_{0}, p_{1}, \ldots ,p_{n}$, nebo
  23 \:svými hodnotami v~$n$ rùzných bodech $x_{0}, x_{1}, \ldots , x_{n}$, èili
  24 èísly $P(x_{0}),$ $P(x_{1}),$ $\ldots , P(x_{n})$.
  25 \endlist
  26
  27 \>Dostateènost $n+1$ hodnot pro urèení druhým zpùsobem lze dokázat
  28 následnovnì: polynom stupnì $n$ má maximálnì $n$ koøenù (indukcí, je-li
  29 $k$ koøenem $P$, pak lze $P$ napsat jako $(x-k)Q$ kde $Q$ je polynom stupnì
  30 o~jedna men¹í, pøitom polynom stupnì 1 má jediný koøen); uvá¾íme-li
  31 dva rùzné polynomy $P$ a~$Q$ stupnì $n$ nabývající v~daných bodech stejných
  32 hodnot, tak $P-Q$ je polynom stupnì maximálnì $n$, ka¾dé
  33 z $x_{0}\ldots x_{n}$ je koøenem tohoto polynomu $\imply$ spor, polynom stupnì
  34 $n$ má $n+1$ koøenù $\imply$ $P-Q$ musí být nulový polynom $\imply$ $P=Q$.
  35 \medskip
  36
  37 \ss{Konvence:}
  38 Celé polynomy oznaèujeme velkými písmeny, jednotlivé èleny polynomù pøíslu¹nými
  39 malými písmeny (pø.: polynom $W$ stupnì $n$ má koeficienty $w_{0}, w_{1},
  40 w_{2},\ldots, w_{n}$).
  41
  42 Pov¹imnìme si jedné skuteènosti -- máme-li dva polynomy $A$ a~$B$ stupnì $n$
  43 a~body $x_{0}, \ldots, x_{k}$, dále polynom $C=A \cdot B$ (stupnì $2n$), pak
  44 platí $C(x_{k}) = A(x_{k}) \cdot B(x_{k}), k = 0,1,2, \ldots, n.$ Toto èiní
  45 tento druhý zpùsob reprezentace polynomu velice atraktivním pro násobení.
  46 Problémem je, ¾e typicky máme polynom zadaný koeficienty a~ne hodnotami
  47 v~bodech. Tím pádem potøebujeme nìjaký hodnì rychlý algorimtus (tj.
  48 rychlej¹í ne¾ kvadratický, jinak bychom si nepomohli oproti hloupému
  49 algoritmu) na~pøevod polynomu z jedné reprezentace do druhé a~zase zpìt.
  50
  51 Dále bychom si mìli uvìdomit, ¾e stupeò na¹eho výsledného polynomu $C$ bude
  52 $\leq 2n$ (kde $n$ je stupeò výchozích polynomù). Pokud chceme polynom $C$
  53 reprezentovat pomocí jeho hodnot v~bodech, musíme tedy vzít alespoò $2n$
  54 bodù. Tímto konèí malá algebraická vsuvka.
  55
  56 \s{Idea, jak by mìl algoritmus pracovat:}
  57 \algo
  58 \:Vybereme $2n$ bodù $x_{0}, x_{1}, \ldots , x_{2n-1}$.
  59 \:V tìchto bodech vyhodnotíme polynomy $A$ a~$B$.
  60 \:Nyní ji¾ v~lineárním èase získáme hodnoty polynomu $C$ v~tìchto bodech
  61         (viz vý¹e).
  62 \:Pøevedeme hodnoty polynomu $C$ na~jeho koeficienty.
  63 \endalgo
  64
  65 \>Je vidìt, ¾e klíèové jsou kroky 2 a~4. Vybrání bodù jistì stihneme pohodlnì
  66 v~lineárním èase a~vynásobení samotných hodnot té¾ (máme $2n$ bodù a~$C(x_{k})
  67 = A(x_{k}) \cdot B(x_{k}), k = 0,1,2, \ldots , 2n-1$, tak¾e na~to nepotøebujeme
  68 více ne¾ $2n$ násobení).
  69
  70 Celý trik spoèívá v~chytrém vybrání onìch bodù, ve kterých budeme polynomy
  71 vyhodnocovat. Je na~to potøeba vìdìt pár zajímavostí o~komplexních èíslech,
  72 na~webové stránce pøedná¹ky jsou k dispozici slajdy, zde to bude zapsáno
  73 o~trochu struènìji.
  74
  75 \ss{  Vyhodnocení polynomu metodou Rozdìl a~panuj (algoritmus FFT):}
  76 Mìjme polynom $P$ øádu $n$ a~chtìjme jej vyhodnotit v~$n$ bodech. Vybereme si
  77 body tak, aby byly spárované, èili $\pm x_{0}, \pm x_{1}, \ldots , \pm
  78 x_{n/2-1} $. To nám výpoèet urychlí, proto¾e pak se druhé mocniny $x_{j}$
  79 shodují s~druhými mocninami $-x_{j}$.
  80
  81 Polynom $P$ rozlo¾íme na~dvì èásti, první obsahuje èleny se sudými exponenty,
  82 druhá s~lichými:
  83 $$P(x) = (p_{0}x^{0} + p_{2}x^{2} + \ldots + p_{n-2}x^{n-2}) + (p_{1}x^{1} +
  84         p_{3}x^{3} + \ldots + p_{n-1}x^{n-1})$$
  85 \>se zavedením znaèení:
  86 $$P_s(x^{2}) = p_{0}x^{0} + p_{2}x^{2} + \ldots + p_{n - 2}x^{n - 2}$$
  87 $$P_l(x^{2}) = p_{1}x^{1} + p_{3}x^{3} + \ldots + p_{n - 1}x^{n - 1}$$
  88
  89 \>Dohromady $P(x) = P_s(x^{2}) + xP_l(x^{2})$ a~$P(-x) = P_s(x^{2}) -
  90 xP_l(x^{2})$. Jinak øeèeno, vyhodnocování $P$ v~$n$ bodech se nám smrskne
  91 na~vyhodnocení $P_s(x)$ a~$P_l(x)$ (oba jsou polynomy stupnì $n/2$
  92 a~vyhodnocujeme je nyní v~$x^{2}$) v~$n/2$ bodech (proto¾e $(x_{i})^{2} =
  93 (-x_{i})^{2}$).
  94
  95 \s{Pøíklad:}
  96 $3 + 4x + 6x^{2} + 2x^{3} + x^{4} + 10x^{5} = (3 + 6x^{2} + x^{4}) + x(4 +
  97 2x^{2} + 10x^{4})$.
  98
  99 Teï nám ov¹em vyvstane problém s~oním párováním -- druhá mocina pøece nemù¾e
 100 být záporná a~tím pádem u¾ v~druhé úrovni rekurze body spárované nebudou.
 101 Z~tohoto dùvodu musíme pou¾ít komplexní èísla -- tam druhé mocniny záporné býti
 102 mohou. Jako $x_{0}, \ldots , x_{n-1} $ si zvolíme mocniny
 103 $n$-té primitvní odmocniny z jedné (oznaèíme si ji jako $\omega$). Pøipomeòme:
 104 $\omega$ je $n$-tá odmocnina z $1$ je {\it primitivní} $\equiv$ $(\forall k)
 105 (k<n)\ \omega^k \neq 1$ a~$\omega^n = 1$. Máme $n$ navzájem rùzných odmocnin
 106 z~jednièky, rovnomìrnì rozesetých po jednotkové kru¾nici, BÚNO $n=2^{k}, k \in
 107 N$ (jinak viz slajdy Martina Mare¹e). Jednotlivé $x$ vypadají takto: $1,
 108 \omega, \omega^{2}, \ldots , \omega^{n - 1} $, kde $\omega = e^{2 \pi i/ n}$.
 109
 110 \s{Pìt poznámek:}
 111 \itemize\ibull
 112 \:Pro $k\neq j,\ 0\leq k<j<n$ je $\omega^k \neq \omega^j$, nebo» $\omega^j /
 113 \omega^k = \omega^{j-k}\neq 1$, proto¾e $j-k < n$ a~$\omega$ je $n$-tá
 114 primitivní (a~tedy $\omega^0, \ldots, \omega^{n-1}$ jsou rùzné).
 115 \:$\overline{\omega} = \omega^{-1}$, nebo» $\omega^{-1} = \omega^{-2\pi i/n}$
 116 a~tedy èísla $\omega,\omega^{-1}$ svírají vùèi reálné ose opaèný úhel a~jsou
 117         komplexnì sdru¾ená.
 118 \:mocniny $\omega$ jsou spárované, èili $\omega^{j} = -\omega^{n/2 + j}$
 119         (staèí si uvìdomit, ¾e $\omega^{n/2} = -1$ pro $n$ sudé)
 120 \:umocníme-li v¹echny $\omega^{0},\ldots, \omega^{n-1}$ na~druhou, vzniknou nám
 121         odmnocniny z~$1$ které budou i~nadále spárované: $\omega^n$ je toti¾
 122         $1$ a~exponenty lze tedy poèítat$\mod n$, $n$ je sudé $\imply$
 123         dostaneme pùvodní posloupnost ze které zmizí liché mocniny $\omega$, ale $n$
 124         je mocnina dvojky a~tedy i~$n/2$ je sudé (pro $n=2$ ne, ale tam je to
 125         triviální), tak¾e sudé mocniny jsou spárované navzájem..
 126 \:$\omega^2$ je $n/2$-tá primitivní odmocnina z 1 -- je toti¾ $(\omega^{-2\pi
 127         i/n})^2 = \omega^{-2\pi i/(n/2)}$ a~$n$ je mocnina dvojky.
 128 \endlist
 129
 130 \ss{Celý algoritmus bude vypadat takto:}
 131 \>FFT($P$, $ \omega$)
 132
 133 \>{\sl Vstup:} $p_{0}, \ldots , p_{n-1}$, koeficienty polynomu $P$, a~$\omega$,
 134 $n$-tá primitivní odmocina z jedné.
 135
 136 \>{\sl Výstup:} Hodnoty polynomu v~bodech $1, \omega, \omega^{2}, \ldots ,
 137 \omega^{n - 1}$, èili èísla $P(1), P(\omega), P(\omega^{2}),$ $\ldots ,
 138 P(\omega^{n - 1})$.
 139
 140 \algo
 141 \:Pokud $n = 1$, vrátíme $p_{0}$ a~skonèíme.
 142 \:Jinak rozdìlíme $P$ na~sudé a~liché koeficienty a~rekurzivnì zavoláme
 143         FFT($P_s$, $\omega^{2}$) a~FFT($P_l$, $\omega^{2}$) -- $P_l$ i~$P_s$
 144         jsou stupnì max. $n/2-1$ a~$\omega^2$ je $n/2$-tá primitivní odmocnina.
 145 \:Pro $j = 0, \ldots , n/2 - 1$ spoèítáme:
 146
 147 \:\qquad $P(\omega^{j}) = P_s(\omega^{2j}) + \omega^{j}\cdot P_l(\omega^{2j})$.
 148
 149 \:\qquad $P(\omega^{j+n/2})=P_s(\omega^{2j})-\omega^{j}\cdot P_l(\omega^{2j})$.
 150
 151 \endalgo
 152
 153
 154 \s{Èasová slo¾itost:}
 155 \>$T(n)=2T(n/2) + \Theta(n) \Rightarrow$ slo¾itost $\Theta(n \log n)$, jako
 156 MergeSort.
 157
 158
 159 Máme tedy algoritmus, který pøevede koeficienty polynomu na~hodnoty tohoto
 160 polynomu v~rùzných bodech. Potøebujeme ale také algoritmus, který doká¾e
 161 reprezentaci polynomu pomocí hodnot pøevést zpìt na~koeficienty polynomu.
 162 K~tomu nám pomù¾e podívat se na~ná¹ algoritmus trochu obecnìji.
 163
 164
 165 \s{Definice:}
 166 \>{\I Diskretní Fourierova transformace} $(DFT)$
 167 je zobrazení $f: { {\bb C} ^n} \rightarrow { {\bb C} ^n}$, kde $$y=f(x) \equiv
 168 \forall j \ y_{j} = \sum \limits ^{n-1}_{k=0} x_{k} \cdot \omega ^{jk}$$
 169 (pøestavme si ji jako funkci vyhodnocující polynom s~koeficienty $x$ v~bodech
 170 $\omega^j$). Takovéto zobrazení je lineární a~tedy popsatelné maticí $\Omega$
 171 s~prvky $\Omega_{jk} = \omega^{jk}$
 172
 173
 174 \s{Jak najít inverzní matici?} Znaème $\overline{\Omega}$ matici, její¾ prvky
 175 jsou komplexnì sdru¾ené odpovídajícím prvkùm $\Omega$, a vyu¾ijeme následující
 176 lemma:
 177
 178 \ss{Lemma:}$\quad \Omega\cdot \overline{\Omega} = n\cdot E$
 179
 180 \proof $$ (\Omega\cdot \overline{\Omega})_{jk} = \sum_{l=0}^{n-1} \omega^{jl}
 181 \cdot \overline{\omega^{lk}} = \sum \omega^{jl} \cdot \overline{\omega}^{lk} =
 182 \sum \omega^{jl} \cdot \omega^{-lk} = \sum \omega^{l(j-k)}$$
 183 \itemize\ibull
 184 \:Pokud $j=k$, pak $ \sum \limits ^{n-1}_{l=0} (\omega ^{0}) ^{l} = n$.
 185
 186 \:Pokud $j\neq k$, pou¾ijeme vzoreèek pro souèet geometrické posloupnosti, kde
 187 $a_{1}=1$ a~$q=\omega ^{(j-k) }$ a~dostaneme ${{\omega^{(j-k)n} -1} \over
 188 {\omega^{(j-k)} -1}} ={1-1 \over r- 1} = {0 \over \neq 0} = 0$, kde $r$
 189 je èíslo rùzné od jednièky (nebo» $\omega$ je $n$-tá primitivní odmoncina).
 190 \endlist
 191 \qed
 192
 193
 194 \>Na¹li jsme inverzi:
 195 $\Omega({1 \over n} \overline{\Omega}) = {1 \over n}\Omega \cdot
 196 \overline{\Omega} = E$, \quad $\Omega^{-1}_{jk} = {1 \over n}\overline{\omega^
 197 {jk}} = {1 \over n}\omega^{-jk} = {1 \over n} {(\omega^{-1})}^{jk}$, \quad
 198 (pøipomínáme, $\omega^{-1}$ je $\overline{\omega}$, $\omega$ je $n$-tá
 199 primitivní odmocnina z jednièky).
 200
 201 Ná¹ algoritmus poèítá tedy i~inverzní transformaci, pouze místo $\omega_n$
 202 pou¾ijeme komplexnì zdru¾ené $\overline{\omega_n}$ a~matici vynásobíme $(1/n)$.
 203 Co¾ je skvìlé -- staèí znát pouze jeden algoritmus u~kterého staèí v~jednom
 204 pøípadì pou¾ít transformovanou matici a~vydìlit $n$.
 205
 206 \s{Výsledek:} Pro $n= 2^k$ lze DFT na~${\bb C}^n$ spoèítat v~èase $\Theta(n
 207 \log n)$ a~DFT$^{-1}$ takté¾.
 208
 209 \s{Dùsledek:}
 210 Polynomy stupnì $n$ lze násobit v~èase $\Theta(n \log n)$:
 211 $\Theta(n \log n)$ pro vyhodnocení, $\Theta(n)$ pro vynásobení a~$\Theta(n
 212 \log n)$ pro pøevedení zpìt.
 213
 214 \s{Pou¾ití FFT:}
 215
 216 \itemize\ibull
 217
 218 \:Zpracování signálu -- rozklad na~siny a~cosiny o~rùzných frekvencích
 219 $\Rightarrow$ spektrální rozklad.
 220 \:komprese dat -- napøíklad formát JPEG.
 221 \:Násobení dlouhých èísel v~èase $\Theta(n \log n)$.
 222 \endlist
 223
 224 \s{Paralelní implementace FFT}
 225
 226 \figure{img.eps}{Pøíklad prùbìhu algoritmu na~vstupu velikosti 8}{3in}
 227
 228 Zkusme si prùbìh algoritmu FFT znázornit graficky (podobnì, jako jsme kreslili
 229 hradlové sítì). Na~levé stranì obrázku se nachází vstupní vektor $x_0,\ldots,x_{n-1}$
 230 (v~nìjakém poøadí), na~pravé stranì pak výstupní vektor $y_0,\ldots,y_{n-1}$.
 231 Sledujme chod algoritmu pozpátku: Výstup spoèítáme z~výsledkù \uv{polovièních}
 232 transformací vektorù $x_0,x_2,\ldots,x_{n-2}$ a $x_1,x_3,\ldots,x_{n-1}$.
 233 Èerné krou¾ky pøitom odpovídají výpoètu lineární kombinace $a+\omega^kb$,
 234 kde $a,b$ jsou vstupy krou¾ku a $k$~nìjaké pøirozené èíslo závislé na poloze
 235 krou¾ku. Ka¾dá z~polovièních transformací se poèítá analogicky z~výsledkù
 236 transformace velikosti $n/4$ atd. Celkovì výpoèet probíhá v~$\log_2 n$ vrstvách
 237 po~$\Theta(n)$ operacích.
 238
 239 Jeliko¾ operace na~ka¾dé vrstvì probíhají na sobì nezávisle, mù¾eme je poèítat
 240 paralelnì. Ná¹ diagram tedy popisuje hradlovou sí» pro paralelní výpoèet FFT
 241 v~èase $\Theta(\log n\cdot T)$ a prostoru $\O(n\cdot S)$, kde $T$ a~$S$ znaèí
 242 èasovou a prostorovou slo¾itost výpoètu lineární kombinace dvou komplexních èísel.
 243
 244 \s{Cvièení:} Doka¾te, ¾e permutace vektoru $x_0,\ldots,x_{n-1}$ odpovídá bitovému
 245 zrcadlení, tedy ¾e na pozici~$b$ shora se vyskytuje prvek $x_d$, kde~$d$ je
 246 èíslo~$b$ zapsané ve~dvojkové soustavì pozpátku.
 247
 248 \s{Nerekurzivní FFT}
 249
 250 Obvod z~pøedchozího obrázku také mù¾eme vyhodnocovat po~hladinách zleva doprava,
 251 èím¾ získáme elegantní nerekurzivní algoritmus pro výpoèet FFT v~èase $\Theta(n\log n)$
 252 a prostoru $\Theta(n)$:
 253
 254 \algo
 255 \algin $x_0,\ldots,x_{n-1}$
 256 \:Pro $j=0,\ldots,n-1$ polo¾íme $y_k\= x_{r(k)}$, kde $r$ je funkce bitového zrcadlení.
 257 \:Pøedpoèítáme tabulku $\omega^0,\omega^1,\ldots,\omega^{n-1}$.
 258 \:$b\= 1$ \cmt{velikost bloku}
 259 \:Dokud $b<n$, opakujeme:
 260 \::Pro $j=0,\ldots,n-1$ s~krokem~$2b$ opakujeme: \cmt{zaèátek bloku}
 261 \:::Pro $k=0,\ldots,b-1$ opakujeme: \cmt{pozice v~bloku}
 262 \::::$\alpha\=\omega^{nk/2b}$
 263 \::::$(y_{j+k},y_{j+k+b}) \= (y_{j+k}+\alpha\cdot y_{j+k+b}, y_{j+k}-\alpha\cdot y_{j+k+b})$.
 264 \::$b\= 2b$
 265 \algout $y_0,\ldots,y_{n-1}$
 266 \endalgo
 267
 268 \s{FFT v~koneèných tìlesech}
 269
 270 Nakonec dodejme, ¾e Fourierovu transformaci lze zavést nejen nad tìlesem
 271 komplexních èísel, ale i v~nìkterých koneèných tìlesech, pokud zaruèíme
 272 existenci primitivní $n$-té odmocniny z~jednièky. Napøíklad v~tìlese ${\bb
 273 Z}_p$ pro prvoèíslo $p=2^k+1$ platí $2^k=-1$, tak¾e $2^{2k}=1$
 274 a $2^0,2^1,\ldots,2^{2k-1}$ jsou navzájem rùzná, tak¾e èíslo~2 je~primitivní
 275 $2k$-tá odmocnina z~jedné. To se nám ov¹em nehodí pro algoritmus FFT, jeliko¾
 276 $2k$ bude málokdy mocnina dvojky.
 277
 278 Zachrání nás ov¹em algebraická vìta, která øíká, ¾e multiplikativní grupa
 279 libovolného koneèného tìlesa je cyklická, tedy ¾e v¹echny nenulové prvky tìlesa lze
 280 zapsat jako mocniny nìjakého èísla~$g$ (generátoru). Napøíklad pro $p=2^{16}+1=65\,537$
 281 je jedním takovým generátorem èíslo~$3$. Jeliko¾ mezi èísly $g^1,g^2,\ldots,g^{p-1}$
 282 se musí ka¾dý nenulový prvek tìlesa vyskytnout právì jednou, je~$g$ primitivní
 283 $2^k$-tou odmocninou z~jednièky, tak¾e mù¾eme poèítat FFT pro libovolný vektor,
 284 jeho¾ velikost je mocnina dvojky men¹í nebo rovná $2^k$.\foot{Bli¾¹í prùzkum
 285 na¹ich úvah o~FFT dokonce odhalí, ¾e není ani potøeba tìleso. Postaèí libovolný
 286 komutativní okruh, ve~kterém existuje pøíslu¹ná primitivní odmocnina
 287 z~jednièky, její multiplikativní inverze (ta ov¹em existuje v¾dy, proto¾e
 288 $\omega^{-1} = \omega^{n-1}$) a multiplikativní inverze èísla~$n$. To nám
 289 poskytuje je¹tì daleko více volnosti ne¾ tìlesa, ale není snadné takové okruhy
 290 hledat.}
 291
 292 \bye