]> mj.ucw.cz Git - ads2.git/blob - 9-fft/9-fft.tex
Paralelni a nerekurzivni FFT + dodatek o konecnych telesech.
[ads2.git] / 9-fft / 9-fft.tex
1 \input lecnotes.tex
2 \def\imply{\Rightarrow}
3 \prednaska{8}{Fourierova transformace}{ \vbox{\hbox{(K.Jakubec, M.Polák
4         a~G.Ocsovszky,}\hbox{\ V.Tùma, M.Kozák)}}}
5
6 Násobení polynomù mù¾e mnohým pøipadat jako pomìrnì (algoritmicky) snadný
7 problém. Asi ka¾dého hned napadne \uv{hloupý} algoritmus -- vezmeme
8 koeficienty prvního polynomu a~vynásobíme ka¾dý se v¹emi koeficienty druhého
9 polynomu a~pøíslu¹nì u~toho seèteme i~exponenty (stejnì jako to dìláme, kdy¾
10 násobíme polynomy na~papíøe). Pokud stupeò prvního polynomu je $n$ a~druhého
11 $m$, strávíme tím èas $\Omega(mn)$. Pro $m=n$ je to kvadraticky pomalé.
12 Na~první pohled se mù¾e zdát, ¾e rychleji to prostì nejde (pøeci musíme
13 v¾dy vynásobit \uv{ka¾dý s~ka¾dým}). Ve skuteènosti to ale rychleji fungovat
14 mù¾e, ale k~tomu je potøeba znát trochu tajemný algoritmus FFT neboli {\I Fast
15 Fourier Transform}.
16
17
18 \ss{Trochu algebry na~zaèátek:}
19 \>Libovolný polynom $P$ stupnì $n$ lze reprezentovat dvìma rùznými zpùsoby:
20
21 \itemize\ibull
22 \:svými koeficienty, èili èísly $p_{0}, p_{1}, \ldots ,p_{n}$, nebo
23 \:svými hodnotami v~$n$ rùzných bodech $x_{0}, x_{1}, \ldots , x_{n}$, èili
24 èísly $P(x_{0}),$ $P(x_{1}),$ $\ldots , P(x_{n})$.
25 \endlist
26
27 \>Dostateènost $n+1$ hodnot pro urèení druhým zpùsobem lze dokázat
28 následnovnì: polynom stupnì $n$ má maximálnì $n$ koøenù (indukcí, je-li
29 $k$ koøenem $P$, pak lze $P$ napsat jako $(x-k)Q$ kde $Q$ je polynom stupnì
30 o~jedna men¹í, pøitom polynom stupnì 1 má jediný koøen); uvá¾íme-li
31 dva rùzné polynomy $P$ a~$Q$ stupnì $n$ nabývající v~daných bodech stejných
32 hodnot, tak $P-Q$ je polynom stupnì maximálnì $n$, ka¾dé
33 z $x_{0}\ldots x_{n}$ je koøenem tohoto polynomu $\imply$ spor, polynom stupnì
34 $n$ má $n+1$ koøenù $\imply$ $P-Q$ musí být nulový polynom $\imply$ $P=Q$.
35 \medskip        
36
37 \ss{Konvence:}
38 Celé polynomy oznaèujeme velkými písmeny, jednotlivé èleny polynomù pøíslu¹nými
39 malými písmeny (pø.: polynom $W$ stupnì $n$ má koeficienty $w_{0}, w_{1},
40 w_{2},\ldots, w_{n}$).
41
42 Pov¹imnìme si jedné skuteènosti -- máme-li dva polynomy $A$ a~$B$ stupnì $n$
43 a~body $x_{0}, \ldots, x_{k}$, dále polynom $C=A \cdot B$ (stupnì $2n$), pak
44 platí $C(x_{k}) = A(x_{k}) \cdot B(x_{k}), k = 0,1,2, \ldots, n.$ Toto èiní
45 tento druhý zpùsob reprezentace polynomu velice atraktivním pro násobení.
46 Problémem je, ¾e typicky máme polynom zadaný koeficienty a~ne hodnotami
47 v~bodech. Tím pádem potøebujeme nìjaký hodnì rychlý algorimtus (tj.
48 rychlej¹í ne¾ kvadratický, jinak bychom si nepomohli oproti hloupému
49 algoritmu) na~pøevod polynomu z jedné reprezentace do druhé a~zase zpìt.
50
51 Dále bychom si mìli uvìdomit, ¾e stupeò na¹eho výsledného polynomu $C$ bude
52 $\leq 2n$ (kde $n$ je stupeò výchozích polynomù). Pokud chceme polynom $C$
53 reprezentovat pomocí jeho hodnot v~bodech, musíme tedy vzít alespoò $2n$
54 bodù. Tímto konèí malá algebraická vsuvka.
55
56 \s{Idea, jak by mìl algoritmus pracovat:}
57 \algo
58 \:Vybereme $2n$ bodù $x_{0}, x_{1}, \ldots , x_{2n-1}$.
59 \:V tìchto bodech vyhodnotíme polynomy $A$ a~$B$.
60 \:Nyní ji¾ v~lineárním èase získáme hodnoty polynomu $C$ v~tìchto bodech
61         (viz vý¹e).
62 \:Pøevedeme hodnoty polynomu $C$ na~jeho koeficienty.
63 \endalgo
64
65 \>Je vidìt, ¾e klíèové jsou kroky 2 a~4. Vybrání bodù jistì stihneme pohodlnì
66 v~lineárním èase a~vynásobení samotných hodnot té¾ (máme $2n$ bodù a~$C(x_{k})
67 = A(x_{k}) \cdot B(x_{k}), k = 0,1,2, \ldots , 2n-1$, tak¾e na~to nepotøebujeme
68 více ne¾ $2n$ násobení).
69
70 Celý trik spoèívá v~chytrém vybrání onìch bodù, ve kterých budeme polynomy
71 vyhodnocovat. Je na~to potøeba vìdìt pár zajímavostí o~komplexních èíslech,
72 na~webové stránce pøedná¹ky jsou k dispozici slajdy, zde to bude zapsáno
73 o~trochu struènìji.
74
75 \ss{  Vyhodnocení polynomu metodou Rozdìl a~panuj (algoritmus FFT):}
76 Mìjme polynom $P$ øádu $n$ a~chtìjme jej vyhodnotit v~$n$ bodech. Vybereme si
77 body tak, aby byly spárované, èili $\pm x_{0}, \pm x_{1}, \ldots , \pm
78 x_{n/2-1} $. To nám výpoèet urychlí, proto¾e pak se druhé mocniny $x_{j}$
79 shodují s~druhými mocninami $-x_{j}$.
80
81 Polynom $P$ rozlo¾íme na~dvì èásti, první obsahuje èleny se sudými exponenty,
82 druhá s~lichými:
83 $$P(x) = (p_{0}x^{0} + p_{2}x^{2} + \ldots + p_{n-2}x^{n-2}) + (p_{1}x^{1} +
84         p_{3}x^{3} + \ldots + p_{n-1}x^{n-1})$$
85 \>se zavedením znaèení:
86 $$P_s(x^{2}) = p_{0}x^{0} + p_{2}x^{2} + \ldots + p_{n - 2}x^{n - 2}$$
87 $$P_l(x^{2}) = p_{1}x^{1} + p_{3}x^{3} + \ldots + p_{n - 1}x^{n - 1}$$
88
89 \>Dohromady $P(x) = P_s(x^{2}) + xP_l(x^{2})$ a~$P(-x) = P_s(x^{2}) -
90 xP_l(x^{2})$. Jinak øeèeno, vyhodnocování $P$ v~$n$ bodech se nám smrskne
91 na~vyhodnocení $P_s(x)$ a~$P_l(x)$ (oba jsou polynomy stupnì $n/2$ 
92 a~vyhodnocujeme je nyní v~$x^{2}$) v~$n/2$ bodech (proto¾e $(x_{i})^{2} =
93 (-x_{i})^{2}$).
94
95 \s{Pøíklad:}
96 $3 + 4x + 6x^{2} + 2x^{3} + x^{4} + 10x^{5} = (3 + 6x^{2} + x^{4}) + x(4 +
97 2x^{2} + 10x^{4})$.
98
99 Teï nám ov¹em vyvstane problém s~oním párováním -- druhá mocina pøece nemù¾e
100 být záporná a~tím pádem u¾ v~druhé úrovni rekurze body spárované nebudou.
101 Z~tohoto dùvodu musíme pou¾ít komplexní èísla -- tam druhé mocniny záporné býti
102 mohou. Jako $x_{0}, \ldots , x_{n-1} $ si zvolíme mocniny
103 $n$-té primitvní odmocniny z jedné (oznaèíme si ji jako $\omega$). Pøipomeòme:
104 $\omega$ je $n$-tá odmocnina z $1$ je {\it primitivní} $\equiv$ $(\forall k)
105 (k<n)\ \omega^k \neq 1$ a~$\omega^n = 1$. Máme $n$ navzájem rùzných odmocnin
106 z~jednièky, rovnomìrnì rozesetých po jednotkové kru¾nici, BÚNO $n=2^{k}, k \in
107 N$ (jinak viz slajdy Martina Mare¹e). Jednotlivé $x$ vypadají takto: $1,
108 \omega, \omega^{2}, \ldots , \omega^{n - 1} $, kde $\omega = e^{2 \pi i/ n}$.
109
110 \s{Pìt poznámek:}
111 \itemize\ibull
112 \:Pro $k\neq j,\ 0\leq k<j<n$ je $\omega^k \neq \omega^j$, nebo» $\omega^j /
113 \omega^k = \omega^{j-k}\neq 1$, proto¾e $j-k < n$ a~$\omega$ je $n$-tá
114 primitivní (a~tedy $\omega^0, \ldots, \omega^{n-1}$ jsou rùzné).
115 \:$\overline{\omega} = \omega^{-1}$, nebo» $\omega^{-1} = \omega^{-2\pi i/n}$
116 a~tedy èísla $\omega,\omega^{-1}$ svírají vùèi reálné ose opaèný úhel a~jsou
117         komplexnì sdru¾ená.
118 \:mocniny $\omega$ jsou spárované, èili $\omega^{j} = -\omega^{n/2 + j}$
119         (staèí si uvìdomit, ¾e $\omega^{n/2} = -1$ pro $n$ sudé)
120 \:umocníme-li v¹echny $\omega^{0},\ldots, \omega^{n-1}$ na~druhou, vzniknou nám
121         odmnocniny z~$1$ které budou i~nadále spárované: $\omega^n$ je toti¾
122         $1$ a~exponenty lze tedy poèítat$\mod n$, $n$ je sudé $\imply$
123         dostaneme pùvodní posloupnost ze které zmizí liché mocniny $\omega$, ale $n$
124         je mocnina dvojky a~tedy i~$n/2$ je sudé (pro $n=2$ ne, ale tam je to
125         triviální), tak¾e sudé mocniny jsou spárované navzájem..
126 \:$\omega^2$ je $n/2$-tá primitivní odmocnina z 1 -- je toti¾ $(\omega^{-2\pi
127         i/n})^2 = \omega^{-2\pi i/(n/2)}$ a~$n$ je mocnina dvojky.
128 \endlist
129
130 \ss{Celý algoritmus bude vypadat takto:}
131 \>FFT($P$, $ \omega$)
132
133 \>{\sl Vstup:} $p_{0}, \ldots , p_{n-1}$, koeficienty polynomu $P$, a~$\omega$,
134 $n$-tá primitivní odmocina z jedné.
135
136 \>{\sl Výstup:} Hodnoty polynomu v~bodech $1, \omega, \omega^{2}, \ldots ,
137 \omega^{n - 1}$, èili èísla $P(1), P(\omega), P(\omega^{2}),$ $\ldots ,
138 P(\omega^{n - 1})$.
139
140 \algo
141 \:Pokud $n = 1$, vrátíme $p_{0}$ a~skonèíme.
142 \:Jinak rozdìlíme $P$ na~sudé a~liché koeficienty a~rekurzivnì zavoláme
143         FFT($P_s$, $\omega^{2}$) a~FFT($P_l$, $\omega^{2}$) -- $P_l$ i~$P_s$
144         jsou stupnì max. $n/2-1$ a~$\omega^2$ je $n/2$-tá primitivní odmocnina.
145 \:Pro $j = 0, \ldots , n/2 - 1$ spoèítáme:
146
147 \:\qquad $P(\omega^{j}) = P_s(\omega^{2j}) + \omega^{j}\cdot P_l(\omega^{2j})$.
148
149 \:\qquad $P(\omega^{j+n/2})=P_s(\omega^{2j})-\omega^{j}\cdot P_l(\omega^{2j})$.
150
151 \endalgo
152
153
154 \s{Èasová slo¾itost:}
155 \>$T(n)=2T(n/2) + \Theta(n) \Rightarrow$ slo¾itost $\Theta(n \log n)$, jako
156 MergeSort.
157
158
159 Máme tedy algoritmus, který pøevede koeficienty polynomu na~hodnoty tohoto
160 polynomu v~rùzných bodech. Potøebujeme ale také algoritmus, který doká¾e
161 reprezentaci polynomu pomocí hodnot pøevést zpìt na~koeficienty polynomu.
162 K~tomu nám pomù¾e podívat se na~ná¹ algoritmus trochu obecnìji.
163
164
165 \s{Definice:}
166 \>{\I Diskretní Fourierova transformace} $(DFT)$
167 je zobrazení $f: { {\bb C} ^n} \rightarrow { {\bb C} ^n}$, kde $$y=f(x) \equiv
168 \forall j \ y_{j} = \sum \limits ^{n-1}_{k=0} x_{k} \cdot \omega ^{jk}$$
169 (pøestavme si ji jako funkci vyhodnocující polynom s~koeficienty $x$ v~bodech
170 $\omega^j$). Takovéto zobrazení je lineární a~tedy popsatelné maticí $\Omega$
171 s~prvky $\Omega_{jk} = \omega^{jk}$
172
173
174 \s{Jak najít inverzní matici?} Znaème $\overline{\Omega}$ matici, její¾ prvky
175 jsou komplexnì sdru¾ené odpovídajícím prvkùm $\Omega$, a vyu¾ijeme následující
176 lemma:
177
178 \ss{Lemma:}$\quad \Omega\cdot \overline{\Omega} = n\cdot E$
179
180 \proof $$ (\Omega\cdot \overline{\Omega})_{jk} = \sum_{l=0}^{n-1} \omega^{jl}
181 \cdot \overline{\omega^{lk}} = \sum \omega^{jl} \cdot \overline{\omega}^{lk} =
182 \sum \omega^{jl} \cdot \omega^{-lk} = \sum \omega^{l(j-k)}$$
183 \itemize\ibull
184 \:Pokud $j=k$, pak $ \sum \limits ^{n-1}_{l=0} (\omega ^{0}) ^{l} = n$.
185
186 \:Pokud $j\neq k$, pou¾ijeme vzoreèek pro souèet geometrické posloupnosti, kde
187 $a_{1}=1$ a~$q=\omega ^{(j-k) }$ a~dostaneme ${{\omega^{(j-k)n} -1} \over
188 {\omega^{(j-k)} -1}} ={1-1 \over r- 1} = {0 \over \neq 0} = 0$, kde $r$
189 je èíslo rùzné od jednièky (nebo» $\omega$ je $n$-tá primitivní odmoncina).
190 \endlist
191 \qed
192
193
194 \>Na¹li jsme inverzi:
195 $\Omega({1 \over n} \overline{\Omega}) = {1 \over n}\Omega \cdot
196 \overline{\Omega} = E$, \quad $\Omega^{-1}_{jk} = {1 \over n}\overline{\omega^
197 {jk}} = {1 \over n}\omega^{-jk} = {1 \over n} {(\omega^{-1})}^{jk}$, \quad
198 (pøipomínáme, $\omega^{-1}$ je $\overline{\omega}$, $\omega$ je $n$-tá
199 primitivní odmocnina z jednièky).
200
201 Ná¹ algoritmus poèítá tedy i~inverzní transformaci, pouze místo $\omega_n$
202 pou¾ijeme komplexnì zdru¾ené $\overline{\omega_n}$ a~matici vynásobíme $(1/n)$.
203 Co¾ je skvìlé -- staèí znát pouze jeden algoritmus u~kterého staèí v~jednom
204 pøípadì pou¾ít transformovanou matici a~vydìlit $n$.
205
206 \s{Výsledek:} Pro $n= 2^k$ lze DFT na~${\bb C}^n$ spoèítat v~èase $\Theta(n
207 \log n)$ a~DFT$^{-1}$ takté¾.
208
209 \s{Dùsledek:}
210 Polynomy stupnì $n$ lze násobit v~èase $\Theta(n \log n)$:
211 $\Theta(n \log n)$ pro vyhodnocení, $\Theta(n)$ pro vynásobení a~$\Theta(n
212 \log n)$ pro pøevedení zpìt.
213
214 \s{Pou¾ití FFT:}
215
216 \itemize\ibull
217
218 \:Zpracování signálu -- rozklad na~siny a~cosiny o~rùzných frekvencích
219 $\Rightarrow$ spektrální rozklad.
220 \:komprese dat -- napøíklad formát JPEG.
221 \:Násobení dlouhých èísel v~èase $\Theta(n \log n)$.
222 \endlist
223
224 \s{Paralelní implementace FFT}
225
226 \figure{img.eps}{Pøíklad prùbìhu algoritmu na~vstupu velikosti 8}{3in}
227
228 Zkusme si prùbìh algoritmu FFT znázornit graficky (podobnì, jako jsme kreslili
229 hradlové sítì). Na~levé stranì obrázku se nachází vstupní vektor $x_0,\ldots,x_{n-1}$
230 (v~nìjakém poøadí), na~pravé stranì pak výstupní vektor $y_0,\ldots,y_{n-1}$.
231 Sledujme chod algoritmu pozpátku: Výstup spoèítáme z~výsledkù \uv{polovièních}
232 transformací vektorù $x_0,x_2,\ldots,x_{n-2}$ a $x_1,x_3,\ldots,x_{n-1}$.
233 Èerné krou¾ky pøitom odpovídají výpoètu lineární kombinace $a+\omega^kb$,
234 kde $a,b$ jsou vstupy krou¾ku a $k$~nìjaké pøirozené èíslo závislé na poloze
235 krou¾ku. Ka¾dá z~polovièních transformací se poèítá analogicky z~výsledkù
236 transformace velikosti $n/4$ atd. Celkovì výpoèet probíhá v~$\log_2 n$ vrstvách
237 po~$\Theta(n)$ operacích.
238
239 Jeliko¾ operace na~ka¾dé vrstvì probíhají na sobì nezávisle, mù¾eme je poèítat
240 paralelnì. Ná¹ diagram tedy popisuje hradlovou sí» pro paralelní výpoèet FFT
241 v~èase $\Theta(\log n\cdot T)$ a prostoru $\O(n\cdot S)$, kde $T$ a~$S$ znaèí
242 èasovou a prostorovou slo¾itost výpoètu lineární kombinace dvou komplexních èísel.
243
244 \s{Cvièení:} Doka¾te, ¾e permutace vektoru $x_0,\ldots,x_{n-1}$ odpovídá bitovému
245 zrcadlení, tedy ¾e na pozici~$b$ shora se vyskytuje prvek $x_d$, kde~$d$ je
246 èíslo~$b$ zapsané ve~dvojkové soustavì pozpátku.
247
248 \s{Nerekurzivní FFT}
249
250 Obvod z~pøedchozího obrázku také mù¾eme vyhodnocovat po~hladinách zleva doprava,
251 èím¾ získáme elegantní nerekurzivní algoritmus pro výpoèet FFT v~èase $\Theta(n\log n)$
252 a prostoru $\Theta(n)$:
253
254 \algo
255 \algin $x_0,\ldots,x_{n-1}$
256 \:Pro $j=0,\ldots,n-1$ polo¾íme $y_k\= x_{r(k)}$, kde $r$ je funkce bitového zrcadlení.
257 \:Pøedpoèítáme tabulku $\omega^0,\omega^1,\ldots,\omega^{n-1}$.
258 \:$b\= 1$ \cmt{velikost bloku}
259 \:Dokud $b<n$, opakujeme:
260 \::Pro $j=0,\ldots,n-1$ s~krokem~$2b$ opakujeme: \cmt{zaèátek bloku}
261 \:::Pro $k=0,\ldots,b-1$ opakujeme: \cmt{pozice v~bloku}
262 \::::$\alpha\=\omega^{nk/2b}$
263 \::::$(y_{j+k},y_{j+k+b}) \= (y_{j+k}+\alpha\cdot y_{j+k+b}, y_{j+k}-\alpha\cdot y_{j+k+b})$.
264 \::$b\= 2b$
265 \algout $y_0,\ldots,y_{n-1}$
266 \endalgo
267
268 \s{FFT v~koneèných tìlesech}
269
270 Nakonec dodejme, ¾e Fourierovu transformaci lze zavést nejen nad tìlesem
271 komplexních èísel, ale i v~nìkterých koneèných tìlesech, pokud zaruèíme
272 existenci primitivní $n$-té odmocniny z~jednièky. Napøíklad v~tìlese ${\bb
273 Z}_p$ pro prvoèíslo $p=2^k+1$ platí $2^k=-1$, tak¾e $2^{2k}=1$
274 a $2^0,2^1,\ldots,2^{2k-1}$ jsou navzájem rùzná, tak¾e èíslo~2 je~primitivní
275 $2k$-tá odmocnina z~jedné. To se nám ov¹em nehodí pro algoritmus FFT, jeliko¾
276 $2k$ bude málokdy mocnina dvojky.
277
278 Zachrání nás ov¹em algebraická vìta, která øíká, ¾e multiplikativní grupa
279 libovolného koneèného tìlesa je cyklická, tedy ¾e v¹echny nenulové prvky tìlesa lze
280 zapsat jako mocniny nìjakého èísla~$g$ (generátoru). Napøíklad pro $p=2^{16}+1=65\,537$
281 je jedním takovým generátorem èíslo~$3$. Jeliko¾ mezi èísly $g^1,g^2,\ldots,g^{p-1}$
282 se musí ka¾dý nenulový prvek tìlesa vyskytnout právì jednou, je~$g$ primitivní
283 $2^k$-tou odmocninou z~jednièky, tak¾e mù¾eme poèítat FFT pro libovolný vektor,
284 jeho¾ velikost je mocnina dvojky men¹í nebo rovná $2^k$.\foot{Bli¾¹í prùzkum
285 na¹ich úvah o~FFT dokonce odhalí, ¾e není ani potøeba tìleso. Postaèí libovolný
286 komutativní okruh, ve~kterém existuje pøíslu¹ná primitivní odmocnina
287 z~jednièky, její multiplikativní inverze (ta ov¹em existuje v¾dy, proto¾e
288 $\omega^{-1} = \omega^{n-1}$) a multiplikativní inverze èísla~$n$. To nám
289 poskytuje je¹tì daleko více volnosti ne¾ tìlesa, ale není snadné takové okruhy
290 hledat.}
291
292 \bye