Vyuzitı zlomkovych stochastickych procesu pro analyzu
signalu a casovych rad
Seminar strojoveho ucenı a modelovanı
Martin Dlask (KSI FJFI)
http://people.fjfi.cvut.cz/dlaskma1/
3. brezna 2016
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 1 / 62
Juliova mnozina
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 2 / 62
Juliova mnozina
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 3 / 62
Juliova mnozina
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 4 / 62
Fraktalnı mnoziny
Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 5 / 62
Fraktalnı mnoziny
Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)
→ mnoziny s necelocıselnou dimenzı
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 6 / 62
Fraktalnı mnoziny
Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)
→ mnoziny s necelocıselnou dimenzı
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 7 / 62
Fraktalnı mnoziny
Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)
→ mnoziny s necelocıselnou dimenzı
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 8 / 62
Fraktalnı mnoziny
Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)
→ mnoziny s necelocıselnou dimenzı
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 9 / 62
Fraktalnı mnoziny
mnozina je charakterizovana svojı
mıroufraktalnı dimenzı - Hausdorffova dimenze
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 10 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 11 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 12 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 13 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 14 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 15 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 16 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 17 / 62
Fraktalnı mnoziny
δ-pokrytı mnoziny F ⊂ Rn
mnozina v R2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 18 / 62
Hausdorffova mıra a dimenze
Hausdorffova s-rozmerna mıra mnoziny F ⊂ Rn
Hs(F ) = limδ→0
inf
{
+∞∑
i=1
(diam(Ai ))s : (Ai ) je δ-pokrytı mnozinyF
}
Hausdorffova dimenze
dimH(F ) = sup {s : Hs(F ) = +∞}
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 19 / 62
Fraktalnı mnoziny
dimH(C ) = log(4)/ log(3) dimH(S) = log(3)/ log(2)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 20 / 62
Zlomkovy Brownuv pohyb
zlomkovy Brownuv pohyb BH(t) - spojity gaussovsky proces
definovany na intervalu 〈0;+∞)
je zavisly na parametru H ∈ (0; 1)
dimH(BH(t)) = 2− H
autokovariancnı funkce
cov(BH(t),BH(s)) =σ2
2
(
|t|2H + |s|2H + |t − s|2H)
0 50 100 150 200 250 300 350 400 450 500−1.5
−1
−0.5
0
0.5
1
1.5
t
BH
(t)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 21 / 62
Zlomkovy Brownuv pohyb
Zlomkovy Brownuv pohyb - spojity proces
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 22 / 62
Zlomkovy Gaussuv sum
zlomkovy Gaussuv sum GH(t) - spojity gaussovsky proces
definovany na intervalu 〈0;+∞)
je zavisly na parametru H ∈ (0; 1)
dimH(GH(t)) = 2
autokovariancnı funkce
cov(GH(t),GH(t + k)) =σ2
2
(
|k + 1|2H − 2 · |k |2H + |k − 1|2H)
0 50 100 150 200 250 300 350 400 450 500−0.1
−0.05
0
0.05
0.1
t
GH
(t)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 23 / 62
Specialnı prıpady pro H=0,5
zlomkovy Brownuv pohyb pro H = 0, 5 → Wieneruv proces
0 50 100 150 200 250 300 350 400 450 500−0.2
0
0.2
0.4
0.6
0.8
1
1.2
t
W(t
)
zlomkovy Gaussuv sum pro H = 0, 5 → bıly sum
0 100 200 300 400 500−0.2
−0.15
−0.1
−0.05
0
0.05
0.1
0.15
t
WN
(t)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 24 / 62
Specialnı prıpady pro H=0,5
Wieneruv proces
jeho diference - bıly sum (short memory)
Norbert Wiener
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 25 / 62
Vlastnosti zlomkoveho Brownova pohybu
parametr H fraktal zavislost prırustku
H = 1 ne ano
H = 0,5 ano ne
H = 0 ano ano
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 26 / 62
Hurstuv exponent
D = 2− H
D . . . Hausdorffova dimenzeH . . . Hurstuv exponent
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 27 / 62
Hurstuv exponent
D = 2− H
D . . . Hausdorffova dimenzeH . . . Hurstuv exponent
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 28 / 62
Metoda R/S
R . . . rozsah (range)
S . . . smerodatna odchylka (std)
m . . . velikost segmentu
1 vypocet strednı hodnoty R/S v kazdem segmentu
(R/S)m =1
r
r∑
j=1
Rj
Sj,
2 pouzitı regresnıho modelu
E [(R/S)] ∝ mH .
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 29 / 62
Metoda R/S
R . . . rozsah (range)
S . . . smerodatna odchylka (std)
m . . . velikost segmentu
1 vypocet strednı hodnoty R/S v kazdem segmentu
(R/S)m =1
r
r∑
j=1
Rj
Sj,
2 pouzitı regresnıho modelu
E [(R/S)] ∝ mH .
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 30 / 62
Metoda R/S
R . . . rozsah (range)
S . . . smerodatna odchylka (std)
m . . . velikost segmentu
1 vypocet strednı hodnoty R/S v kazdem segmentu
(R/S)m =1
r
r∑
j=1
Rj
Sj,
2 pouzitı regresnıho modelu
E [(R/S)] ∝ mH .
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 31 / 62
Metoda R/S
R . . . rozsah (range)
S . . . smerodatna odchylka (std)
m . . . velikost segmentu
1 vypocet strednı hodnoty R/S v kazdem segmentu
(R/S)m =1
r
r∑
j=1
Rj
Sj,
2 pouzitı regresnıho modelu
E [(R/S)] ∝ mH .
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 32 / 62
Metoda pruchodu nulou (zero-crossing)
1 vypocet pravdepodobnosti pruchodu nulou
p∗ =pocet prusecıku
pocet dat
2 vypocet bodoveho odhadu H
H = 1 + log2 cosπp∗
2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 33 / 62
Metoda pruchodu nulou (zero-crossing)
1 vypocet pravdepodobnosti pruchodu nulou
p∗ =pocet prusecıku
pocet dat
2 vypocet bodoveho odhadu H
H = 1 + log2 cosπp∗
2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 34 / 62
Metoda pruchodu nulou (zero-crossing)
1 vypocet pravdepodobnosti pruchodu nulou
p∗ =pocet prusecıku
pocet dat
2 vypocet bodoveho odhadu H
H = 1 + log2 cosπp∗
2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 35 / 62
Vylepsena metoda pruchodu nulou (zero-crossing revisited)
bodovy odhad Hurstova exponentu H za predpokladu znamepravdepodobnosti p∗
H = 1 + log2 cosπp∗
2
pocet pruchodu nulou Z ve vzorku delky N se rıdı binomickymrozdelenım
f (Z |p∗) =
(
N
Z
)
(p∗)Z · (1− p∗)N−Z
po pouzitı Bayesovske inverze ma pravdepodobnost pruchodu nulouBeta-rozdelenı
fPOST(p∗|Z ) =
(p∗)Z−α(1− p∗)N−Z−α
B(Z + 1− α,N − Z + 1− α)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 36 / 62
Vylepsena metoda pruchodu nulou (zero-crossing revisited)
po rozdelenı casove rady na L castı (v kazde casti je Zk pruchodunulou) muzeme vypocıtat agregovanou hustotu pravdepodobnosti
fL(p) =1
L
L∑
k=1
pZk−α(1− p)N−α−Zk
B(Zk + 1− α,N − Zk + 1− α)
idealnı rozdelenı (optimalnı segmentace) je na L∗ dılu
L∗ =
{
1, kdyz fL(p) je jednovrcholova pro vsechna L
min {L > 1 : fL(p) je jednovrcholova } , jinak
→ delıme signal na jemnejsı segmenty do te doby, dokud nenıagregovana hustota pravdepodobnosti fL(p) jednovrcholova
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 37 / 62
Vizualizace optimalnı segmentace
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 38 / 62
Vizualizace optimalnı segmentace
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 39 / 62
Vizualizace optimalnı segmentace
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 40 / 62
Vizualizace optimalnı segmentace
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 41 / 62
Vylepsena metoda pruchodu nulou (zero-crossing revisited)
vypocet Hurstova exponentu
E(H) = 1 +
∫ 1
0fL∗(p) log2 cos
pπ
2dp
tradicnı metoda nova metoda
bodovy odhad H strednı hodnota a konfidencnıintervaly
pravdepodobnost pruchodu nulou jenahrazena relativnı cetnostı
pravdepodobnost pruchodunulou ma Beta-rozdelenı
pojıma signal jako celek vyuzıva bayesovskeho prıstupua segmentace signalu
absence konfidencnıho intervalu realisticky konfidencnı interval
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 42 / 62
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 43 / 62
Aplikace fraktalnı teorie
Pouzitı Hurstova exponentu:
1 test generatoru nahodnych cısel - nejjednodussı pouzitı
2 ekonomie - zavislost vyvoje casovych rad (indexy akciovych trhu)
3 biomedicına - detekce Alzheimerovy choroby ze signalu EEG
4 IT - vytızenı pocıtacovych sıtı z hlediska mnozstvı dat
5 hydrologie - analyza prutoku vodnıch toku
6 hudba - klasifikace hudebnıch zanru
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 44 / 62
Ekonomie - merenı zavislosti a predikovanı casovych rad
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 45 / 62
Ekonomie - merenı zavislosti a predikovanı casovych rad
pouzitı nove metodiky pro odhad Hurstova exponentu
data z obdobı 1991 - 2015zkoumane indexy akciovych trhu:
Evropa - CAC40, DAX, FTSE, SMIAsie - HSI, NIKKEISevernı Amerika - SP500, NASDAQ, TSX
zkoumany jejich logaritmicke diference (za predpokladu fGn)
1990 1995 2000 2005 2010 20150
500
1000
1500
2000
2500
t
x(t)
SP500Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 46 / 62
Ekonomie - merenı zavislosti a predikovanı casovych rad
mıra zavislosti casove rady je dana Hurstovym exponentem
casova rada je predikovatelna, kdyz je Hurstuv exponent vetsı nez 0,5
pouzitı nastroje pro zlomkove modelovanı casovych rad (ARFIMA)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 47 / 62
Ekonomie - merenı zavislosti a predikovanı casovych rad
ekonomicke casove rady jsou obtızne predikovatelne
vetsinou je Hurstuv exponent blızky 0,5
u vıce zavislych casovych rad je zapotrebı maly pocet delenı
5 10 15 20 250
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
L
H
SP500
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 48 / 62
Ekonomie - merenı zavislosti a predikovanı casovych rad
index L∗ EH 95% CI
CAC40 5 0.4652 (0.3746;0.5545)
DAX 1 0.4790 (0.4556;0.5023)
FTSE 3 0.4863 (0.4361;0.5482)
HSI 1 0.4974 (0.4746;0.5201)
NASDAQ 14 0.5418 (0.4008;0.7136)
NIKKEI 3 0.4532 (0.4034;0.5068)
SMI 1 0.5087 (0.4863;0.5310)
SP500 6 0.4460 (0.3225;0.5628)
TSX 12 0.5607 (0.3957;0.6992)
Optimalnı segmentace a konfidencnı intervaly
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 49 / 62
ARFIMA modely
B . . . operator posunutı
B i(Xt) = Xt−i
ARMA(p,q) model
(
1−
p∑
i=1
φiBi
)
Xt =
(
1 +
q∑
i=1
θiBi
)
et
ARIMA(p,d,q) model, kde p ∈ N
(
1−
p∑
i=1
φiBi
)
(1− B)dXt =
(
1 +
q∑
i=1
θiBi
)
et
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 50 / 62
ARFIMA modely
ARFIMA(p,d,q) model, kde d ∈ (0, 1)
(
1−
p∑
i=1
φiBi
)
(1− B)dXt =
(
1 +
q∑
i=1
θiBi
)
et
ma stejny zapis jako ARIMA s rozdılem, ze
(1− B)d =
∞∑
k=0
(
d
k
)
(−B)k = 1− d · B +d(d − 1)
2!B2 − · · ·
parametr d vypocteme z Hurstova exponentu H jako
d = H − 1/2
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 51 / 62
Biomedicına - diagnostika Alzheimerovy choroby z EEG
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 52 / 62
Biomedicına - diagnostika Alzheimerovy choroby z EEG
analyza 19 kanalu EEG
rozdılny Hurstuv exponent zdravychsubjektu a pacientu trpıcıch Alzheimerovoudemencı
zdravy clovek (CN) - nizsı hodnoty H
nemocny clovek (AD) - vyssı hodnoty H
nalezeny vyznamne rozdıly mezi obemaskupinami
nemoc se u kazdeho projevuje ruzne
metodika zatım neumoznuje presne urcit,jestli konkretnı pacient nemocı trpı
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 53 / 62
Biomedicına - diagnostika Alzheimerovy choroby z EEG
0 500 1000 1500 2000 2500 3000−150
−100
−50
0
50
100
150
t
∆ϕ
nemocný pacient
0 500 1000 1500 2000 2500 3000−100
−50
0
50
100
150
200
t
∆ϕ
zdravý pacient
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 54 / 62
Biomedicına - diagnostika Alzheimerovy choroby z EEG
0 10 20 30 40 50 60 70 800.8
0.82
0.84
0.86
0.88
0.9
0.92
0.94
0.96
0.98
1
k
E(H
)
0 10 20 30 40 50 60 70 800.8
0.85
0.9
0.95
1
k
E(H
)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 55 / 62
Biomedicına - diagnostika Alzheimerovy choroby z EEG
rozsah (range) Hurstovaexponentu u nemocnych (AD)a zdravych (CN) pacientu
na druhem kanalu
0
0.05
0.1
0.15
0.2
1 2
R
CNAD
nejvetsı rozdıly vetsinounastavajı na druhem,
tretım a sedmem kanalu
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 56 / 62
Aplikace na hudebnı zaznam
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 57 / 62
Aplikace na hudebnı zaznam
jaky hudebnı styl reprezentuje kazdy ze zvukovych signalu?
jaky je jejich Hurstuv exponent?
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 58 / 62
Aplikace na hudebnı zaznam
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 59 / 62
Aplikace na hudebnı zaznam
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 60 / 62
Zaver
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 61 / 62
Dıky za pozornost! ;)
Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 62 / 62
Top Related