2. FUN fact
Byť single ↗
Singles domácnosti sú podľa štúdie University College London
environmentálnou časovou bombou. Ich spotreba elektrickej
energie na hlavu je o 55% vyššia ako v prípade štvorčlennej
rodiny1.
1
https://www.ucl.ac.uk/news/news-articles/
news-releases-archive/sololiving
1
3. Prečo budem hovoriť o energetike a predikciách?
Lebo:
• Som bol pridelený na projekt o “Big Data”, ktorý sa riešil
na fakulte.
• Presnejšia predikcia spotreby elektrickej energie je
dôležitá z viacerých dôvodov.
• Baví ma Data Mining.
• Romanovi ma bonzli moji kolegovia.
2
5. Model siete
Nový model siete:
• Zdroj energie - veterné a
solárne elektrárne. Sú
ťažšie predvídateľné.
• Aktívni koncoví užívatelia.
producer + consumer ⇒
prosumer.
• Regulačné zariadenia.
Prečerpávacie vodné
elektrárne.
4
6. Presnejšia predikcia
• Výroba elektrickej energie. Prepätie v sieti.
• Producenti.
• Distribučné spoločnosti. Deregulácia trhu. Nákup a predaj
elektriny.
5
7. Čo sa preto robí?
• Vytváranie inteligentných
sietí (smart grids).
• Zmena legislatívy.
• Finančná podpora od EÚ.
Znižovanie spotreby el.
energie.
• Kľúčové slová:
smart meter,
demand response,
empowering, smart cities.
6
8. Výskumný projekt na fakulte
Info:
• Financovanie - Agentúra Ministerstva školstva, vedy, výskumu a športu
SR pre štrukturálne fondy.
• Doba riešenia - február 2014 – november 2015.
• Partneri - ATOS, STU, Sféra s.r.o.
• FEI STU - Smart Grid a Kryptografia. FIIT STU - Big Data.
Big Data:
• Regulácia Európskej únie - vyhláška MH SR č.358/2013 účinnej od 15.
novembra 2013.
• v SR má byť inteligentnými meračmi vybavených 80% zo všetkých
odberných miest. 2 milióny.
• 15-minútové intervaly údajov o odbere elektrickej energie.
• 96 meraní denne, pre 2 milióny odberateľov je to asi 70, 08 miliárd
záznamov ročne.
7
9. Inteligentné siete a merače
• Inteligentná sieť je systém, ktorý dokáže ovládať dopyt po elektrine
v udržateľnej, spoľahlivej a ekonomickej forme tým, že využíva
pokročilé digitálne informácie a komunikačné technológie. Táto
platforma má za cieľ dosiahnuť stálu dostupnosť energií, udržateľnosť
energie, ochranu životného prostredia, prevenciu pred veľkými
zlyhaniami (výpadkami), ako aj optimalizovať prevádzkové náklady
spojené s produkciou a distribúciou energie.
• Výhody inteligentných meračov:
1. Automatické zbieranie dát. Už nie je potrebné manuálne
zapisovanie hodnôt z meračov.
2. Povoľuje vytváranie dynamických taríf (faktúr), ktoré sa
menia počas dňa. Tento prístup môže znížiť výrazne
spotrebu elektrickej energie počas špičiek.
8
10. Slovenské dáta
• Počet OOM je 21502. Z toho 11281 sú fajn. Podniky.
• Časový interval meraní: 01.07.2011 – 14.05.2015. No nie každé OOM má
dáta z celého intervalu. Prevažne až od 01.07.2013.
Írske dáta:
• Počet OOM je 6435. Z toho 3639 sú rezidencie. Dotazníky.
• Časový interval: 14.7.2009 – 31.12.2010. 30-min. merania (48 denne).
9
11. Smart meter dáta
OOM_ID DIAGRAM_ID CAS MNOZSTVO DRUH_MERANIA DATUM PSC
1: 11 202004 −45 4.598 O 01/01/2014 4013
2: 11 202004 195 4.087 O 01/01/2014 4013
3: 11 202004 −30 5.108 O 01/01/2014 4013
4: 11 202004 345 4.598 O 01/01/2014 4013
5: 11 202004 825 2.554 O 01/01/2014 4013
6: 11 202004 870 2.554 O 01/01/2014 4013
41312836: 20970 14922842 90 18.783 O 14/02/2015 4011
41312837: 20970 14922842 75 20.581 O 14/02/2015 4011
41312838: 20970 14922842 60 18.583 O 14/02/2015 4011
41312839: 20970 14922842 45 18.983 O 14/02/2015 4011
41312840: 20970 14922842 30 17.384 O 14/02/2015 4011
41312841: 20970 14922842 15 18.583 O 14/02/2015 4011 10
19. Analýza časových radov
• Nie sú veľmi vhodné pri viacnásobných sezónnostiach.
• Riešenie: Vytváranie separátnych modelov pre rôzne dni
v týždni.
• Riešenie: Double-seasonal Holt-Winters (DSHW).
18
20. Analýza časových radov
• Riešenie: Dekompozícia časového radu na tri zložky - sezónna,
trend, zostatok (šum).
• Rôzne metódy. STL dekompozícia (seasonal decomposition of
time series by loess).
19
22. Regresné stromy a lesy
• Dummy premenné nie sú vhodné.
• RPART, Extremely Randomized Trees, Bagging.
Denný a týždenný sezónny vektor:
Day = (1, 2, . . . , seas, 1, 2, . . . , seas, . . . )
Week = (1, 1, . . . , 1, 2, 2, . . . , 2, . . . , 7, 1, 1, . . . ),
kde seas je perióda (48 resp. 96).
21
23. Regresné lesy
• Extreme Gradient Boosting (xgboost), Random Forest.
Denný a týždenný sezónny vektor vo forme sínusu a kosínusu:
Day = (1, 2, . . . , seas, 1, 2, . . . , seas, . . . )
Week = (1, 1, . . . , 1, 2, 2, . . . , 2, . . . , 7, 1, 1, . . . )
sin(2π Day
seas ) + 1
2
resp.
cos(2π Day
seas ) + 1
2
sin(2πWeek
7 ) + 1
2
resp.
cos(2πWeek
7 ) + 1
2
,
kde seas je perióda (48 resp. 96).
• Odšumená spotreba oneskorená (lag) o jeden deň.
22
24. Neurónové siete
• Dopredné, rekurentné, viacvrstvový perceptrón (MLP),
hlboké.
• Spotreba oneskorená o jeden týždeň. Odšumená
spotreba.
• Model pre rôzne dni.
• Sínus a kosínus.
23
25. Ensemble learning
• Nevieme určiť, ktorý model je najlepší. Pretrénovanie
(overfitting).
• Učenie súboru metód. Váhovanie modelov ⇒ lineárna
kombinácia.
• Adaptácia váh predikčných metód na základe chyby predikcie -
mediánové váhovanie.
et
j = median(| xt
− ˆx
t
j |)
wt+1
j = wt
j
median(et
)
et
j
Trénovacia množina – pridávanie a zabúdanie dát. Posuvné okno.
24
26. Ensemble learning
• Inkrementálno-heterogénny ensemble model.
• Zlepšenie o 8 − 12%.
• Váhovanie metód – optimalizačná úloha.
Genetický algoritmus, PSO a iné.
• Zlepšenie o 5, 5%.
25
27. Vytváranie predikovateľnejších skupín odberateľov
Analýza zhlukov! Cluster Analysis!
• Bez učiteľa. Unsupervised learning.
• Úlohou analýzy zhlukov je zoskupiť sadu objektov v takom
zmysle, že objekty v rovnakej skupine (zhluk) sú si viac
podobné ako tie, ktoré sú v iných skupinách (zhlukoch).
26
28. Analýza zhlukov v inteligentných sieťach
• Pohotovostná analýza. Takáto analýza sa snaží produkovať
detekcie a reakcie k neočakávaným problémom.
Monitorovanie vývoja zhluku uzlov (inteligentných
meračov) môže pomôcť odhaľovať náhle zmeny v dopyte
a ponuke.
• Vytvorenie nevychýlených vzoriek (profilov) z populácie.
Typové diagramy.
• Identifikácia charakteristík, ktoré najviac korelujú
so správaním sa používania elektrickej energie.
• V neposlednom rade vylepšenie predikčných metód a tým
pádom zníženie chybovosti predikcie spotreby elektrickej
energie.
27
30. Analýza zhlukov
Veľa rôznych metód:
Ťažiskové
K-means, K-medoids, CLARA.
Pravdepodobnostné
EM.
Založené na hustote
DBSCAN, OPTICS.
Hierarchické
Single-linkage, CURE.
Vysoká dimenzionalita dát - č.r.
29
31. Zhlukovanie OOM
Riešenia:
1. Prispôsobiť dáta na niektorý známy algoritmus.
2. Vytvoriť nový algoritmus.
3. Nerobiť nič a dúfať, že to aj tak pomôže.
Môj výber:
K-means + návrh vhodných reprezentácií časových radov.
30
36. Reprezentácie časových radov
Prečo reprezentácie?
1. Znižujú pamäťové zaťaženie.
2. Zrýchľujú následné algoritmy strojového učenia.
3. Implicitne odstraňujú šum z dát.
4. Zvýrazňujú základné charakteristiky dát.
35
37. Predspracovanie
Normalizácia časových radov - odberateľov.
Najlepšia možnosť je použiť z-skóre:
x − µ
σ
Alternatíva:
x
max(x)
Normalizovanie spotreby ⇒ zhlukovanie podobných priebehov
(kriviek) ⇒ presnejšia predikcia.
36
38. Metódy reprezentácie časových radov
PAA - Piecewise Aggregate Approximation. Non data adaptive.
n -> d. ˆX = (ˆx1, . . . ,ˆxd).
ˆxi =
d
n
(n/d)i
∑
j=(n/d)(i−1)+1
xj.
Nie len priemer. Medián, smerodajná odchýlka, maximum.
37
39. Metódy reprezentácie časových radov
PLA - Piecewise Linear Approximation.
Dátovo adaptívna (data adaptive) metóda.
38
40. Späť k modelom a hlavne k regresiám
• Reprezentácie založené na štatistickom modeli (model
based).
• Extrakcia regresných koeficientov ⇒ vytváranie denných
profilov.
• Vytvorenie reprezentácie dlhej, ako je perióda sezónneho
č.r.
xi = β1ui1 + β2ui2 + · · · + βseasuiseas + εi
Nová reprezentácia: β = (β1, . . . , βseas).
39
41. Čo sa dá všetko použiť
Metódy:
• Viacnásobná lineárna regresia. Robustná regresia,
L1-regresia.
• Odhad reg. koeficientov pomocou stochastic gradient
descent (SGD).
• Generalized additive model (GAM). Nemýliť s GLM. Splajny
- vyhladzovacie funkcie. Cyclic cubic regression spline.
• Trojité Holt-Winters exponenciálne vyhladzovanie.
• Priemerné alebo mediánové denné profily.
40