Co je nového v prediktivní analytice, a co nového teprve bude? Jak se na to připravit? A s čím je možné začít už dnes? Od hlubokých neuronových sítí po obyčejnou obsluhu zákazníka v obchodě.
2. Jan Matoušek (Data Mind) – Hlavní Analytik
Zkušenosti v oblasti dataminingu od roku 2003
Např.:
O2 Czech Republic,T-Mobile
Ogilvy One
Blažek
Kasa.cz
Zakladatel a hlavní analytik Data Mind s.r.o.
Výsledky:
Desítky prediktivních a segmentačních modelů pro
TELCO, RETAIL, eBusiness a Finance
Spokojení klienti
Vysoká návratnost projektů
3. Kde jste ve využití dat?
-2000 BC
Hodnota
zákazníka a
měření
(Babylon)
1960
Předpověď
nákupu a
hodnoty
zákazníka
(Regrese a
rozhodovací
stromy)
1932
Segmentace
(Clustering)
1975
RFM a
Neuronové
sítě
2000
Automatick
é
rozpoznání
obličejů a
řeči
2011
Umělá
inteligence
jež vyhrává
znalostní
soutěž
(IBM
Watson)
2020
Emulova
ná
lidská
inteligenc
e za 1000
$
(Deep
learning)
Zdroje: Wikipedie, Ray Kurzweil
4. Co dále ?
Posuňte se alespoň do času Gagarina
Sledujte trendy na období 2016-2020
Zdroj obrázku: www.rirt.ru
5. Proč prediktivní analytika
Prediktivní analytika umožňuje vědět dříve než zákazník
(nebo alespoň souběžně se zákazníkem):
Zákazník
Co
potřebuje
koupit
Jaké má
potřeby
Důvody k
odchodu
Špatné
úmysly
Pravdě-
podobnos
t nákupu
6. Jak vzniká predikce na úrovni zákazníka
Modelování
Nákupní
charakteristiky,
kategorie,
zvyklosti
Model
(efekty, účinky)
Nákupy
Budoucí
nákupy
Použijeme zkušenosti z minulosti
pro předpověď budoucího chování
Model Var2
Var
3
Var
1
Predikce
7. Prediktory a výsledky
Zakoupené produkty
v minulosti
Frekvence nákupů
Výše útraty
Chování na webu
Reakce na reklamní kampaně
Nákupní chování
Chování
Pravděpodobnost
dalšího nákupu
nebo
Budoucí hodnota
Předpověď
Budoucí hodnota: v CZK:
Počet kategorií * počet transakcí * 80 (interakce)
+ Suma prodejní ceny * 0.07
+ Nakoupil v posledních 6-ti měsících * 550
+ Vzdálenost od posledního nákupu v měsících * (-20)
+
Nákup v x měsících *675
…
Pravděpodobnost nákupu:
(1/(1+exp(
+Počet měsíců * 0.15
+Počet artiklů* 0.25
+Počet velkých kategorií* 0.15)))
8. Obchodní použití -Výběr zákazníků
8
Výběrem 10% zákazníků získáme 41% nakupujících
Výběrem 20% zákazníků získáme 54% nakupujících
(reálný model ze skutečného projektu)
Zdroj: Data Mind
9. Case study -Vyplatí se to ?
Podíl nakupujících dle desetin databáze (decilů)
vybraných prediktivním modelem Data Mind
Reálná konverze na papírový direct mail
Výkon:
Nejlepší desetina -
decil 10 - nakoupí ve
22% případů
Oslovením decilu 10
dosahujeme
desetinásobné
návratnosti oproti
„průměrnému“ decilu 6
Decil – desetina zákazníků
podle pravděpodobnosti
nákupu, vybráno
modelem Response rate
6 2%
7 2%
8 5%
9 14%
10 22%
Zdroj: Data Mind reference Blažek Praha a.s.
10. Cvičení na dnešek:
Jak udělat prediktivní model na kusu ubrousku
Rozdělte do několika kategorií
zákazníky 2015 podle:
a. Počtu transakcí
b. Data posledního nákupu
c. Výše útraty
• Podívejte se na útraty
2016 v každé skupině
• Který parametr je
nejdůležitější ?
11. Cvičení na dnešek:
Jak udělat prediktivní model na kusu ubrousku
• Prediktivní design
funguje velice dobře i v
primitivních podobách
• Frekvence nákupu
na reálných
datech navyšuje
budoucí prodeje
na 161%
• Pokročilé varianty
stejného postupu
dosahují běžně
• Až 200%-1.000%
průměrných
prodejů
Navýšení prodejů na
Ne Ano
Nejhorší třetina 82% 18% 100% 62%
Prostřední třetina 75% 25% 100% 88%
Nejlepší třetina 53% 47% 100% 161%
71% 29% 100%
Ne Ano
Nejhorší třetina 81% 19% 100% 65%
Prostřední třetina 73% 27% 100% 93%
Nejlepší třetina 59% 41% 100% 142%
71% 29% 100%
Útrata
Total
Total
Nakoupí do roka
Total
Nakoupí do roka
Total
Frekvence
12. 2020:Trendy
Trendy v pokročilé analytice
Open source SW v dominantním postavení
Umělá inteligence na tahu
Rozpoznání řeči, obličejů a lidí jako komodita
Funkce lidského mozku za 1000 $?
Konec spamu ?
13. TREND1: Akcelerace open source analytiky
Akcelerace Open – source analytiky
Zdroj: GoogleTrends
0
20
40
60
80
100
120
2009 2010 2011 2012 2013 2014 2015
Google trends: Vybrané vyhledávací dotazy v oblasti analýzy velkých dat
R (open source prog. jazyk)
SPSS (komerční software)
SAS (komerční software)
Datamining (odvětví)
Big data (odvětví)
14. Korporáti vyhrávají (pokud podporují open-source)
Business model 1:
Otevřenost k open
source:
(Microsoft SQL
Server 2016)
Business model 2:
Cloud (Azure ML)
Business model 3:
Freemium
(RapidMiner)
Zdroj obrázku:
Gartner, grafika
KDNuggets
15. Hluboké neuronové sítě
Hluboké neuronové sítě dokáží strojově zpracovat obrázky i lidskou řeč
Korporace a technologičtí šílenci je již mají a používají (GOOG, FB, MSFT, KDNuggets komunita)
Do 5-ti let budou levné a přípravné k použití
Pro střední business a jako moduly pro spotřebitele
Obrázek: Zdroj Google
16. Konec spamu ?Válka robotů!
Konec SPAMu předpověděl Bill
Gates na rok 2006
Nikdo nepřišel s novou předpovědí
Co víme:
Umělá inteligence již bojuje na obou
frontách
Bot-nets proti Neuronovým sítím a
bayesovským technikám
Personalizace a segmentace výrazně
snižuje pocit spamu u lidí i robotů
V roce 2020 nebudete s největší
pravděpodobností moci zdarma a lehce
doručit miliony stejných emailů
Obrázek: US Navy, Spamcop.net
17. Data Mind s.r.o.
U průhonu 466/22
170 00 Praha 7
www.datamind.cz
Jan Matoušek
jan.matousek@datamind.cz
+420 720 705 639
Logos and registered trademarks mentioned in this
presentation are the property of their respective owners.