Data Driven SEO - Mit schlauen Analysen die richtigen Hebel identifizieren! Durch die Erhebung eigener Daten und die Verknüpfung mit Daten aus Analyse- und SEO-Tools lassen sich im "Data Driven SEO" viele spannende Fragen auf Basis aussagekräftiger Zahlen beantworten. Was erwartet Google zum Beispiel von einer Seite in den Top 10 wirklich? Woran müssen wir arbeiten und was sollten wir verbessern? Inklusive Tools und Workflows aus der Praxis.
Data Driven SEO - Kai Spriestersbach @ SEOkomm 2017
1. DATA DRIVEN SEO
S E O k o m m 2 0 1 7
D A T A S C I E N C E ? !
D a te n l ü g e n n i c h t ,
a b e r s i e z e i g e n
a u c h n i e d i e g a n z e
Wa h r h e i t
W O R K F L O W
M e i n p e r s ö n l i c h e r
A n s a t z f ü r e i n e n
d a te n g e t r i e b e n e n
Co n te n t A u d i t 2 . 0
1
Mit schlauen Analysen die richtigen Hebel identifizieren
W O H E L F E N D A T E N
B e i s p i e l e a u s d e r
P r a x i s f ü r
E n t s c h e i d u n g e n a u f
B a s i s v o n D a te n
W I E D E N K T G O O G L E
Ve r s t ä n d n i s ü b e r
S u c h m a s c h i n e n -
Te c h n o l o g i e a l s
We t t b e w e r b s v o r te i l
2. • Online Strategy Consultant, eology GmbH
• Inhaber SEARCH ONE
• Seit 13 Jahren im Online Marketing
• Ausbildung zum Mediengestalter (IHK)
• E-Commerce Studium (Bachelor of Science)
• Trainer beim Rheinwerk Verlag
• AdWords Business Finalist bei der
Google Online Marketing Challenge 2016
• SEO-Contest Gewinner 2015
• Google Partner seit 2014
• Podcast OnlineRadar mit Eric Kubitz
Kai Spriestersbach
2
I h r R e f e r e n t
8. Wer ist Andrei Broder?
1998
2000
2002
2005
seit 2012
CAPTCHA
8
AltaVista
IBM
Yahoo
Google
9. 9
Die erste Generation verwendete lediglich die on-Page-Daten, also den
Text und dessen Auszeichnungen und ähnelt klassischen Information-
Retrieval-Systemen sehr stark. Firmen wie AltaVista, Excite, WebCrawler und
andere setzen diese Form der Websuche als State-Of-The-Art-Technologie etwa
von 1995 bis 1997 ein.
Drei Generationen von Suchmaschinen
Dieser Ansatz funktionierte laut Broder lediglich für die Klasse sogenannter informational queries.
1.
10. 10
Die zweite Generation zog off-Page-Daten heran, beispielsweise Link-
Analysen, Link-Texte und Click-Through-Daten. So verwendete Google
zum Beispiel Link-Analysen als erste Suchmaschine überhaupt als primären
Rankingfaktor. DirectHit setzte seinerzeit [1998-1999] stärker auf Click-
Through-Daten und ging später in Ask Jeeves auf.
Drei Generationen von Suchmaschinen
Mittlerweile verwenden laut Broder alle großen Suchmaschinen diese Daten für ihr Ranking.
Insbesondere die Link-Analyse und die Link- Texte scheinen laut Broder unabdingbar für die
Klasse der navigational queries zu sein.
2.
11. 11
Die dritte Generation, vermischt Daten aus unterschiedlichsten Quellen,
um damit das Bedürfnis hinter der Suchanfrage zu beantworten.
Beispielsweise bei der Suchanfrage „San Francisco“ werden Links zu einer
Hotelreservierung in San Francisco, einem Kartendienst, dem Wetter und
weiteren Funktionen angezeigt.
Drei Generationen von Suchmaschinen
Weiter postuliert Broder, dass diese dritte Generation sich insbesondere mit dem effizienten
Umgang mit transaktionsorientierten Suchanfragen auseinandersetzen.
3.
12. „Google versucht das
Bedürf nis hinter der
Suchanf rage zu verstehen
und passt die Ranking
Algorithmen danach an”
B I T T E Z I T I E R E N S I E M I C H R U H I G
12
@seokai sagt:
13. 13
Taxonomie der Suchanf ragen
https://doi.org/10.1016/j.ipm.2007.07.015
Level 1: Informational, Navigational,
Transactional
Level 2: Directed, Undirected, List, Find,
Advice, Obtain, Download, Results
Level 3: Closed, Open, Online, Offline,
Free, Not Free, Links, Other
Nach Jansen et al. 2008
18. 18
Handyvertrag im besten Netz für kleines
Geld, maximal 20 EUR mit mind. 5 GB
Daten OHNE Smartphone und die
Vertragslaufzeit ist mir egal.
19. 19
Achtung: Diversif izierung!
Kompensationsstrategie der
Suchmaschine bei unbekannter bzw.
unklarer Suchintention.
Durch die Erweiterung der
Suchanf rage und Diversif izierung der
Suchergebnisse wird die
Wahrscheinlichkeit erhöht, dass der
„richtige“ Treffer dabei ist.
20. 20
Ich will zu Zalando! Sonst nix!!!
Navigational !!!11einself
21. „FÜR JEDE SUCHANFRAGE
GELTEN ANDERE, EIGENE
RANKING FAKTOREN!”
B I T T E Z I T I E R E N S I E M I C H R U H I G
Blöd, oder? Macht SEO richtig aufwändig - oder interessant ;)
21
@seokai sagt:
25. „ALLE RANKING FAKTOREN
STUDIEN SIND BULLSHIT”
B I T T E Z I T I E R E N S I E M I C H R U H I G
Aus wissenschaftlicher Sicht ist keine dieser „Studien“ haltbar.
Aus Marketing-Sicht natürlich höchst interessant…
25
@seokai sagt:
30. SCHEINKORRELATIONEN
V O R S I C H T V O R
30
Korrelation: 0,9745
Je mehr Patente in BW,
desto mehr wandern nach Australien aus
https://scheinkorrelation.jimdo.com
31. SCHEINKORRELATIONEN
V O R S I C H T V O R
31
https://scheinkorrelation.jimdo.com
Korrelation: 0,9954
Je mehr McDonalds Filialen,
desto mehr Patienten in Krankenhäusern
37. 37
Ranking Factors Study 2017
https://de.semrush.com/ranking-factors/
NEU: Jetzt auch mit
Machine Learning!
38. 38
Ranking Factors Study 2017
https://www.semrush.com/blog/semrush-ranking-factors-study-2017-methodology-demystified/
Gewichtung von Ranking Faktoren
mittels „Random Forest“ Algorithmus.
Dieser benötigt allerdings unabhängige
Variablen, um belastbare Ergebnisse zu
liefern.
39. „VERALLGEMEINERUNGEN
SIND IMMER FALSCH”
B I T T E Z I T I E R E N S I E M I C H R U H I G
Eine paradoxe Aussage und doch scheint etwas
daran wahr zu sein …
39
@seokai sagt:
41. 41
Branchenanalyse bei Google Updates
http://kai.im/antranks
Analyse von Unterschieden /
Gemeinsamkeiten in den
Veränderungen:
Branchenweit oder Domain-
spezif isch? Wer ist betroffen?
Idealerweise auf eigenem
Keyword-Set.
Messung via AntRanks:
42. Welche Inhalte benötigen wir für
ein Ranking in den Top 10?
Funktioniert bei Informational
Queries sehr gut. Zeigt
Contentlücken auf Basis der
Analyse der Top 20 (gef iltert).
Individuelle Filter über Korpus-
Rang und Document Count.
TF-IDF Data - Termanalyse
42
https://termlabs.io
43. 43
Optimierung des Crawl-Budgets
Analyse für die Vorbereitung der
Deindexierung/Löschung von Seiten.
• Wieviele URLs crawlt Google pro Tag?
(Search Console)
• Wieviele URLs haben wir eigentlich? (Crawl)
• Welche URLs müssen erhalten bleiben
(Search Console)
• Welche können entfallen? (Analytics)
• Wieviel Traff ic geht ggf. verloren?
(Google Analytics)
44. Auswertung der Crawl Frequenz
einzelner URLs durch GoogleBot.
Welche URLs werden häuf ig
gecrawlt, welche nicht?
Finden von verwaisten URLs.
Analysen zur Verbesserung des
Crawl-Budgets.
SEO Log File Analyzer
44
https://www.screamingfrog.co.uk/log-file-analyser/
49. Mittels Events im Google Tag Manager oder
Custom Analytics Code die Messung verbessern.
Beispielsweise über Deep-Readership die
Scrolltiefe messen oder Content Engagement
bewerten.
Ziel: Realistische Bounce-Rate & Time-On-Site
+ Content Engagement Metriken via Events
Google Analytics richtig konf igurieren
Wichtige Vorbereitung!
49
https://www.simoahava.com/analytics/track-content-engagement-via-gtm/
50. Über die Google Search Console, Daten von
echten Nutzern aus Browser-Plugins und
Machine Learning, stellt Keyword Hero die
organischen Suchbegriffe im Google Analytics
Konto wieder her.
Not Provided Daten wiederholen
Spezial
50
https://keyword-hero.com/de
51. Website Crawler mit API-Anbindung.
Desktop Tool für Windows, Mac und
Linux.
Weiterleitungsketten, 404-Fehler,
Interne Verlinkung, etc.
Bis ca. 1 Mio. URLs geeignet (mit 32
GB RAM)
Screaming Frog SEO Spider
51
https://www.screamingfrog.co.uk/seo-spider/
52. Eigener Spezial-Crawler
Inkl. Linkjuice und Trustflow Ihrer
internen Verlinkung
Fehler f inden, Potentiale Heben
Rohdaten-Export
Seoratio-Tools
52
http://www.seoratiotools.com
53. Einfache Möglichkeit um Daten aus
Google Analytics und der Google
Search Console zu konsolidieren.
Anreicherung mit SEMrush Daten.
Organic Traff ic Insights
BETA
53
https://de.semrush.com/features/organic_traffic_insights/
54. Neue Möglichkeit um die Daten aus
Google Analytics und der Google
Search Console zu konsolidieren und
dauerhaft zu archivieren.
serplorer Google Analytics Integration
BETA
54
https://www.serplorer.com
55. Retrieve data and create automatic
backups f rom Google Search
Console™ into Google Sheets™
Search Analytics for Sheets
Kostenlos
55
https://searchanalyticsforsheets.com
56. Tolle Funktionen zur Auswertung:
Klassif ikation von Brand/Non-Brand
Positionsabhängige CTR-Analyse
Crawl-Fehler herunterladen
(inkl. Verlinkt von)
Check Link presence + mark as f ixed
Netpeak Search Console API Spreadsheet
Kostenlos
56
http://kai.im/gsprd-gsc
57. 57
Filtern und Bewerten
URL Bounce Rate Time on Site Engagement
/ 38 % 03:22 25 %
/angebote/ 22 % 01:12 10 %
/smartphones/ 45 % 00:45 12 %
/dual-sim-handys/ 32 % 02:09 95 %
58. 10%
40%
80%
100%
GUTE ABSPRUNGRATE?
W A S I S T E I N E
D i e A b s p r u n g r a te s a g t , i s o l i e r t b e t r a c h te t n i c h t s ü b e r d i e Z u f r i e d e n h e i t d e s N u t z e r s a u s .
E r s t b e i g e n a u e r e r B e t r a c h t u n g u n d i n Ko m b i n a t i o n m i t a n d e r e n M e t r i ke n l ä s s t s i e s i n n v o l l e
R ü c ks c h l ü s s e z u .
58
63. WELCHE ERGEBNISSE BRINGT DAS?
H a n d a u f s H e r z
V i e l e k l e i n e Ä n d e r u n g e n u n d Ve r b e s s e r u n g e n a d d i e r e n s i c h ü b e r d i e Z e i t z u s e h r g r o ß e n
U p l i f t s . U m d i e S i c h t b a r ke i t z u e r h a l te n u n d ko n t i n u i e r l i c h a u s z u b a u e n s i n d r e g e l m ä ß i g e
O p t i m i e r u n g e n n ö t i g u n d s i n n v o l l .
W H E R E W E
A R E N O W
A company is an
association or
collection of
individuals, whether
M A R K E T I N G
& P R O M O
A company is an
association or
collection of
individuals, whether
O U R
T A R G E T
A company is an
association or
collection of
individuals, whether
C O M P L E X
I D E A S
A company is an
association or
collection of
individuals, whether
63
https://jamesclear.com/marginal-gains
64. Was Daten im SEO leisten und was nicht
D a s g e h t
Über Analysen mögliche Optimierungsansätze
identif izieren. Wo haben wir noch etwas aufzuholen?
Wo gibt es noch etwas zu gewinnen?
P O T E N T I A L E
Datenbasierte Entscheidungen treffen, welche Inhalte
zuerst angegangen werden sollten. Welche Seiten sind
wichtig, welche Themen, etc.
P R I O R I S I E R E N
Sauber aufgesetzte Tests und Analysen helfen beim
Verständnis von Mechanismen und Updates der
Algorithmen.
E X P E R I M E N T E
D a s l e i d e r n i c h t
Daten sind leider keine Wunderwaffe oder ein
Allheilmittel und liefern auch keine geheimen Ranking-
Exploits oder SEO-Tricks.
S E O G O L D
Datengetriebenes SEO ist nicht automatisch besser
oder erfolgreicher. Es gibt viel Spielraum für Fehler und
Interpretation.
V E R B E S S E R U N G E N
Auf Basis von Daten lassen sich manche
Entscheidungen vielleicht leichter treffen, entscheiden
müssen Sie jedoch immernoch selbst.
E N T S C H E I D E N
64
65. 65
T H A N K Y O U
GET IN TOUCH
WITH ME
Ka i S pri es te rsba ch
O nl in e Stra te g y Consul t ant
E- M ai l : k .sp rie stersba ch@ eology.d e
Twi tte r : @se o kai
eology GmbH
Spitalst raße 23
97332 Volka ch
htt p: //www.eology.de/