SlideShare ist ein Scribd-Unternehmen logo
1 von 1
Downloaden Sie, um offline zu lesen
Evaluierung von NoSQL-Datenbanksystemen
Gröschel, Stand: 15.08.2017
SP Consulting GmbH
Udo Flory (Geschäftsführer)
Mundenheimer Straße 141
67061 Ludwigshafen
Tel.: +49 (0)621 9534 957-0
E-Mail: info@sp-con.de
www.sp-con.de
Hochschule Mannheim
Prof. Dr. Michael Gröschel
Prof. Dr. Sachar Paulus
Fakultät für Informatik
Paul-Wittsack-Straße 10
D-68163 Mannheim
Tel.: +49 (0) 621 292 6764
E-Mail:
m.groeschel@hs-mannheim.de
s.paulus@hs-mannheim.de
www.informatik.hs-mannheim.de
Das Projekt wurde im Wintersemester 2016/17 von folgen-
den Studierenden des Studienganges Unternehmens- und
Wirtschaftsinformatik in 4 Teams bearbeitet (in alphabeti-
scher Reihenfolge): Marcel Eberling, Christian Garske,
Marcel Geyer, Maximilian Groß, Johannes Heiler, Svenja
Hering, Tobias Jünemann, Lucas Kneis, Elbasan Krasniqi,
Henrik Lawall, Qingyao Liu, David Lupa, Jonathan Markgraf,
Daud Nasir, Marvin Ostermaier, Natalina Radosevic, Andrej
Russkov, Philipp Scholz, Katharina Spinner, Ilker Turan,
Steffen Wagner, Regina Wajant, Büsra Yildiz, Mei Yuan
Der stetige Anstieg der Datenmenge in der
heutigen Zeit stellt in der Praxis eine tech-
nisch hohe Herausforderung dar, und nicht
alle Datenbanksysteme sind dafür gleich
gut geeignet. Dies wurde an der Hoch-
schule Mannheim in einem Unternehmens-
Informatik-Projekt untersucht. Ausgangs-
punkt war eine Anwendung, die beim Ag-
gregieren und Pivotieren der Datensätze
nicht die gewünschte Performance von Ant-
wortzeiten im Sekundenbereich lieferte.
Durch die Evaluation von zwölf alternativen
Datenbanktechnologien wurde zunächst
eine Vorauswahl von vier geeigneten Sys-
temen getroffen: Die spaltenbasierten Da-
tenbanken HBase und Cassandra, sowie
die dokumentenbasierten Datenbanken
MongoDB sowie Couchbase. Im Detail wur-
den die Kriterien Installationsaufwand, Per-
formance, Skalierbarkeit und Benutzungs-
freundlichkeit untersucht. HBase wird nicht
für den Einsatz empfohlen; die übrigen drei
Produkte und Technologien sind vielver-
sprechend.
Ausgangssituation und Anforderung
Der Ausgangspunkt des Projekts war die Herausfor-
derung, große Datenmengen performant aggregieren
und zu pivotieren zu können. Die aktuelle Lösung des
Auftraggebers bestand aus einer Anwendung zur
Analyse von Vorhersagen auf Basis einer relationa-
len Oracle-Datenbank, welche den geforderten Per-
formancekriterien nicht entsprach. Konkret ging es
um eine Reihe von KPIs, die im Zuge einer Reporter-
zeugung, wie sie in Managementpositionen zum All-
tagsgeschäft gehört, berechnet werden sollten. Diese
Berechnung, inklusive dem Anzeigen der abgefrag-
ten Daten, sollte eine Abfragezeit von fünf Sekunden
nicht überschreiten, dauerte aber oft mehrere Minu-
ten.
Zielsetzung
Ziel des Projektes war es, eine NoSQL-Datenbank zu
finden, die sich für den beschriebenen Anwendungs-
fall eignet. Um eine solche Empfehlung aussprechen
zu können, war es notwendig, eine entsprechende
Evaluation durchzuführen. Im Zuge dieser galt es,
ausgewählte Datenbanktechnologien im produktiven
Einsatz zu testen. Dies beinhaltete das Einspielen
von Testdaten, sowie das Übertragen und Implemen-
tieren einer Abfragelogik entsprechend der Vorgaben
des Auftraggebers. Im Vordergrund der Evaluation
stand die Vergleichbarkeit der jeweiligen Gruppener-
gebnisse. Hierzu wurden alle Systeme einheitlichen
Performance-Tests (mit JMeter) unterzogen, um an-
hand dessen eine Empfehlung für den Auftraggeber
aussprechen zu können.
Projektaufgaben und -phasen
 Meilenstein 1 – Vorschlag: In dieser Projektphase
war es die Aufgabe der Gesamtgruppe, eine
Reihe von Datenbanksystemen auf ihre Anwend-
barkeit im gegebenen Kontext zu untersuchen.
Dabei wurde eine Vorauswahl von zwölf Techno-
logien auf 4 reduziert, welche sich zu diesem Zeit-
punkt als Favoriten hervorgetan hatten. Jedes der
Projektteams erhielt eine Technologie zur nähe-
ren Evaluierung.
 Meilenstein 2 – Entwurf: In der zweiten Phase des
Projektes wurden die verschiedenen NoSQL-Lö-
sungen installiert und die Grundzüge der späte-
ren Architektur festgelegt.
 Meilenstein 3 – Prototyp: In dieser Phase sollte
eine erste Version der Lösung erstellt werden,
welche die Grundfunktionen erfüllt. Dazu gehörte
auch, erste Abfragen an die Datenbank senden
und verarbeiten zu können.
 Meilenstein 4 – Optimierungen: Die erste Version
sollte nun erweitert und verbessert werden.
Hierzu floss beispielsweise Feedback des Auf-
traggebers ein. Am Ende der Phase stand ein fer-
tiger Prototyp der Lösung, der alle Anforderungen
erfüllte.
 Meilenstein 5 – Abgabe: Das fertige Produkt war
bereit zur Abnahme und besitzt alle Funktionen,
die den Anforderungen des Kunden entsprechen.
Projektergebnisse
Ein projektbegleitendes Anforderungsdokument
spiegelt die Zielsetzung des Projekts wider. Die ge-
troffene Technologieauswahl stützt sich auf das Do-
kument [1]. Hierin wird eine Vorauswahl für den An-
wendungsfall möglicherweise geeigneter Technolo-
gien getroffenen. Im Ergebnisdokument „Evaluation
von NoSQL Datenbanksystemen in Bezug auf Per-
formance eines Forecast-Systems“ wird eine Emp-
fehlung zu diesen ausgewählten Technologien gege-
ben. Diese stützt sich auf definierte, einheitliche Be-
wertungskriterien. Zu jeder eingesetzten Technologie
gibt es eine Implementierung zur Berechnung der für
den Anwendungsfall relevanten Kennzahlen.
Projektmanagement
Für das Projekt und zum Erreichen des geforderten
Ergebnisses, stand den Studierenden die Wahl der
Projektmanagementmethode frei. Da sich einige An-
forderungen erst über den Projektzeitraum entwickel-
ten, entschied sich jedes Team für die agile Methodik
KANBAN. Diese wurde von manchen Teams mit der
Projektmethodik SCRUM kombiniert. Es wurden wö-
chentliche Statusmeetings abgehalten sowie tägliche
Stand-Up-Meetings. Jedes Team arbeitete mit einem
KANBAN-Board, welches der Visualisierung der Auf-
gaben und Zuständigkeiten diente. Um den Kunden-
kontakt stets aufrecht zu erhalten, stellten die Studie-
renden ein virtuelles Team zusammen, welches für
die Kommunikation zuständig war.
Fazit
Alle vier behandelten Datenbanken haben ihre Vor-
und Nachteile. Jedoch kann man mit Sicherheit
HBase als geeignete Lösung ausschließen, denn der
manuelle Aufwand ist zu hoch und bei der betrachte-
ten Konkurrenz nicht empfehlenswert. Im Gegensatz
dazu bieten sich die übrigen Technologien sehr gut
für die Erfüllung der Anforderungen an.
Weitere Informationen
[1] Faculty of Computer Science, Mannheim Univer-
sity of Applied Sciences (Hrsg.): Betrachtung von 12
Datenbanktechnologien und deren Konzepte der Da-
tenverarbeitung im Kontext Big Data,
https://doi.org/10.13140/RG.2.2.32598.24643

Weitere ähnliche Inhalte

Ähnlich wie Evaluierung von NoSQL-Datenbanksystemen

Solutiontogo webinar top 5 tricks und templates für die Planung mit MS Excel
Solutiontogo webinar top 5 tricks und templates für die Planung mit MS ExcelSolutiontogo webinar top 5 tricks und templates für die Planung mit MS Excel
Solutiontogo webinar top 5 tricks und templates für die Planung mit MS Excelsolutiontogo
 
Profi Werkzeug für den Controller - gesucht, gefunden!
Profi Werkzeug für den Controller - gesucht, gefunden!Profi Werkzeug für den Controller - gesucht, gefunden!
Profi Werkzeug für den Controller - gesucht, gefunden!Codec Deutschland
 
Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...
Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...
Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...Michael Groeschel
 
Agilität im Systems Engineering – geht das?
Agilität im Systems Engineering – geht das?Agilität im Systems Engineering – geht das?
Agilität im Systems Engineering – geht das?HOOD Group
 
Drupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und VergleichDrupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und VergleichMichael Groeschel
 
Roadshow 2018 - Camunda in der Praxis: So geht's
Roadshow 2018 - Camunda in der Praxis: So geht'sRoadshow 2018 - Camunda in der Praxis: So geht's
Roadshow 2018 - Camunda in der Praxis: So geht'scamunda services GmbH
 
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...Wolfgang Schmidt
 
VSHN DevOps Workshop at topsoft 2019
VSHN DevOps Workshop at topsoft 2019VSHN DevOps Workshop at topsoft 2019
VSHN DevOps Workshop at topsoft 2019Markus Speth
 
Ingenieure für Effizienz - Kofler Energies
Ingenieure für Effizienz - Kofler EnergiesIngenieure für Effizienz - Kofler Energies
Ingenieure für Effizienz - Kofler EnergiesNikolaus Widmann
 
Projektbeschreibung "Data Issue Management im Master Data Management" 2022
Projektbeschreibung "Data Issue Management im Master Data Management" 2022Projektbeschreibung "Data Issue Management im Master Data Management" 2022
Projektbeschreibung "Data Issue Management im Master Data Management" 2022Michael Groeschel
 
Cloud Migration – Eine Strategie die funktioniert
Cloud Migration – Eine Strategie die funktioniertCloud Migration – Eine Strategie die funktioniert
Cloud Migration – Eine Strategie die funktioniertQAware GmbH
 
Checkliste für die Digitale Transformation - checklist for digital transforma...
Checkliste für die Digitale Transformation - checklist for digital transforma...Checkliste für die Digitale Transformation - checklist for digital transforma...
Checkliste für die Digitale Transformation - checklist for digital transforma...Gernot Sauerborn
 
Lean Six Sigma Leistungsangebot
Lean Six Sigma LeistungsangebotLean Six Sigma Leistungsangebot
Lean Six Sigma LeistungsangebotMarkus Gahleitner
 
Erfolgsfaktoren zur Auswahl und Organisation von studentischen Projektstudien
Erfolgsfaktoren zur Auswahl und Organisation von studentischen ProjektstudienErfolgsfaktoren zur Auswahl und Organisation von studentischen Projektstudien
Erfolgsfaktoren zur Auswahl und Organisation von studentischen ProjektstudienMichael Groeschel
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesOPITZ CONSULTING Deutschland
 
Future work@detecon teaser 2016 incl. references
Future work@detecon teaser 2016 incl. referencesFuture work@detecon teaser 2016 incl. references
Future work@detecon teaser 2016 incl. referencesMarc Wagner
 
Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010ulrikehartmann71
 

Ähnlich wie Evaluierung von NoSQL-Datenbanksystemen (20)

Solutiontogo webinar top 5 tricks und templates für die Planung mit MS Excel
Solutiontogo webinar top 5 tricks und templates für die Planung mit MS ExcelSolutiontogo webinar top 5 tricks und templates für die Planung mit MS Excel
Solutiontogo webinar top 5 tricks und templates für die Planung mit MS Excel
 
Profi Werkzeug für den Controller - gesucht, gefunden!
Profi Werkzeug für den Controller - gesucht, gefunden!Profi Werkzeug für den Controller - gesucht, gefunden!
Profi Werkzeug für den Controller - gesucht, gefunden!
 
Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...
Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...
Modellierung von Abrechnungsprozessen und Einbindung neuer Dienstleistungspro...
 
Agilität im Systems Engineering – geht das?
Agilität im Systems Engineering – geht das?Agilität im Systems Engineering – geht das?
Agilität im Systems Engineering – geht das?
 
Drupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und VergleichDrupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und Vergleich
 
onSelect
onSelectonSelect
onSelect
 
Roadshow 2018 - Camunda in der Praxis: So geht's
Roadshow 2018 - Camunda in der Praxis: So geht'sRoadshow 2018 - Camunda in der Praxis: So geht's
Roadshow 2018 - Camunda in der Praxis: So geht's
 
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
Erschließen Sie neue Geschäfts­­chancen durch optimierte, automatisierte und ...
 
VSHN DevOps Workshop at topsoft 2019
VSHN DevOps Workshop at topsoft 2019VSHN DevOps Workshop at topsoft 2019
VSHN DevOps Workshop at topsoft 2019
 
Ingenieure für Effizienz - Kofler Energies
Ingenieure für Effizienz - Kofler EnergiesIngenieure für Effizienz - Kofler Energies
Ingenieure für Effizienz - Kofler Energies
 
Agile Business Software mit der Enterprise Cloud
Agile Business Software mit der Enterprise CloudAgile Business Software mit der Enterprise Cloud
Agile Business Software mit der Enterprise Cloud
 
Projektbeschreibung "Data Issue Management im Master Data Management" 2022
Projektbeschreibung "Data Issue Management im Master Data Management" 2022Projektbeschreibung "Data Issue Management im Master Data Management" 2022
Projektbeschreibung "Data Issue Management im Master Data Management" 2022
 
Cloud Migration – Eine Strategie die funktioniert
Cloud Migration – Eine Strategie die funktioniertCloud Migration – Eine Strategie die funktioniert
Cloud Migration – Eine Strategie die funktioniert
 
Checkliste für die Digitale Transformation - checklist for digital transforma...
Checkliste für die Digitale Transformation - checklist for digital transforma...Checkliste für die Digitale Transformation - checklist for digital transforma...
Checkliste für die Digitale Transformation - checklist for digital transforma...
 
Lean Six Sigma Leistungsangebot
Lean Six Sigma LeistungsangebotLean Six Sigma Leistungsangebot
Lean Six Sigma Leistungsangebot
 
Erfolgsfaktoren zur Auswahl und Organisation von studentischen Projektstudien
Erfolgsfaktoren zur Auswahl und Organisation von studentischen ProjektstudienErfolgsfaktoren zur Auswahl und Organisation von studentischen Projektstudien
Erfolgsfaktoren zur Auswahl und Organisation von studentischen Projektstudien
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
 
Future work@detecon teaser 2016 incl. references
Future work@detecon teaser 2016 incl. referencesFuture work@detecon teaser 2016 incl. references
Future work@detecon teaser 2016 incl. references
 
Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010Web monitoring anbietervergleich 2010
Web monitoring anbietervergleich 2010
 
Xidra 2016 DevOps
Xidra 2016 DevOpsXidra 2016 DevOps
Xidra 2016 DevOps
 

Mehr von Michael Groeschel

Das Geschäftsmodell von Twilio
Das Geschäftsmodell von TwilioDas Geschäftsmodell von Twilio
Das Geschäftsmodell von TwilioMichael Groeschel
 
Das Geschäftsmodell von JetBrains
Das Geschäftsmodell von JetBrainsDas Geschäftsmodell von JetBrains
Das Geschäftsmodell von JetBrainsMichael Groeschel
 
Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...
Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...
Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...Michael Groeschel
 
Das Geschäftsmodell von Shopify
Das Geschäftsmodell von ShopifyDas Geschäftsmodell von Shopify
Das Geschäftsmodell von ShopifyMichael Groeschel
 
Das Geschäftsmodell von Check24
Das Geschäftsmodell von Check24Das Geschäftsmodell von Check24
Das Geschäftsmodell von Check24Michael Groeschel
 
Das Geschäftsmodell von Pornhub
Das Geschäftsmodell von PornhubDas Geschäftsmodell von Pornhub
Das Geschäftsmodell von PornhubMichael Groeschel
 
Process Mining: Konzept und Anwendung
Process Mining: Konzept und AnwendungProcess Mining: Konzept und Anwendung
Process Mining: Konzept und AnwendungMichael Groeschel
 
Das Geschäftsmodell von Doozer
Das Geschäftsmodell von DoozerDas Geschäftsmodell von Doozer
Das Geschäftsmodell von DoozerMichael Groeschel
 
Das Geschäftsmodell von Klarna
Das Geschäftsmodell von KlarnaDas Geschäftsmodell von Klarna
Das Geschäftsmodell von KlarnaMichael Groeschel
 
Das Geschäftsmodell von Immocation
Das Geschäftsmodell von ImmocationDas Geschäftsmodell von Immocation
Das Geschäftsmodell von ImmocationMichael Groeschel
 
Das Geschäftsmodell von N26
Das Geschäftsmodell von N26Das Geschäftsmodell von N26
Das Geschäftsmodell von N26Michael Groeschel
 
Das Geschäftsmodell von Spendit
Das Geschäftsmodell von SpenditDas Geschäftsmodell von Spendit
Das Geschäftsmodell von SpenditMichael Groeschel
 
Das Geschäftsmodell von Wikifolio
Das Geschäftsmodell von WikifolioDas Geschäftsmodell von Wikifolio
Das Geschäftsmodell von WikifolioMichael Groeschel
 
Das Geschäftsmodell von Chefkoch
Das Geschäftsmodell von ChefkochDas Geschäftsmodell von Chefkoch
Das Geschäftsmodell von ChefkochMichael Groeschel
 
Das Geschäftsmodell von Teekampagne
Das Geschäftsmodell von TeekampagneDas Geschäftsmodell von Teekampagne
Das Geschäftsmodell von TeekampagneMichael Groeschel
 
Das Geschäftsmodell von Plotagon
Das Geschäftsmodell von PlotagonDas Geschäftsmodell von Plotagon
Das Geschäftsmodell von PlotagonMichael Groeschel
 
Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)
Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)
Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)Michael Groeschel
 
Process Analysis with Process Mining
Process Analysis with Process MiningProcess Analysis with Process Mining
Process Analysis with Process MiningMichael Groeschel
 
Modeling the Business Model and Business Strategy – Conception and Implementa...
Modeling the Business Model and Business Strategy – Conception and Implementa...Modeling the Business Model and Business Strategy – Conception and Implementa...
Modeling the Business Model and Business Strategy – Conception and Implementa...Michael Groeschel
 
Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)
Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)
Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)Michael Groeschel
 

Mehr von Michael Groeschel (20)

Das Geschäftsmodell von Twilio
Das Geschäftsmodell von TwilioDas Geschäftsmodell von Twilio
Das Geschäftsmodell von Twilio
 
Das Geschäftsmodell von JetBrains
Das Geschäftsmodell von JetBrainsDas Geschäftsmodell von JetBrains
Das Geschäftsmodell von JetBrains
 
Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...
Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...
Smart Cities - Welche Herausforderungen verbergen sich wirklich hinter diesem...
 
Das Geschäftsmodell von Shopify
Das Geschäftsmodell von ShopifyDas Geschäftsmodell von Shopify
Das Geschäftsmodell von Shopify
 
Das Geschäftsmodell von Check24
Das Geschäftsmodell von Check24Das Geschäftsmodell von Check24
Das Geschäftsmodell von Check24
 
Das Geschäftsmodell von Pornhub
Das Geschäftsmodell von PornhubDas Geschäftsmodell von Pornhub
Das Geschäftsmodell von Pornhub
 
Process Mining: Konzept und Anwendung
Process Mining: Konzept und AnwendungProcess Mining: Konzept und Anwendung
Process Mining: Konzept und Anwendung
 
Das Geschäftsmodell von Doozer
Das Geschäftsmodell von DoozerDas Geschäftsmodell von Doozer
Das Geschäftsmodell von Doozer
 
Das Geschäftsmodell von Klarna
Das Geschäftsmodell von KlarnaDas Geschäftsmodell von Klarna
Das Geschäftsmodell von Klarna
 
Das Geschäftsmodell von Immocation
Das Geschäftsmodell von ImmocationDas Geschäftsmodell von Immocation
Das Geschäftsmodell von Immocation
 
Das Geschäftsmodell von N26
Das Geschäftsmodell von N26Das Geschäftsmodell von N26
Das Geschäftsmodell von N26
 
Das Geschäftsmodell von Spendit
Das Geschäftsmodell von SpenditDas Geschäftsmodell von Spendit
Das Geschäftsmodell von Spendit
 
Das Geschäftsmodell von Wikifolio
Das Geschäftsmodell von WikifolioDas Geschäftsmodell von Wikifolio
Das Geschäftsmodell von Wikifolio
 
Das Geschäftsmodell von Chefkoch
Das Geschäftsmodell von ChefkochDas Geschäftsmodell von Chefkoch
Das Geschäftsmodell von Chefkoch
 
Das Geschäftsmodell von Teekampagne
Das Geschäftsmodell von TeekampagneDas Geschäftsmodell von Teekampagne
Das Geschäftsmodell von Teekampagne
 
Das Geschäftsmodell von Plotagon
Das Geschäftsmodell von PlotagonDas Geschäftsmodell von Plotagon
Das Geschäftsmodell von Plotagon
 
Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)
Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)
Entscheidungsmanagement: Übungsaufgabe zur Decision Model and Notation (DMN)
 
Process Analysis with Process Mining
Process Analysis with Process MiningProcess Analysis with Process Mining
Process Analysis with Process Mining
 
Modeling the Business Model and Business Strategy – Conception and Implementa...
Modeling the Business Model and Business Strategy – Conception and Implementa...Modeling the Business Model and Business Strategy – Conception and Implementa...
Modeling the Business Model and Business Strategy – Conception and Implementa...
 
Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)
Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)
Geschäftsmodell & Business Model Canvas von Coursera (Sommersemester 2015)
 

Evaluierung von NoSQL-Datenbanksystemen

  • 1. Evaluierung von NoSQL-Datenbanksystemen Gröschel, Stand: 15.08.2017 SP Consulting GmbH Udo Flory (Geschäftsführer) Mundenheimer Straße 141 67061 Ludwigshafen Tel.: +49 (0)621 9534 957-0 E-Mail: info@sp-con.de www.sp-con.de Hochschule Mannheim Prof. Dr. Michael Gröschel Prof. Dr. Sachar Paulus Fakultät für Informatik Paul-Wittsack-Straße 10 D-68163 Mannheim Tel.: +49 (0) 621 292 6764 E-Mail: m.groeschel@hs-mannheim.de s.paulus@hs-mannheim.de www.informatik.hs-mannheim.de Das Projekt wurde im Wintersemester 2016/17 von folgen- den Studierenden des Studienganges Unternehmens- und Wirtschaftsinformatik in 4 Teams bearbeitet (in alphabeti- scher Reihenfolge): Marcel Eberling, Christian Garske, Marcel Geyer, Maximilian Groß, Johannes Heiler, Svenja Hering, Tobias Jünemann, Lucas Kneis, Elbasan Krasniqi, Henrik Lawall, Qingyao Liu, David Lupa, Jonathan Markgraf, Daud Nasir, Marvin Ostermaier, Natalina Radosevic, Andrej Russkov, Philipp Scholz, Katharina Spinner, Ilker Turan, Steffen Wagner, Regina Wajant, Büsra Yildiz, Mei Yuan Der stetige Anstieg der Datenmenge in der heutigen Zeit stellt in der Praxis eine tech- nisch hohe Herausforderung dar, und nicht alle Datenbanksysteme sind dafür gleich gut geeignet. Dies wurde an der Hoch- schule Mannheim in einem Unternehmens- Informatik-Projekt untersucht. Ausgangs- punkt war eine Anwendung, die beim Ag- gregieren und Pivotieren der Datensätze nicht die gewünschte Performance von Ant- wortzeiten im Sekundenbereich lieferte. Durch die Evaluation von zwölf alternativen Datenbanktechnologien wurde zunächst eine Vorauswahl von vier geeigneten Sys- temen getroffen: Die spaltenbasierten Da- tenbanken HBase und Cassandra, sowie die dokumentenbasierten Datenbanken MongoDB sowie Couchbase. Im Detail wur- den die Kriterien Installationsaufwand, Per- formance, Skalierbarkeit und Benutzungs- freundlichkeit untersucht. HBase wird nicht für den Einsatz empfohlen; die übrigen drei Produkte und Technologien sind vielver- sprechend. Ausgangssituation und Anforderung Der Ausgangspunkt des Projekts war die Herausfor- derung, große Datenmengen performant aggregieren und zu pivotieren zu können. Die aktuelle Lösung des Auftraggebers bestand aus einer Anwendung zur Analyse von Vorhersagen auf Basis einer relationa- len Oracle-Datenbank, welche den geforderten Per- formancekriterien nicht entsprach. Konkret ging es um eine Reihe von KPIs, die im Zuge einer Reporter- zeugung, wie sie in Managementpositionen zum All- tagsgeschäft gehört, berechnet werden sollten. Diese Berechnung, inklusive dem Anzeigen der abgefrag- ten Daten, sollte eine Abfragezeit von fünf Sekunden nicht überschreiten, dauerte aber oft mehrere Minu- ten. Zielsetzung Ziel des Projektes war es, eine NoSQL-Datenbank zu finden, die sich für den beschriebenen Anwendungs- fall eignet. Um eine solche Empfehlung aussprechen zu können, war es notwendig, eine entsprechende Evaluation durchzuführen. Im Zuge dieser galt es, ausgewählte Datenbanktechnologien im produktiven Einsatz zu testen. Dies beinhaltete das Einspielen von Testdaten, sowie das Übertragen und Implemen- tieren einer Abfragelogik entsprechend der Vorgaben des Auftraggebers. Im Vordergrund der Evaluation stand die Vergleichbarkeit der jeweiligen Gruppener- gebnisse. Hierzu wurden alle Systeme einheitlichen Performance-Tests (mit JMeter) unterzogen, um an- hand dessen eine Empfehlung für den Auftraggeber aussprechen zu können. Projektaufgaben und -phasen  Meilenstein 1 – Vorschlag: In dieser Projektphase war es die Aufgabe der Gesamtgruppe, eine Reihe von Datenbanksystemen auf ihre Anwend- barkeit im gegebenen Kontext zu untersuchen. Dabei wurde eine Vorauswahl von zwölf Techno- logien auf 4 reduziert, welche sich zu diesem Zeit- punkt als Favoriten hervorgetan hatten. Jedes der Projektteams erhielt eine Technologie zur nähe- ren Evaluierung.  Meilenstein 2 – Entwurf: In der zweiten Phase des Projektes wurden die verschiedenen NoSQL-Lö- sungen installiert und die Grundzüge der späte- ren Architektur festgelegt.  Meilenstein 3 – Prototyp: In dieser Phase sollte eine erste Version der Lösung erstellt werden, welche die Grundfunktionen erfüllt. Dazu gehörte auch, erste Abfragen an die Datenbank senden und verarbeiten zu können.  Meilenstein 4 – Optimierungen: Die erste Version sollte nun erweitert und verbessert werden. Hierzu floss beispielsweise Feedback des Auf- traggebers ein. Am Ende der Phase stand ein fer- tiger Prototyp der Lösung, der alle Anforderungen erfüllte.  Meilenstein 5 – Abgabe: Das fertige Produkt war bereit zur Abnahme und besitzt alle Funktionen, die den Anforderungen des Kunden entsprechen. Projektergebnisse Ein projektbegleitendes Anforderungsdokument spiegelt die Zielsetzung des Projekts wider. Die ge- troffene Technologieauswahl stützt sich auf das Do- kument [1]. Hierin wird eine Vorauswahl für den An- wendungsfall möglicherweise geeigneter Technolo- gien getroffenen. Im Ergebnisdokument „Evaluation von NoSQL Datenbanksystemen in Bezug auf Per- formance eines Forecast-Systems“ wird eine Emp- fehlung zu diesen ausgewählten Technologien gege- ben. Diese stützt sich auf definierte, einheitliche Be- wertungskriterien. Zu jeder eingesetzten Technologie gibt es eine Implementierung zur Berechnung der für den Anwendungsfall relevanten Kennzahlen. Projektmanagement Für das Projekt und zum Erreichen des geforderten Ergebnisses, stand den Studierenden die Wahl der Projektmanagementmethode frei. Da sich einige An- forderungen erst über den Projektzeitraum entwickel- ten, entschied sich jedes Team für die agile Methodik KANBAN. Diese wurde von manchen Teams mit der Projektmethodik SCRUM kombiniert. Es wurden wö- chentliche Statusmeetings abgehalten sowie tägliche Stand-Up-Meetings. Jedes Team arbeitete mit einem KANBAN-Board, welches der Visualisierung der Auf- gaben und Zuständigkeiten diente. Um den Kunden- kontakt stets aufrecht zu erhalten, stellten die Studie- renden ein virtuelles Team zusammen, welches für die Kommunikation zuständig war. Fazit Alle vier behandelten Datenbanken haben ihre Vor- und Nachteile. Jedoch kann man mit Sicherheit HBase als geeignete Lösung ausschließen, denn der manuelle Aufwand ist zu hoch und bei der betrachte- ten Konkurrenz nicht empfehlenswert. Im Gegensatz dazu bieten sich die übrigen Technologien sehr gut für die Erfüllung der Anforderungen an. Weitere Informationen [1] Faculty of Computer Science, Mannheim Univer- sity of Applied Sciences (Hrsg.): Betrachtung von 12 Datenbanktechnologien und deren Konzepte der Da- tenverarbeitung im Kontext Big Data, https://doi.org/10.13140/RG.2.2.32598.24643