Was ist analytische Online-Verarbeitung?

Online Analytical Processing (OLAP) ist eine Softwaretechnologie, mit der Sie Geschäftsdaten aus verschiedenen Blickwinkeln analysieren können. Unternehmen sammeln und speichern Daten aus mehreren Datenquellen wie Websites, Anwendungen, intelligenten Zählern und internen Systemen. OLAP kombiniert und gruppiert diese Daten in Kategorien, um umsetzbare Erkenntnisse für die strategische Planung zu liefern. Beispielsweise speichert ein Einzelhändler Daten zu allen Produkten, die er verkauft, wie Farbe, Größe, Kosten und Standort. Der Einzelhändler sammelt auch Kundenkaufdaten, wie den Namen der bestellten Artikel und den Gesamtverkaufswert, in einem anderen System. OLAP kombiniert die Datensätze, um beispielsweise Fragen zu beantworten, welche Farbprodukte beliebter sind oder wie sich die Produktplatzierung auf den Umsatz auswirkt.

Warum ist OLAP wichtig?

Online Analytical Processing (OLAP) hilft Unternehmen, eine wachsende Menge digitaler Informationen zu verarbeiten und davon zu profitieren. Zu den Vorteilen von OLAP gehören die folgenden.

Schnellere Entscheidungsfindung

Unternehmen nutzen OLAP, um schnelle und genaue Entscheidungen zu treffen, um in einer schnelllebigen Wirtschaft wettbewerbsfähig zu bleiben. Das Durchführen analytischer Abfragen in mehreren relationalen Datenbanken ist zeitaufwändig, da das Computersystem mehrere Datentabellen durchsucht. Auf der anderen Seite berechnen und integrieren OLAP-Systeme Daten vorab, sodass Geschäftsanalysten bei Bedarf schneller Berichte erstellen können.

Support für nicht-technische Benutzer

OLAP-Systeme erleichtern komplexe Datenanalysen für nicht technisch versierte Geschäftsanwender. Geschäftsanwender können komplexe analytische Berechnungen erstellen und Berichte erstellen, anstatt den Umgang mit Datenbanken zu erlernen.

Integrierte Datenansicht

OLAP bietet eine einheitliche Plattform für Marketing, Finanzen, Produktion und andere Geschäftsbereiche. Manager und Entscheidungsträger können das Gesamtbild sehen und Probleme effektiv lösen. Sie können Was-wäre-wenn-Analysen durchführen, die die Auswirkungen der von einer Abteilung getroffenen Entscheidungen auf andere Geschäftsbereiche aufzeigen.

Was ist OLAP-Architektur?

OLAP-Systeme (Online Analytical Processing) speichern multidimensionale Daten, indem sie Informationen in mehr als zwei Dimensionen oder Kategorien darstellen. Bei zweidimensionalen Daten handelt es sich um Spalten und Zeilen, aber multidimensionale Daten weisen mehrere Merkmale auf. Beispielsweise können multidimensionale Daten für Produktverkäufe aus den folgenden Dimensionen bestehen:

  • Produkttyp
  • Ort
  • Zeit

Data-Engineers erstellen ein mehrdimensionales OLAP-System, das aus den folgenden Elementen besteht. 

Data Warehouse

Ein Data Warehouse sammelt Informationen aus verschiedenen Quellen, einschließlich Anwendungen, Dateien und Datenbanken. Es verarbeitet die Informationen mit verschiedenen Tools, sodass die Daten für Analysezwecke bereit stehen. Das Data Warehouse kann beispielsweise Informationen aus einer relationalen Datenbank sammeln, die Daten in Tabellen mit Zeilen und Spalten speichert. 

ETL-Tools

Extract, Transform, Load (ETL)-Tools sind Datenbankprozesse, die die Daten automatisch abrufen, ändern und in ein Format vorbereiten, das für Analysezwecke geeignet ist. Data Warehouses verwenden ETL, um Informationen aus verschiedenen Quellen zu konvertieren und zu standardisieren, bevor sie OLAP-Tools zur Verfügung gestellt werden.

OLAP-Server

Ein OLAP-Server ist der zugrunde liegende Computer, der das OLAP-System antreibt. Es verwendet ETL-Tools, um Informationen in den relationalen Datenbanken zu transformieren und sie für OLAP-Operationen vorzubereiten. 

OLAP-Datenbank

Eine OLAP-Datenbank ist eine separate Datenbank, die eine Verbindung zum Data Warehouse herstellt. Data-Engineers verwenden manchmal eine OLAP-Datenbank, um zu verhindern, dass das Data Warehouse durch OLAP-Analysen belastet wird. Sie verwenden auch eine OLAP-Datenbank, um die Erstellung von OLAP-Datenmodellen zu vereinfachen.

OLAP-Cubes

Ein Daten-Cube ist ein Modell, das ein mehrdimensionales Array von Informationen darstellt. Obwohl es einfacher ist, sie als dreidimensionales Datenmodell zu visualisieren, haben die meisten Daten-Cubes mehr als drei Dimensionen. Ein OLAP-Cube oder Hypercube ist der Begriff für Daten-Cubes in einem OLAP-System. OLAP-Cubes sind starr, da Sie die Dimensionen und die zugrunde liegenden Daten nach dem Modellieren nicht mehr ändern können. Wenn Sie beispielsweise die Warehouse-Dimension zu einem Cube mit Produkt-, Standort- und Zeitdimensionen hinzufügen, müssen Sie den gesamten Cube umgestalten. 

OLAP-Analysetools

Geschäftsanalysten verwenden OLAP-Tools, um mit dem OLAP-Cube zu interagieren. Sie führen Vorgänge wie Schneiden, Würfeln und Pivotieren aus, um tiefere Einblicke in bestimmte Informationen innerhalb des OLAP-Cubes zu erhalten. 

Wie funktioniert OLAP?

Wie funktioniert OLAP?

Ein OLAP (Online Analytical Processing) System sammelt, organisiert, aggregiert und analysiert Daten mit den folgenden Schritten: 

  1. Der OLAP-Server sammelt Daten aus mehreren Datenquellen, einschließlich relationaler Datenbanken und Data Warehouses.
  2. Anschließend bereinigen, aggregieren, berechnen und speichern die Extract, Transform, Load (ETL)-Tools Daten in einem OLAP-Cube entsprechend der angegebenen Anzahl von Dimensionen.
  3. Geschäftsanalysten verwenden OLAP-Tools, um Berichte aus den multidimensionalen Daten im OLAP-Cube abzufragen und zu generieren.

OLAP verwendet Multidimensional Expressions (MDX), um den OLAP-Cube abzufragen. MDX ist eine Abfrage wie SQL, die eine Reihe von Anweisungen zum Bearbeiten von Datenbanken bereitstellt.

Welche Arten von OLAP gibt es?

OLAP-Systeme (Online Analytical Processing) arbeiten hauptsächlich auf drei Arten.

MOLAP

Bei der multidimensionalen Online-Analyseverarbeitung (MOLAP) wird ein Daten-Cube erstellt, der multidimensionale Daten aus einem Data Warehouse darstellt. Das MOLAP-System speichert vorberechnete Daten im Hypercube. Data-Engineers verwenden MOLAP, da diese Art von OLAP-Technologie schnelle Analysen ermöglicht. 

ROLAP

Anstatt einen Daten-Cube zu verwenden, ermöglicht es Relational Online Analytical Processing (ROLAP) Data-Engineers, mehrdimensionale Datenanalysen in einer relationalen Datenbank durchzuführen. Mit anderen Worten, Data-Engineers verwenden SQL-Abfragen, um basierend auf den erforderlichen Dimensionen nach bestimmten Informationen zu suchen und diese abzurufen. ROLAP eignet sich zur Analyse umfangreicher und detaillierter Daten. ROLAP hat jedoch im Vergleich zu MOLAP eine langsame Abfrageleistung. 

HOLAP

Hybrid Online Analytical Processing (HOLAP) kombiniert MOLAP und ROLAP, um das Beste aus beiden Architekturen zu bieten. HOLAP ermöglicht es Data-Engineers, schnell Analyseergebnisse aus einem Daten-Cube abzurufen und detaillierte Informationen aus relationalen Datenbanken zu extrahieren. 

Was ist Datenmodellierung in OLAP?

Datenmodellierung ist die Darstellung von Daten in Data Warehouses oder OLAP-Datenbanken (Online Analytical Processing). Die Datenmodellierung ist für die relationale Online-Analyseverarbeitung (ROLAP) unerlässlich, da sie Daten direkt aus der relationalen Datenbank analysiert. Es speichert multidimensionale Daten als Stern- oder Schneeflockenschema. 

Sternschema

Das Sternschema besteht aus einer Faktentabelle und Tabellen mit mehreren Dimensionen. Die Faktentabelle ist eine Datentabelle, die numerische Werte enthält, die sich auf einen Geschäftsprozess beziehen, und die Dimensionstabelle enthält Werte, die jedes Attribut in der Faktentabelle beschreiben. Die Faktentabelle bezieht sich auf Dimensionstabellen mit Fremdschlüsseln – eindeutige Kennungen, die mit den entsprechenden Informationen in der Dimensionstabelle korrelieren. 

In einem Sternschema wird eine Faktentabelle mit mehreren Dimensionstabellen verbunden, sodass das Datenmodell wie ein Stern aussieht. Das Folgende ist ein Beispiel für eine Faktentabelle für Produktverkäufe: 

  • Produkt-ID
  • Standort-ID
  • Verkäufer-ID
  • Vertriebsmenge

Die Produkt-ID weist das Datenbanksystem an, Informationen aus der Produktdimensionstabelle abzurufen, die wie folgt aussehen kann:

  • Produkt-ID
  • Produktname
  • Produkttyp
  • Produktkosten

Ebenso verweist die Ortskennung auf eine Ortsdimensionstabelle, die aus den folgenden Elementen bestehen könnte:

  • Standort-ID
  • Land
  • Stadt

Die Verkäufertabelle könnte wie folgt aussehen:

  • Verkäufer-ID
  • Vorname
  • Nachname
  • E-Mail

Schneeflockenschema

Das Schneeflockenschema ist eine Erweiterung des Sternschemas. Einige Dimensionstabellen können zu einer oder mehreren sekundären Dimensionstabellen führen. Dies führt zu einer Schneeflockenform, wenn die Dimensionstabellen zusammengesetzt werden. 

Die Produktdimensionstabelle kann beispielsweise die folgenden Felder enthalten:

  • Produkt-ID
  • Produktname
  • Produkttyp-ID
  • Produktkosten

Die Produkttyp-ID stellt eine Verbindung zu einer anderen Dimensionstabelle her, wie im folgenden Beispiel gezeigt:

  • Produkttyp-ID
  • Name des Typs
  • Version
  • Variante 

Was sind OLAP-Operationen?

Geschäftsanalysten führen mehrere grundlegende analytische Operationen mit einem multidimensionalen Online Analytical Processing (MOLAP) Cube durch. 

Rollup

Beim Rollup fasst das OLAP (Online Analytical Processing) die Daten für bestimmte Attribute zusammen. Mit anderen Worten, es zeigt weniger detaillierte Daten. Sie können beispielsweise Produktverkäufe nach New York, Kalifornien, London und Tokio anzeigen. Ein Rollup-Vorgang würde einen Überblick über die Verkaufsdaten auf der Grundlage von Ländern wie den USA, Großbritannien und Japan bieten. 

Drilldown

Der Drilldown ist das Gegenteil des Rollup-Vorgangs. Geschäftsanalysten bewegen sich in der Konzepthierarchie nach unten und extrahieren die benötigten Details. Sie können beispielsweise von der Anzeige von Verkaufsdaten nach Jahren zur Visualisierung nach Monaten übergehen.

Slice

Data-Engineers verwenden die Slice-Operation, um eine zweidimensionale Ansicht aus dem OLAP-Cube zu erstellen. Beispielsweise sortiert ein MOLAP-Cube Daten nach Produkten, Städten und Monaten. Durch das Aufteilen des Cubes können Data-Engineers eine tabellenkalkulationsähnliche Tabelle erstellen, die aus Produkten und Städten für einen bestimmten Monat besteht. 

Dice

Data-Engineers verwenden die Dice-Operation, um einen kleineren Unter-Cube aus einem OLAP-Cube zu erstellen. Sie bestimmen die benötigten Abmessungen und bauen aus dem ursprünglichen Hypercube einen kleineren Cube.

Pivot

Bei der Pivot-Operation wird der OLAP-Cube entlang einer seiner Dimensionen gedreht, um eine andere Perspektive auf das multidimensionale Datenmodell zu erhalten. Beispielsweise hat ein dreidimensionaler OLAP-Cube auf den jeweiligen Achsen folgende Abmessungen:

  • X-Achse – Produkt 
  • Y-Achse – Standort
  • Z-Achse – Zeit

Bei einem Pivot hat der OLAP-Cube die folgende Konfiguration:

  • X-Achse – Standort
  • Y-Achse – Zeit
  • Z-Achse – Produkt

Wie ist OLAP im Vergleich zu anderen Datenanalysemethoden?

Data Mining

Data Mining ist eine Analysetechnologie, die große Mengen historischer Daten verarbeitet, um Muster und Erkenntnisse zu finden. Geschäftsanalysten verwenden Data-Mining-Tools, um Beziehungen innerhalb der Daten zu ermitteln und genaue Vorhersagen zukünftiger Trends zu treffen.

OLAP und Data Mining

Online Analytical Processing (OLAP) ist eine Datenbankanalysetechnologie, bei der zusammengefasste Daten abgefragt, extrahiert und untersucht werden. Auf der anderen Seite beinhaltet Data Mining die gründliche Untersuchung unverarbeiteter Informationen. Vermarkter könnten beispielsweise Data-Mining-Tools verwenden, um das Benutzerverhalten anhand von Aufzeichnungen jedes Website-Besuchs zu analysieren. Sie können dann OLAP-Software verwenden, um diese Verhaltensweisen aus verschiedenen Blickwinkeln wie Dauer, Gerät, Land, Sprache und Browsertyp zu untersuchen. 

OLTP

Online Transaction Processing (OLTP) ist eine Datentechnologie, die Informationen schnell und zuverlässig in einer Datenbank speichert. Data-Engineers verwenden OLTP-Tools, um Transaktionsdaten wie Finanzunterlagen, Serviceabonnements und Kundenfeedback in einer relationalen Datenbank zu speichern. OLTP-Systeme umfassen das Erstellen, Aktualisieren und Löschen von Datensätzen in relationalen Tabellen. 

OLAP und OLTP

OLTP eignet sich hervorragend für die Verarbeitung und Speicherung mehrerer Transaktionsströme in Datenbanken. Es kann jedoch keine komplexen Abfragen aus der Datenbank ausführen. Daher verwenden Geschäftsanalysten ein OLAP-System, um mehrdimensionale Daten zu analysieren. Data Scientists verbinden beispielsweise eine OLTP-Datenbank mit einem cloudbasierten OLAP-Cube, um rechenintensive Abfragen für historische Daten durchzuführen.

Wie hilft AWS bei OLAP?

AWS-Datenbanken bieten verschiedene verwaltete Cloud-Datenbanken, mit denen Unternehmen OLAP-Vorgänge (Online Analytical Processing) speichern und durchführen können. Datenanalysten verwenden AWS-Datenbanken, um sichere Datenbanken zu erstellen, die den Anforderungen ihres Unternehmens entsprechen. Unternehmen migrieren ihre Geschäftsdaten dank der Erschwinglichkeit und Skalierbarkeit in AWS-Datenbanken. 

  • Amazon Redshift ist ein Cloud Data Warehouse, das speziell für die analytische Online-Verarbeitung entwickelt wurde.
  • Amazon Relational Database Service (Amazon RDS) ist eine relationale Datenbank mit OLAP-Funktionalität. Data-Engineers verwenden Amazon RDS mit Oracle OLAP, um komplexe Abfragen auf dimensionalen Cubes durchzuführen.
  • Amazon Aurora ist eine MySQL- und PostgreSQL-kompatible relationale Cloud-Datenbank. Es ist für die Ausführung komplexer OLAP-Workloads optimiert.


Beginnen Sie heute noch mit den ersten Schritten mit OLAP auf AWS, indem Sie ein AWS-Konto erstellen.

Online Analytical Processing – Nächste Schritte

Zusätzliche produktbezogene Ressourcen ansehen
Weitere Informationen zu Analytics-Services 
Ein kostenloses Konto erstellen

Sie erhalten sofort Zugriff auf das kostenlose Kontingent von AWS. 

Registrieren 
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit der Entwicklung mit AWS in der AWS-Managementkonsole.

Anmeldung