etl-hero-background.jpg

Data Warehouse

Was das ist und warum man dies wissen sollte.

Ein Data Warehouse (oder Enterprise Data Warehouse) speichert große Datenmengen, die aus verschiedenen Quellen gesammelt und integriert werden. Da Unternehmen auf diese Daten für Analyse- oder Berichtszwecke angewiesen sind, müssen sie einheitlich formatiert und leicht zugänglich sein. Diese beiden Eigenschaften zeichnen Data Warehousing aus und machen es zu einem unverzichtbaren Tool für moderne Unternehmen.

Geschichte des Data Warehouse

In den 70er und 80er-Jahren nahmen die Datenmengen deutlich zu, deshalb benötigten Unternehmen eine einfache Methode, ihre Informationen zu speichern und darauf zuzugreifen. Der Informatiker Bill Inmon, der als Vater des Data Warehousing gilt, begann in den 70er-Jahren mit der Entwicklung des Konzepts und prägte den Begriff „Data Warehouse“. Er veröffentlichte 1992 das Buch Building the Data Warehouse, das seitdem als Referenzwerk für Data-Warehousing-Technologie gilt. Inmons Definition des Data Warehouse geht von einem „Top-Down“-Ansatz aus, bei dem zunächst ein Zentralspeicher eingerichtet wird und dann innerhalb dieses Speichers Data Marts erstellt werden, die bestimmte Teilmengen von Daten enthalten.

Ralph Kimball, ein weiterer Technologieexperte, der Mitte der 90er-Jahre The Data Warehouse Toolkit veröffentlichte, verfolgte mit seinem „Bottom-up“-Ansatz eine etwas andere Herangehensweise für das Data-Warehousing-Konzept, denn hier werden zunächst einzelne Data Marts entwickelt und später zu einem Data Warehouse zusammengeführt.

Data Warehousing ist nach wie vor relevant, entwickelt sich aber im Zuge der Veränderungen in der Branche für Cloud Computing und Real-Time Analytics weiter. Ein neues Tool zur Datenspeicherung, das einem Data Warehouse ähnelt, ist ein Data Lake, der durch bahnbrechende, kostengünstige Technologien wie Apache Hadoop entstanden ist. Data Lakes werden häufig in Verbindung mit einem unbeschränkten Datenstrom verwendet, der ohne Verarbeitung oder Erstellung von Schemata gespeichert wird.

Managen Sie Ihre Daten komplett lückenlos

Wie können Sie aus der Flut an Informationen in Ihrer Datenbank wertvollen Nutzen ziehen? Data Management-Experte Matthew Magne beschreibt, wie Sie Daten in Ihrem Data Lake streamen, bereinigen und davon Profile erstellen, um Erkenntnisse in Echtzeit zu gewinnen.

Warum sind Data Warehouses wichtig?

Daten sind für Unternehmen unerlässlich, um fundierte Entscheidungen treffen zu können. Aus diesem Grund sind Data Warehouses ebenso wichtig, denn sie speichern all diese Daten. Date Warehouses können beispielsweise:

  • große Datenmengen in einer zentralen Datenbank und in einem Standardformat speichern.
  • Daten aus vielen verschiedenen Quellen integrieren und standardisieren– so können Sie die Daten analysieren oder für die Berichterstellung nutzen.
  • historische Aufzeichnungen verwalten, da sie Daten aus mehreren Monaten gar Jahren speichern können.
  • Ihre Daten sichern, indem sie an einem zentralen Ort gespeichert werden. Nur denjenigen Zugang gewähren, die bestimmte Daten benötigen.
  • einen schnelleren und einfachen Zugriff auf große Datenmengen gewähren, um schneller Geschäftsentscheidungen treffen zu können.

Data Warehousing heute

Ein Data Warehouse macht oft den bedeutenden Unterschied aus zwischen fundierten Entscheidungen und Datenchaos. Erfahren Sie hier, wie Data Warehouses unsere Welt prägen.

Was ist eine Customer Data Platform?

Kundendatenplattformen (CDPs) sind mit Data Warehouses verwandt. Sie beziehen Kundendaten aus verschiedenen Quellen, wie Transaktionsdatenbanken, Callcentern und anderen. Erfahren Sie, wie sie funktionieren und warum sie wichtig sind.

Den Artikel lesen

Webcast

Hadoop, einfache Version

Was können Sie mit Hilfe von Hadoop erreichen – und wie kann es Ihr Data Warehouse unterstützen? Erfahren Sie hier, wie Sie Ihr Data-Warehouse-Ecosystem unterstützen und erweitern können.

Hier geht es zur Zusammenfassung

Data Lake:
Was, warum und wie

Ein Data Lake nimmt Daten schnell auf und bietet Entscheidungsträgern einen Self-Service-Zugang, eine Exploration und eine Visualisierung. Data Lakes eignen sich perfekt für die Speicherung unstrukturierter Big Data wie Tweets, Bilder, Sprach- und Streaming-Daten und sind eine gängige Datenquelle für Machine-Learning-Anwendungen.

Den Artikel lesen


SAS® Data Management

Data stored in a data warehouse doesn’t deliver value unless it’s managed well. With data management technology from SAS, you can transform big data into big opportunity with data integration, data governance, event stream processing and data quality technologies.

Learn more about SAS Data Management

Data Warehouses im Vergleich zu anderen Speichersystemen

Data Warehousing ist zwar eine gängige Lösung für die Speicherung von Daten, aber sicherlich nicht die einzige. Hier erfahren Sie, wie Data Warehouses im Vergleich zu ähnlichen Technologien abschneiden.

Data Warehouse

Speichert eine große Menge von Unternehmensdaten, oft historische Daten, die mehrere Themenbereiche umfassen.
Die Erstellung kann schwierig sein.
Großes Format.
Die Daten werden strukturiert und können für Analytics und das Reporting verwendet werden.

Data Mart

Speichert eine kleinere Datenmenge; typischerweise für einen einzelnen von einer Abteilung genutzten Themenkomplex, z. B. Marketing oder Vertrieb..
Schneller und einfacher zu erstellen als ein Data Warehouse.
Begrenzter Speicherplatz.
Die Daten werden strukturiert und können für Analytics und das Reporting verwendet werden.

Data Lake

Speichert eine große Menge von Rohdaten.
Die Daten bleiben unverändert, bis sie benötigt werden.
Ermöglicht den Nutzern die Suche nach kleineren, relevanteren und flexibleren Datensätzen.

Wie funktioniert das?

Ein Data Warehouse basiert auf Daten, die aus internen und externen Quellen stammen. Diese Daten werden in der Regel in einem Data Warehouse durch einen Extraktions-, Transformations- und Ladeprozess (ETL-Prozess) gespeichert, bei dem Informationen aus der Quelle extrahiert, in hochwertige Daten umgewandelt und dann in ein Warehouse geladen werden. Unternehmen führen diesen Prozess regelmäßig durch, um ihre Daten zu aktualisieren und für den nächsten Schritt vorzubereiten.

Wenn ein Unternehmen bereit ist, seine Daten für Analytics oder für sein Reporting zu nutzen, verlagert sich der Schwerpunkt von Data Warehousing auf Business Intelligence-Tools. Technologien wie Visual Analytics und Data Exploration werden eingesetzt, um Unternehmen bei der Entscheidungsfindung mithilfe von Daten zu unterstützen.