Data Warehouse-News: Infos & Nachrichten

Data Warehouse - was hinter dem Prinzip steckt

In einem Data Warehouse werden Daten aus verschiedenen Quellen zentral im Unternehmen archiviert. Lesen Sie hier mehr über das Konzept.

Data Warehouse: Definition und Einführung

Ein Data Warehouse ist ein Datenbanksystem, das in einem Unternehmen Daten verschiedener Herkunft zentral speichert, aufbereitet und bereitstellt. Dies ermöglicht es, einen globalen Überblick auf die Datenbestände zu erhalten und Analysen durchzuführen.

Data Warehouses archivieren Datenbestände strukturiert, oft in einem relationalen Datenbanksystem. Einmal eingespielt, können die Daten meist nicht mehr verändert werden.

Teilbestände der Daten, die Data Marts genannt werden, können generiert und an andere Systeme weitergeben werden.

Als Synonym für Data Warehouse wird der deutsche Begriff Datenlager verwendet. Ein verwandtes Konzept ist der Data Lake, in dem sehr großen Datenmengen (Big Data) und auch unstrukturierte Daten gespeichert werden können.

Funktionsweise und Betrieb von Data Warehouse

Der Betrieb eines Data Warehouses umfasst mehrere Vorgänge. In der Vergangenheit wurde die Verarbeitung neuer Daten meist in regelmäßigen Abständen durchgeführt.

In neueren Anwendungen kann dies in Echtzeit geschehen, wenn die Daten in den Quellsystemen anfallen.

Zunächst werden die Daten aus den Quellsystemen extrahiert. Ihre oft unterschiedliche Struktur kann in einem Zwischenspeicher, der Data Staging Area, vereinheitlicht werden. Die Phase wird auch als ETL-Prozess (Extract, Transform, Load) bezeichnet.

Die Daten werden nun in der Haupt-Datenbank gespeichert, dabei kommen Techniken der Langzeitarchivierung zum Einsatz. Sie sind dann in der Data Presentation Area verfügbar, die von den Datenquellen unabhängige Abfragen ermöglicht.

Das System kann direkt abgefragt werden oder Geschäftsbereiche und Anwendungen mit spezifisch aufbereiteten Data Marts versorgen. Die Abfragewerkzeuge, die auf das Hauptsystem und die Data Marts zugreifen, werden Data Access Tools genannt.

Data Warehousing: Anwendung und Herausforderungen

Ein Data Warehouse kann im Unternehmen zahlreiche Aufgaben erleichtern. So können Produktionsprozesse analysiert, Kosten und Ressourcennutzung ermittelt und Statistiken erstellt werden.

Häufig wird Data Mining verwendet, um aus den Rohdaten unter Anwendung von statistischen Methoden Muster und Trends zu extrahieren.

Bei einer defizitären Organisation können wertvolle Daten verloren gehen, etwa wenn neue Bestände nur in zeitlich langen Abständen eingespielt und Zwischenstände ignoriert werden. Auch ist die Erfassung einiger Aspekte der gesammelten Daten nicht trivial, etwa die Aktualität.

Eine Herausforderung stellt zudem der Datenschutz dar. Personenbezogene Daten dürfen nicht ohne Erlaubnis weiterverarbeitet werden, auch müssen sie auf Anfrage wieder gelöscht werden können. Anonymisierungstechniken können bei der Lösung dieser Probleme helfen.

News

Unsere Nachrichten auf Ihrer Website

Sie haben die Möglichkeit, mit unserem Webmaster-Nachrichten-Tool die Nachrichten von IT-Times.de kostenlos auf Ihrer Internetseite einzubauen.

Zugeschnitten auf Ihre Branche bzw. Ihr Interesse.

Folgen Sie IT-Times auf ...