Inhalt
Data Warehouse
Datenpool erstellen
Datengrab oder Informationspool? - Der Begriff Data Warehouse wurde vor allem durch den amerikanischen Berater William Inmon geprägt. Sein 1993 veröffentlichtes Buch "Building the Data Warehouse"gilt heute als Standardwerk.
Ein Data Warehouse (dt. Warenhaus) ist eine integrierte, strukturierte und historische Sammlung aller in einem Unternehmen oder Unternehmensbereich vorhandenen Daten. In diesen Datenpool fließen interne und externe Daten ein, die konsolidiert, verdichtet und analysiert werden. Hierzu zählen auch die Kenntnisse und Erfahrungen der Mitarbeiter.
Um umfangreiche Warehouses bzw. Datenbestände überhaupt "zugreifbar"zu halten, werden in der Praxis sogenannte (Data) Marts, d.h. abteilungs- bzw. anwenderspezifische Teilmengen ausgegliedert und bereitgehalten. Der Nutzen besteht vor allem in der Vielfalt der möglichen Auswertungen, bedingt aber auch eine strukturierte und zielorientierte Datenerfassung.
Allgemeine Data Warehouse-Architektur
Data Warehousing ist ein evolutionärer Prozess: Ein Data Warehouse kann man nicht kaufen. Man muss es bauen. Es gibt deshalb kein einfaches Standarddesign für ein Data Warehouse, sondern Größe und Aussehen eines Data Warehouses variieren gemäss der Unternehmensstruktur und den Anforderungen der Benutzer. Konzeption und Erstellung eines Datenkaufhauses kann zu einem langwierigen und teuren Prozess auswachsen.
Bei der Implementierung einer Data Warehouse-Lösung ist zu beachten, dass die für die Unternehmensführung notwendigen Informationen aus den verschiedenen betrieblichen Bereichen (z.B. Produktion, Vertrieb) oder organisationsexternen Quellen wie z.B. Nachrichten- oder Online-Diensten stammen.
Auf dieser operativen Ebene, können alltägliche Daten gespeichert und aktualisiert werden, d.h. neben dem nur Lesezugriff besteht auch die Möglichkeit, die Daten zu verändern. Entsprechend dem Data Warehouse-Grundgedanken sind diese Informationen zunächst zusammenzufügen und umzuformen, bevor sie transformiert, und schließlich im „Datenwarenhaus“gesammelt und aufbereitet werden.
Bedarfsgerechte Information
Das Data Warehouse versteht sich als eine Zentrale der Bereitstellung aller notwendigen nachgefragten Informationen, auf die hauptsächlich ein lesender Zugriff möglich ist. Wie in einem Warenhaus holt sich der Kunde nach seinem Bedarf und in Selbstbedienung die Ware Information aus den Regalen in seinen Warenkorb.
Die Regale sind nach Themengebieten geordnet, das Warenangebot ist kundenorientiert. In sogenannten Data Marts werden speziellen Nutzergruppen z.B. Außendienstlern, Daten zur Verfügung gestellt. Diese Daten sind konsistent mit den Daten im Data Warehouse und zusätzlich ist noch ein schreibender Zugriff darauf möglich.
Auf der Decision Support-Ebene können dann mit Hilfe von Data Mining und OLAP die Daten analysiert und ausgewertet werden.
Daten aktualisieren
Ein Data Warehouse wird in aller Regel als Nur-Lese-Datenbank konzipiert. Dabei können Anwender Informationen einsehen, mitunter manipulieren, aber sie können die Werte der Daten in der Datenbank nicht ändern. Die einzigen Aktualisierungen einer analytischen Datenbank finden gemäss ihrem vorab definierten Zeitplan statt.
Die Häufigkeit, mit der die Daten aktualisiert werden, richtet sich nach den individuellen Anforderungen des Unternehmens. Für wochen- oder monatsgenaue Daten reicht eine Übernahme in Zeiten geringer Systembelastung (z.B. an Wochenenden). Werden tagesaktuelle Daten benötigt, erfolgt der Transfer in der Regel nachts.
Gründe für den Bau eines Data Warehouse
In einem Unternehmen spricht vieles dafür, sich ein Data Warehouse einzurichten. Die Menge der vorhandenen Daten ist groß, aber der Nutzen, dem man daraus zieht, ist meist noch sehr klein. Es kostet heute unter Umständen mehr, die in den verschiedenen Systemen gehaltenen Daten zu warten und zu pflegen, als man durch Analyse dieser Daten an Nutzen gewinnt.
Darin steckt die erste treibende Kraft, ein Data Warehouse aufzubauen. Data Warehousing sammelt alle Unternehmensdaten und stellt sie in einem fachlich orientierten Behälter allen zur Verfügung, die an den Unternehmensprozessen beteiligt sind.
Die Zahl der Mitarbeiter, die Entscheidungen zu treffen haben, ist heute wesentlich gewachsen gegenüber dem Nutzerkreis der frühen Führungsinformationssystemen. Das ist der zweite Grund ein Data Warehouse aufzubauen.
Ein dritter Grund ist das direkte Ansprechen des Kunden durch die neuen Medien wie z.B. Internet. Die Menge an elektronischem Kundenkontakt übersteigt in Qualität und Quantität alles, was bisher an Daten in internen Quellen vorhanden ist.
Anforderungen an ein wirksames Data Warehouse
Ein wirksames Data Warehouse muss folgende Anforderungen erfüllen:
- Es eröffnet die Möglichkeit, auf Daten aus unterschiedlichen Quellen zuzugreifen, die ursprünglich in beliebigen Datenbankformaten und auf beliebigen physikalischen Technologieplattformen vorliegen.
- Es kann jede Art von Datenmaterial behandeln, so z.B. strukturierte relationale Daten, unstrukturierte Texte, multidimensionale Daten, Multimedia-Material oder Daten in Ton- und Videoform.
Für den Endbenutzer sind die Daten so aufbereitet, dass eine wirkungsvolle Entscheidungsunterstützung auf der Basis intensiver Informationsanalyse gewährleistet ist. In der Regel werden dazu zusätzliche Applikationen eingesetzt.
Links und Literatur
- Data Warehouse – Basis für Management-Informationssysteme: http://www.talknet.de/~frank.schumacher/data.htm
http://www.symposion.de/wissen/wm_18.htm
http://www.cosy.sbg.ac.at/~fwilhelm/Referate/Dwh_WW/Index.html


