Was ist ein Data Warehouse
Ich bleibe bei der Frage zunächst bei der Wikipedia und sehe mir einmal an, was mir dort geboten wird
Ein Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen
Andreas Bauer, Holger Günzel: Data-Warehouse-Systeme: Architektur, Entwicklung, Anwendung. dpunkt, 2013, ISBN 3-89864-785-4
A data warehouse is a copy of transaction data specifically structured for querying and reporting
Ralph Kimball, Mary Ross: The Data Warehouse Toolkit. The Complete Guide to Dimensional Modeling. Wiley, ISBN 0-471-20024-7
Ein Data Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf die zugrundeliegenden Datenquellen ermöglicht
Thomas Zeh: Data Warehousing als Organisationskonzept des Datenmanagements. Eine kritische Betrachtung der Data-Warehouse-Definition von Inmon. In: Informatik – Forschung und Entwicklung. 18, Nr. 1, 2003
Es gibt keine einheitliche und allgemeingültige Definition eines Data Warehouses. Auch das Anwendungsspektrum ist nicht beschränkt auf Geschäftsdaten.
- Bei einem DW handelt es sich um strukturierte Daten
- Es handlt sich um eine von den transaktionalen Systemen getrennte persistente Datenmenge
- Auf Data Warehouses werden im Normalfall keine Daten erfasst
- Es handlt sich um eine themenorientierte Datensammlung
- Zeitabhängigkeit der Daten auf einem DW
DW lohnt sich nicht, wenn nur ein System, eine Facility zu Betrachten ist.
Ich bin jetzt weder ein studierter WiWi noch ein Informatiker. Ich fasse deshalb das einmal aus meiner Sicht als Entwickler und Supporter zusammen, was mir in den Kopf kommt
Warum Data Warehousing
Auf der einen Seite ein sehr großer Aufwand an Hard- und Software, Einsatz von Manpower und Lizenzen.
Data Warehousing (DW) zu betreiben bedeutet einen nicht unerheblichen Aufand an Arbeitszeit, an technischer Infrastruktur und natürlich auch an Lizenzen. Es müssen zusätzliche Datenströme aufgebaut werden, die für die direkte Transaktion nicht notwendig sind.
- Globale Sicht
- Singlepoint of Truth (SPoT)
- Datenquelle sowohl für EIS / FIS (Executive Information System / Führungsinformationssystem) als auch für technische Informationssysteme
- Ein DW kann sowohl operative als auch strategische (dispositive) Daten enthalten
- Abschluss / Audits
- Controlling / Projektcontrolling
Globale Sicht / Single Point of Truth
Datenbasis mit einheitlicher und beschriebener Datenbasis. Zum Problem werden können, Kennzahlen, die zwar gleich benannt sind, hinter denen aber eine unterschiedliche Bildung steht. Problem sind unterschiedliche Bewertungskriterien in unterschiedlichen Systemen.
Inmon Building the Data Warehouse