Was ist ein Data Warehouse

Ich bleibe bei der Frage zunächst bei der Wikipedia und sehe mir einmal an, was mir dort geboten wird

Ein Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen

Andreas Bauer, Holger Günzel: Data-Warehouse-Systeme: Architektur, Entwicklung, Anwendung. dpunkt, 2013, ISBN 3-89864-785-4

A data warehouse is a copy of transaction data specifically structured for querying and reporting

Ralph Kimball, Mary Ross: The Data Warehouse Toolkit. The Complete Guide to Dimensional Modeling. Wiley, ISBN 0-471-20024-7

Ein Data Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf die zugrundeliegenden Datenquellen ermöglicht

Thomas Zeh: Data Warehousing als Organisationskonzept des Datenmanagements. Eine kritische Betrachtung der Data-Warehouse-Definition von Inmon. In: Informatik – Forschung und Entwicklung. 18, Nr. 1, 2003 

Es gibt keine einheitliche und allgemeingültige Definition eines Data Warehouses. Auch das Anwendungsspektrum ist nicht beschränkt auf Geschäftsdaten.

  • Bei einem DW handelt es sich um strukturierte Daten
  • Es handlt sich um eine von den transaktionalen Systemen getrennte persistente Datenmenge
  • Auf Data Warehouses werden im Normalfall keine Daten erfasst
  • Es handlt sich um eine themenorientierte Datensammlung
  • Zeitabhängigkeit der Daten auf einem DW

DW lohnt sich nicht, wenn nur ein System, eine Facility zu Betrachten ist.

Ich bin jetzt weder ein studierter WiWi noch ein Informatiker. Ich fasse deshalb das einmal aus meiner Sicht als Entwickler und Supporter zusammen, was mir in den Kopf kommt


Warum Data Warehousing

Auf der einen Seite ein sehr großer Aufwand an Hard- und Software, Einsatz von Manpower und Lizenzen.

Data Warehousing (DW) zu betreiben bedeutet einen nicht unerheblichen Aufand an Arbeitszeit, an technischer Infrastruktur und natürlich auch an Lizenzen. Es müssen zusätzliche Datenströme aufgebaut werden, die für die direkte Transaktion nicht notwendig sind.

  • Globale Sicht
  • Singlepoint of Truth (SPoT)
  • Datenquelle sowohl für EIS / FIS (Executive Information System / Führungsinformationssystem) als auch für technische Informationssysteme
  • Ein DW kann sowohl operative als auch strategische (dispositive) Daten enthalten
  • Abschluss / Audits
  • Controlling / Projektcontrolling

Globale Sicht / Single Point of Truth

Datenbasis mit einheitlicher und beschriebener Datenbasis. Zum Problem werden können, Kennzahlen, die zwar gleich benannt sind, hinter denen aber eine unterschiedliche Bildung steht. Problem sind unterschiedliche Bewertungskriterien in unterschiedlichen Systemen.


Inmon Building the Data Warehouse


Close Menu
error: Content is protected !!