Ich hatte in der Einführung das Modell eines Lagers herangezogen und dieses auf ein Data Warehouse übertragen, also ein Lager für Daten die hier zweckgebunden Eingelagert sind. Ich breche dieses Modell einmal ein wenig auf, nehme anstatt des DW eine Datenbank und sehe mir gespeicherten Daten im kaufmännischem Umfeld einmal genauer an. Bei mir bricht mein Hang zur Schublade durch und die erste Gruppierung ist die nach der Art der Daten, wie sie sich aus dem geschäftlichen Umfeld ergeben:
- Stammdaten,
- Bewegungsdaten und
- Bestandsdaten.
Stammdaten sind Daten die ein Informationsobjekt (engl.: Entity) oder Entität beschreiben. Diese Informationsobjekte können sowohl Personen (Geschäftspartner, Lieferer), dingliche Objekte (Anlage, Hausanschluss, Zähler) als auch immaterielle Art (Vertrag, Einzugsermächtigung) sein.
Bewegungsdaten sind die Daten, die sich aus der transaktionalen Beschreibung von Geschäftsvorfällen ergeben. Beispiel: Verbrauchsabrechnung eines Kunden.
Bestandsdaten stehen für die Quantitative Darstellung von Beständen, wie sie z. B. in einem Lager anfallen. Ich selber habe 40 Jahre in der Elektriztätswirtschaft gearbeitet, dort gibt es kein Warenlager für ausgehende Waren, wohl aber für Wartungs- und Instandhaltungsmaterial.
Eine zweite Schublade die bei mir aufgeht enthält eine Gruppierung nach der Art eines jeden Datenfeldes. Da gibt es:
- Beschreibende Felder
- Felder mit Werten
- Zeitangaben
Beschreibende Felder enthalten Informationen zu einer Transaktion. Meistens Texte, es kann sich aber auch um numerische Werte handeln wie sie sich z. B. aus Geoinformationen ergeben. Um einmal ein Beispiel zu nennen: Für einen Geschäftspartner wären das u. a. Nachname, Vorname, Straße, Wohnort usw. Die Frage nach dem wer, was, wo.
Felder mit Werten ergeben sich aus der Transaktion, Menge eines verkauften Objektes, Rechnungsbetrag usw. Werte beantworten die Frangen nach wiviel, wieoft.
Zeitpunkte setzen sich zusammen aus dem Datum und der Urzeit. Sie sind wichtig für die Frage nach dem Wann.
Datensatz
Ein wichtiger Aspekt: Daten stehen auf einer Datenbank nicht einfach wild durcheinander, sondern sind in Tabellen untergliedert, die wiederum eine Anzahl
Beschreiben einzelne Felder innerhalb eines Datensatzes, Gruppe zusammengehörender Daten.
SAP BW ist ein Baukastensystem, in dem Daten und Datenflüsse über Bausteine definiert werden, es gleicht in Teilen durchaus Klemmbausteinen, umgangssprachlich auch Legosteine genannt. Zentraler Baustein ist das InfoObject. Mit Hilfe dieser Elemente können Daten definiert und Datensätze beschrieben werden, über diese Elemente werden die Enden von Datenflüssen miteinander verbunden. Das InfoObject gestattet hierbei eine automatische Generierung des Code, was die Datenkonsitenz erhöht. Entsprechend kapselt ein InfoElement Informationen über
- Die Darstellung und Beschriftung innerhalb des Reportings
- Angaben zur Speicherung auf der Datenbank
- Konvertierung zu anderen InfoElementen
- Das Aggregationsverhalten bei der Verdichtung von Daten
Als beschreibendes Element können InfoElemente, genauer gesagt der Subtyp „Merkmal“ persistent Daten enthalten. Hierbei kann das Merkmal beschrieben werden.
Änderungen zur Vorversionen
Ein InfoObjekt ab SAP BW/4HANA muss einem InfoArea zugeordenet werden. InfoObject-Kataloge werden ab hier nicht mehr unterstützt. Die Funktion dieser InfoObject-Kataloge übernehmen vom System automatisch angelegte und verwaltete Unterordner (Kennzahl, Merkmal) in den InfoAreas.
Ab BW/4HANA 2.0 ist es nicht mehr zwingend notwendig, Daten über InfoObjecte zu beschreiben. Eine Definition auf Feldebene Datenbank ist möglich. Dieses hat den Vorteil, dass Views auf Datenbankebene ausserhalb des ABAP-Layers ablaufen können. Allerdings fehlen die Metainforationen, die im IO gekapselt sind.
Mehrfachverwendung
Kopie
Referenzierung
InfoObjecte können kopiert oder referenziert werden. Beim Kopieren erhält das neu entstandene InfoElement die aktuelle Beschreibung des ursprünglichen Elements, nicht aber dessen Daten. Beide, Quelle und Ziel, können unterschiedlich entwickelt werden, ist eine gemeinsame Änderung notwendig, so muss diese auf Beiden durchgeführt werden. Sollen sowohl das Ausgangs- als auch die Tochterelemente weiterhin eine Einheit bilden, bietet sich eine Referenzierung an. Hierbei besitzt das neue Element keine Eigenständige Definition, diese wird als Verweis auf das Referenzierende Element übernommen. Es entstehen hierbei isomorphe Elemente mit unterschiedlichen Inhalt.
Klammerung
Anlegen
InfoObjekte werden innerhalb einer InfoArea angelegt. Beim Anlegen werden die folgenden Daten eingegeben:
- Name – Technischer Name des InfoObjects. Dieser muss eindeutig sein und kann nach dem Anlegen nicht mehr geändert werden
- InfoObjekt-Typ
- BW-Projekt
- Paket
- InfoArea – Eindeutige Zuordnung zu einem InfoArea
- Beschreibung – Beschreibender Text für das InfoObject
- DatenTyp – gibt an, von welchen der Datentyp des InfoObjects ist.
Neben der Neuanlage eines InfoObjekts können diese aus bestehenden Definitionen kopiert oder referenziert werden
InfoObjekt Typen
Wie bei Legobausteinen können beim den InfoObjecte unterschiedliche Ausprägungen existieren:
- Merkmals-Infobject (Typ CHA)
- Kennzahlen-InfoObject
- Einheiten-InfoObjekt
- XXL-InfoObjekt
Merkmals-InfoObject
- Merkmale beschreiben Eigenschaften einer Entität.
- Merkmale können nicht aggregiert (z. B. Summiert) werden.
- Merkmale können Texte enthalten, die für die Darstellung im Reporting verwendet werden können
- Die Texte können spachabhängig sein
- Merkmale können Attribute enthalten. Diese Attribute können sowohl als Anzeige- als auch als Navigationsattribute ausgeprägt wein.
- Merkmale können Hierarchien enthalten
- Merkmale gelten als stammdatentragend, wenn sie Texte, Hierarchien und/oder Attribute enthalten, was zu einer persistenten Datenhaltung führt
- Merkmale können ausschließlich für die Verwendung als Attribut eingerichtet werden
Mögliche Datentypen
- CHAR – Alphanumerische Zeichenfolge mit einer Maximallänge von 1.333 Zeichen
- NUMC – Numerischer Text mit einer Maximallänge von 255 Zeichen
- DATS – Datum im Format JJJJMMTT
- TIMS – Zeit im Format HHMMSS
- SNUMC – Numerisches Merkmal mit Vorzeichen, Maximallänge von 255 Zeichen
Data Target
Stammdatentragende Merkmale können zu einem Datenziel gemacht werden. Hierduch wird eine direkte Beladung des Merkmals mit Attributen, Texten und Hierarchien aus einem Quellsystem möglich.
Authorization
Ein Merkmal kann als Authorisierungsobjekt im Ramen der Berechtigungen herangezogen werde.
Texte
- Kurztext, 20 Zeichen
- Mittellanger Text, 40 Zeichen
- Langtext, 60 Zeichen
- Extra langer Text, max. 1.333 Zeichen
Texte können spachabhängig sein,
Texte werden in einer speziellen Texttabelle auf der Datenbahn abgelegt.
Texte können zeitabhängig sein
Attribute
Attribute sind Informationen, die das Merkmal näher beschreiben.
- Reporting
- Anzeigeattribute
- Navigationsattribute
- Zeitabhängigkeit
- Zeitabhängig
- Zeitunabhängig
Hierarchien
Hierarchien stehen für einen rangmäßigen Zusammenhang zwischen mehreren Objekten. Beispiel:
- Produktgruppe
- Produkt
- Farbe
- Größe
- Farbe
- Produkt
Über Hierarchien lassen sich innerhalb des Reportings Daten zu Reportingebenen verdichten.
Properties
DISPLAY: Display gibt an, ob anstelle des Merkmals ein Text werdendet werden soll, wenn ja welcher. Die Einstellung kann in der Query überschieben werden.
INCLUDE INITAL VALUE IN SORT SEQUENZ: Legt fest, ob innerhalb einer Sortierung ein Initiales Feld sortiert und nicht an letzter Stelle angezeigt werden soll.
Geographisch
Geographische Darstellung von Daten ist ein Thema für sich.
NO GEOGRAPHICAL DATA: Merkmal kann nicht als Geomerkmal verwendet werden. Geographische Attribute (0LONGITUDE, 0ALTITUDE) zum InfoObjekt werden gelöscht
SHAPES: Es können Shapefiles (z. B. Ländergrenzen) verwendet werden, um das Merkmal auf einer Karte darzustellen. Bisher keine Unterstützung in einem Frondend.
POINT DATA. Die Geoattribute ermöglichen es, einen Ort auf einer Karte anzugeben. Wird von SAP Analytics Cloud unterstützt.
DERIVED POINT DATA FROM ATTRIBUTE: Es werden Geoattribute eines Geomerkmals vom Typ INCLUDE INITAL VALUE IN SORT SEQUENZ oder vom Typ SHAPES AND POINT DATA verwendet. Wird von SAP Analytics Cloud teilweise unterstützt.
SHAPES AND POINT DATA: Mischung aus DISPLY und INCLUDE INITAL VALUE IN SORT SEQUENZ. Wird von SAP Analytics Cloud unterstützt.
Query Filterwerte
Only Values in InfoProvider, Angabe, welche Filterwerte bei einer Selektion innerhalb einer Query anzegeigt werden.
Technische Merkmale
Es gibt in einem SAP BW-System eine Reihe von vorgegebenen Merkmalen für den technischen Ablauf. Hierzu gehören unter andern
- Requestnummern
Die technischen Merkmale liegen im Normalfall ausserhalb Betrachtungen.
Zeitmerkmale
Definition von Zeitmerkmalen Datum und Uhrzeit.
InfoObject-Kennzahlen
- Kennzahlen stellen numerische Werte innerhalb eines Datensatzes dar.
- Kennzahlen werden für Beträge, Mengen und Zahlen verwendet.
Datentypen
- Kennzahlentyp Betrag (AMO)
- CURR: Währungsfeld, abgelegt als DEC
- FLTP: Gleitpunktzahl mit 8 Byte Genauigkeit
- Kennzahlentyp Menge (QUA)
- QUAN: Mengenfeld, abgelegt als DEC,
- FLTP: Gleitpuktzahl mit 8 Byte Genauigkeit
- Kennzahlentyp Zahl (NUM)
- DEC: Rechen- oder Betragsfeld mit Komma und Vorzeichen
- FLTP: Gleitpunktzahl mit 8 Byte Genauigkeit
- Kennzahlentyp Integer (INT)
- INT4: 4-Byte Integer, ganze Zahlen mit Vorzeichen
- INT8: 8-Byte Integer, ganze Zahl
- Kennzahlentyp Datum (DAT)
- DATS: Datumsfeld (JJJJMMDD), abgelegt als Char(8)
- DEC: Rechen- oder Betragsfeld mit Komma und Vorzeichen
- Kennzeichentyp Zeit (TIM)
- TIMS: Zeitfeld (hhmmss), abgelegt als Char(6)
- DEC: Rechen- oder Betragsfeld mit Komma oder Vorzeichen
Datum und Zeit können sowohl auf Merkmalen als auch auf Kennzahlen auftauchen.
Aggregation
- Minimum (MIN)
- Maximum (MAX)
- Summation (SUM)
- Keine Aggregation (X)
- Es können Ausnahmeaggregationen definiert werden
Währung / Einheit
Es kann einem Betrag eine feste Währung zugewiesen werden. Wird eine Währung als fest definiert, so gilt dies Systemweit für diese Kennzahl. Alternativ hierzu kann auch eine variable Währung zugewiesen werden, hier können im Definitionsbereich unterschiedliche Währungen aufgenommen werden.
Sie können ein InfoObject angeben, das die Einheit der Kennzahl trägt. Für Mengen- oder Betragskennzahlen muss entweder dieses Feld gefüllt sein, oder es muss eine feste Währung oder Mengeneinheit hinterlegt sein.
Properties
HIGH PRECISION: Hierbei rechtnet der OLAP Prozessor ntern mit Fließkommazahlen, die 34 Stellen haben. Erhöht die Genauigkeit und Rundungsdifferenzen werden minimiert.
STOCK COVERAGE: dann können Sie in einer Query anzeigen, wie lange die vorhandene Menge eines bestimmten Bestandswerts den geplanten oder erwarteten Bedarf deckt.
NON-CUMULATIVE: Kennzahl wird zur Bestandskennzahl.
ATTRIBUTE ONLY: Die Kennzahl nicht eigenständig, sondern ausschließlich als Attribut zu einem Merkmal verwendet werden.
BI-Clients
Skalierung der Kennzahl beim Reporting, die Vorgabe kann in der Query überschrieben werden
Anzahl der Kommastellen im Reporting, die Vorgabe kann in der Query überschrieben werden
READ ACESS LOGGING (RAL)
Einheit
Eine Dimension macht aus dem numerischen Betrag einer Kennzahl einen betriebswirtschaftlich aussagefähigen Wert.
Kennzahlen enthalten einen rein numerischen, dimensionslosen Wert. Betriebswirtschaftlich interpretierbar wird dieser erst durch eine den Wert beschreibende Einheit, wie z. B. Stück, Volumeneinheiten, Gewicht. Hierdurch lassen sich unterschiedliche Einheiten innerhalb ihres Bereiches (Volumen, Menge, Gewicht …) umrechnen, z. B. pound in kg, Meilen in km, inch in cm. Dieses kann dann relevant sein, wenn übergreifend aus Staaten, die noch Imperiale und nicht das metrische Maßsystem verwenden, Daten mit in das Data Warehouse aufgenommen werden.
Eine wesentliche Rolle spielt die Einheit bei der Aggregation von Kennzahlen. Im Reporting spielen einzelne Werte eine untergeordnette Rolle, meist werden verdichtete (aggregierte) Kennzahlen verwendet. Jetzt ohne Gewähr der Vollständigkeit neben der Summation der Kennzahlen kommen auch noch Maximal- oder Minimalwerte in Frage.
XXL – InfoObjekt
Übergang zum Datamining?