Data Warehouse-Design: Star-Schema für ERP- und E-Commerce-Analysen

Ihre ERP-Datenbank ist für Transaktionen optimiert – zum Eingeben von Bestellungen, zum Aktualisieren des Lagerbestands und zum Verarbeiten von Zahlungen. Ihre E-Commerce-Plattform ist für die Bereitstellung von Produktseiten und die Abwicklung von Checkouts optimiert. Beide sind nicht für die Beantwortung der Fragen optimiert, die Geschäftsentscheidungen beeinflussen: Welche Produktkategorien sind nach Retouren am profitabelsten? Welche Kundensegmente haben einen wachsenden Lifetime Value? Wo gibt es Engpässe in unserer Lieferkette?

Diese Lücke füllt ein Data Warehouse. Und das Sternschema ist das Entwurfsmuster, das analytische Abfragen schnell, intuitiv und wartbar macht.

Wichtige Erkenntnisse

– Das Star-Schema trennt Geschäftsmetriken (Fakten) vom beschreibenden Kontext (Dimensionen) und macht Abfragen intuitiv und schnell – ERP- und E-Commerce-Analysen benötigen in der Regel vier bis sechs Faktentabellen und acht bis zwölf Dimensionstabellen, um Kerngeschäftsfragen abzudecken – ETL-Pipelines sollten inkrementelles Laden mit sich langsam ändernden Dimensionen verwenden, um historische Analysen durchzuführen, ohne alle Daten erneut zu verarbeiten

Ein gut gestaltetes Sternschema reduziert die Abfragekomplexität um 60 bis 80 Prozent im Vergleich zur direkten Abfrage normalisierter Betriebsdatenbanken

Warum nicht direkt das ERP abfragen?

Bevor sie in ein separates Data Warehouse investieren, versuchen viele Unternehmen, analytische Abfragen für ihre Betriebsdatenbank durchzuführen. Dies scheitert aus drei Gründen.

Leistung. Analytische Abfragen scannen Millionen von Zeilen, berechnen Aggregationen und verknüpfen viele Tabellen. Wenn diese mit der Produktionsdatenbank ausgeführt werden, verlangsamt sich das ERP für jeden Benutzer. Ein Bericht, der Bestelldaten von sechs Monaten scannt, kann Tabellen sperren und die Checkout-Leistung in Ihrem Shopify-Shop beeinträchtigen.

Komplexität. Betriebsdatenbanken sind normalisiert – so konzipiert, dass Datenredundanz minimiert wird. Eine einfache Frage wie „Gesamtumsatz nach Produktkategorie und Monat“ erfordert möglicherweise die Verknüpfung von acht Tabellen in der PostgreSQL-Datenbank von Odoo. In einem Sternschema verknüpft dieselbe Abfrage zwei Tabellen.

Verlauf. Betriebssysteme überschreiben Daten. Wenn ein Kunde seine Adresse ändert, ist die alte Adresse verloren. Wenn ein Produkt neu kategorisiert wird, ändern sich die historischen Berichte rückwirkend. Ein Data Warehouse bewahrt den Verlauf durch sich langsam ändernde Dimensionen.

Multi-Source. Mittelständische Unternehmen betreiben in der Regel drei bis sieben Systeme, die Geschäftsdaten enthalten. Das Data Warehouse konsolidiert sie alle. Unser Leitfaden zu ETL-Pipelines für ERP-Daten behandelt das Extrahieren und Laden im Detail.

Grundlagen des Star-Schemas

Ein Sternschema organisiert Daten in zwei Arten von Tabellen: Faktentabellen und Dimensionstabellen. Faktentabellen befinden sich in der Mitte (dem Körper des Sterns) und Dimensionstabellen umgeben sie (die Spitzen des Sterns).

Faktentabellen

Faktentabellen speichern messbare Geschäftsereignisse – Dinge, die passiert sind. Jede Zeile stellt ein Ereignis in der niedrigsten aussagekräftigen Körnung dar.

Eigenschaften:

Enthalten numerische Maße (Menge, Menge, Dauer, Anzahl)
Fremdschlüssel für Dimensionstabellen enthalten – Sind in der Regel die größten Tische im Lager
Wachsen Sie kontinuierlich, wenn neue Ereignisse eintreten
Sollte die feinste Körnung aufweisen, die geschäftliche Fragen unterstützt

Dimensionstabellen

Dimensionstabellen speichern beschreibenden Kontext – das Wer, Was, Wo, Wann und Wie von Geschäftsereignissen.

Eigenschaften:

Textattribute und Hierarchien enthalten
Sind relativ klein (Tausende bis Millionen Zeilen, nicht Milliarden)
Verändere dich langsam im Laufe der Zeit – Zur Vereinfachung der Abfrage denormalisiert
Stellen Sie Beschriftungen, Filter und Gruppierungen für Berichte bereit

Die Sternform

                    Dim: Customer
                         |
    Dim: Product ---  Fact: Sales  --- Dim: Time
                         |
                    Dim: Location

Eine Abfrage wie „Gesamtumsatz nach Produktkategorie, nach Quartal und nach Region“ verknüpft die Verkaufsfaktentabelle mit dreidimensionalen Tabellen. Keine Unterabfragen, keine komplexen verschachtelten Verknüpfungen – nur einfache Sternverknüpfungen.

Entwerfen von Faktentabellen für ERP und E-Commerce

Ein typisches mittelständisches Unternehmen, das Odoo ERP und Shopify eCommerce betreibt, benötigt vier bis sechs Faktentabellen, um die wichtigsten analytischen Anwendungsfälle abzudecken.

Fakt: Verkäufe

Die Verkaufsfaktentabelle ist der Grundstein. Jede Zeile stellt einen Einzelposten in einem Kundenauftrag dar.

Spalte	Geben Sie	ein Beschreibung
sale_key	BIGINT	Ersatzschlüssel
date_key	INT	FK zu Dimmen: Zeit
customer_key	INT	FK zu Dimmen: Kunde
Produktschlüssel	INT	FK zu Dimmen: Produkt
location_key	INT	FK to Dim: Standort
Kanalschlüssel	INT	FK zum Dimmen: Kanal
salesperson_key	INT	FK zu Dim: Mitarbeiter
Menge	DEZIMAL	Verkaufte Einheiten
Einheitspreis	DEZIMAL	Preis pro Einheit
discount_amount	DEZIMAL	Rabatt angewendet
Steuerbetrag	DEZIMAL	Steuer erhoben
Nettobetrag	DEZIMAL	Umsatz nach Rabatt, vor Steuern
cost_amount	DEZIMAL	Kosten der verkauften Waren
gross_margin	DEZIMAL	Nettobetrag minus Kostenbetrag

Getreide: Eine Zeile pro Bestellposition und Tag.

Fakt: Inventar

Verfolgt die Lagerbestände als regelmäßige Momentaufnahmen und nicht als Ereignisse.

Spalte	Geben Sie	ein Beschreibung
inventory_key	BIGINT	Ersatzschlüssel
date_key	INT	FK to Dim: Zeit (Snapshot-Datum)
Produktschlüssel	INT	FK zu Dimmen: Produkt
Lagerschlüssel	INT	FK zu Dimmen: Lager
Menge_auf_der_Hand	DEZIMAL	Aktueller Lagerbestand
Menge_reserved	DEZIMAL	Den Aufträgen zugeordnet
Menge_verfügbar	DEZIMAL	Vorrätig minus reserviert
reorder_point	DEZIMAL	Minimum vor Nachbestellung
stock_value	DEZIMAL	Menge mal Stückkosten

Getreide: Eine Reihe pro Produkt, pro Lager und Tag.

Fakt: Produktion

Für produzierende Unternehmen verfolgt die Produktionsfaktur Arbeitsaufträge.

Spalte	Geben Sie	ein Beschreibung
Produktionsschlüssel	BIGINT	Ersatzschlüssel
date_key	INT	FK zu Dimmen: Zeit
Produktschlüssel	INT	FK zu Dimmen: Produkt
workcenter_key	INT	FK to Dim: Workcenter
geplante_menge	DEZIMAL	Zielausgabe
tatsächliche_Menge	DEZIMAL	Tatsächliche Leistung
scrap_quantity	DEZIMAL	Abfall
geplante_Dauer_Stunden	DEZIMAL	Erwartete Zeit
tatsächliche_Dauer_Stunden	DEZIMAL	Tatsächliche Zeit
yield_rate	DEZIMAL	Ist-/Planmenge

Getreide: Eine Zeile pro Arbeitsauftrag, pro Produkt und Tag.

Zusätzliche Faktentabellen

Fakt: Käufe --- Beschaffungsausgaben nach Anbieter, Produkt und Zeit.
Fakt: Support-Tickets --- Ticketvolumen, Reaktionszeit, Lösungszeit nach Agent, Kunde und Kategorie.
Fakt: Web-Traffic --- Seitenaufrufe, Sitzungen, Conversions nach Seite, Quelle und Kampagne. Nützlich für Marketing-Attributionsanalyse.

Dimensionstabellen entwerfen

Dimensionstabellen stellen den Kontext bereit, der Faktentabellennummern eine Bedeutung verleiht. Das Schlüsselprinzip ist die Denormalisierung – die Speicherung redundanter Daten zur Vereinfachung von Abfragen.

Dim: Zeit

Die Zeitdimension ist in jedem Sternschema vorhanden. Berechnen Sie Kalenderattribute vorab, um komplexe Datumsfunktionen in Abfragen zu vermeiden.

Spalte	Beispiel	Zweck
date_key	20260315	Ganzzahliger Schlüssel (JJJJMMTT)
vollständiges_Datum	15.03.2026	Datumswert
day_of_week	Sonntag	Gruppierung
day_of_month	15	Gruppierung
Woche_des_Jahres	11	Gruppierung
Monatsname	März	Gruppierung
Monatsnummer	3	Sortieren
Viertel	Q1	Gruppierung
Jahr	2026	Gruppierung
geschäftsquartal	FQ4	Ausrichtung des Geschäftsjahres
geschäftsjahr	GJ2026	Ausrichtung des Geschäftsjahres
is_weekend	WAHR	Filtern
is_holiday	FALSCH	Filtern

Dim: Kunde

Denormalisieren Sie Kundenattribute aus den CRM-, Buchhaltungs- und E-Commerce-Systemen in einer einzigen Dimension.

Spalte	Beschreibung
customer_key	Ersatzschlüssel
customer_id	Natürlicher Schlüssel (Odoo-ID)
Kundenname	Vollständiger Name
Kunden-E-Mail	E-Mail-Adresse
Kundensegment	Unternehmen, KMU, Einzelperson
Industrie	Fertigung, Einzelhandel, Dienstleistungen
Land	Ländername
Region	Geografische Region
Stadt	Stadt
Acquisition_Source	Organisch, bezahlt, Empfehlung
Erwerbsdatum	Erstkaufdatum
rfm_segment	Champion, loyal, gefährdet
lifetime_value_tier	Hoch, Mittel, Niedrig

Die Spalten rfm_segment und lifetime_value_tier sind berechnete Felder, die aus der RFM-Analyse abgeleitet und regelmäßig von der ETL-Pipeline aktualisiert werden.

Dim: Produkt

Spalte	Beschreibung
Produktschlüssel	Ersatzschlüssel
Produkt_ID	Natürlicher Schlüssel
Produktname	Anzeigename
Artikelnummer	Lagereinheit
Kategorie_l1	Kategorie der obersten Ebene
Kategorie_l2	Unterkategorie
Kategorie_l3	Unter-Unterkategorie
Marke	Markenname
Unit_cost	Aktuelle Standardkosten
list_price	Aktueller Listenpreis
Gewicht	Versandgewicht
ist_aktiv	Derzeit zum Verkauf

Langsam ändernde Dimensionen

Was soll das Data Warehouse tun, wenn ein Kunde von New York nach London zieht? Die Antwort hängt von der Geschäftsfrage ab.

Typ 1: Überschreiben

Ersetzen Sie den alten Wert durch den neuen Wert. Die Stadt des Kunden wird zu London, und alle historischen Bestellungen zeigen jetzt London. Verwenden Sie diese Option, wenn die historische Genauigkeit des Attributs keine Rolle spielt.

Typ 2: Neue Zeile hinzufügen

Erstellen Sie eine neue Zeile für den Kunden mit der neuen Stadt, einem Gültigkeitsdatum und einem Ablaufdatum. Historische Aufträge verweisen immer noch auf die alte Reihe (New York) und neue Aufträge verweisen auf die neue Reihe (London). Dies ist der gebräuchlichste Ansatz für Attribute, die sich auf die Analyse auswirken – Kundensegment, Mitarbeiterabteilung, Produktkategorie.

customer_key	customer_id	Stadt	Wirksamkeitsdatum	Ablaufdatum	is_current
1001	CUST-042	New York	15.01.2024	28.02.2026	FALSCH
1002	CUST-042	London	01.03.2026	9999-12-31	WAHR

Typ 3: Neue Spalte hinzufügen

Speichern Sie alte und neue Werte in separaten Spalten. Nützlich, wenn Sie einen Vorher-Nachher-Vergleich durchführen müssen, aber keinen vollständigen Verlauf benötigen. In der Praxis seltener.

Verwenden Sie für mittelständische Unternehmen Typ 2 für Kundensegment, Mitarbeiterabteilung, Produktkategorie und geografische Attribute. Verwenden Sie für alles andere Typ 1, um das Lager einfach zu halten.

ETL-Entwurfsmuster

Der ETL-Prozess (Extract, Transform, Load) verschiebt Daten aus Quellsystemen in das Warehouse. Zu den Entwurfsmustern, die sich gut für ERP- und E-Commerce-Daten eignen, gehören die folgenden.

Inkrementelles Laden

Anstatt alle Daten bei jedem Lauf neu zu laden, verfolgen Sie den Zeitstempel des letzten erfolgreich geladenen Vorgangs und verarbeiten Sie nur die seitdem geänderten Datensätze. Odoos write_date-Feld und Shopifys updated_at-Parameter machen dies einfach.

1. Query source: SELECT * FROM sale_order_line WHERE write_date > last_load_timestamp
2. Transform: Map source fields to warehouse columns, look up dimension keys
3. Load: INSERT new rows, UPDATE changed rows (upsert)
4. Update: Set last_load_timestamp to current run start time

Ersatzschlüsselverwaltung

Dimensionstabellen verwenden Ersatzschlüssel (automatisch inkrementierende Ganzzahlen) anstelle natürlicher Schlüssel (Odoo-IDs, Shopify-IDs). Dadurch wird das Warehouse von den Schlüsselformaten des Quellsystems entkoppelt und die Konsolidierung mehrerer Quellen durchgeführt, wenn verschiedene Systeme widersprüchliche ID-Schemata haben.

Verspätete Dimensionen

Manchmal kommt ein Faktendatensatz vor dem entsprechenden Dimensionsdatensatz an – eine Bestellung verweist auf einen neuen Kunden, der noch nicht synchronisiert wurde. Behandeln Sie dies mit einer Platzhalter-Dimensionszeile, die aktualisiert wird, wenn der vollständige Dimensionsdatensatz eintrifft.

Aktualisierungsplanung

Datentyp	Aktualisierungshäufigkeit	Begründung
Verkaufstransaktionen	Alle 15-60 Minuten	Umsatzverfolgung nahezu in Echtzeit
Inventar-Snapshots	Alle 4-6 Stunden	Genauigkeit vs. Datenbanklast ausgleichen
Kundenmaße	Täglich	Änderungen sind selten
Produktabmessungen	Täglich	Änderungen sind selten
Finanzdaten	Täglich (nach Handelsschluss)	Hängt von den Buchhaltungsabläufen ab
Marketingdaten	Alle 1-4 Stunden	Kampagnenoptimierung benötigt aktuellere Daten

Informationen zu Echtzeitanforderungen finden Sie in unserem Leitfaden zu Streaming-Analysen.

Optimierung der Abfrageleistung

Ein gut gestaltetes Sternschema ist aufgrund seiner einfachen Verknüpfungsmuster bereits erfolgreich. Zu den weiteren Optimierungen gehören die folgenden.

Indizes. Erstellen Sie Indizes für alle Dimensionsfremdschlüssel in Faktentabellen und für häufig gefilterte Dimensionsattribute (Datumsbereiche, Kundensegmente, Produktkategorien).

Materialisierte Ansichten. Häufige Abfragen vorab aggregieren: Tagesumsatz nach Produktkategorie, wöchentliche Lagerbestände nach Lager, monatliche Kundenakquise nach Kanal. Aktualisieren Sie materialisierte Ansichten nach jedem ETL-Ladevorgang.

Partitionierung. Partitionieren Sie große Faktentabellen nach Datum (monatlich oder vierteljährlich). Abfragen, die nach Datumsbereich filtern, scannen nur die relevanten Partitionen.

Spaltenstatistiken. Halten Sie die PostgreSQL-Statistiken nach Massenladevorgängen mit ANALYZE auf dem neuesten Stand, damit der Abfrageplaner optimale Entscheidungen treffen kann.

Diese Optimierungen unterstützen das Self-Service-BI-Erlebnis, bei dem Geschäftsbenutzer Ad-hoc-Abfragen ohne Leistungsbedenken ausführen.

Häufig gestellte Fragen

Wie groß muss das Unternehmen sein, um ein Data Warehouse zu rechtfertigen?

Es gibt keine Mindestgröße, aber die Investition lohnt sich, wenn Sie über mehrere Datenquellen verfügen, die zur Analyse kombiniert werden müssen, wenn betriebliche Datenbankabfragen Produktionssysteme verlangsamen oder wenn Sie mehr als 10 Stunden pro Woche mit der manuellen Datenerfassung und Berichterstellung verbringen. Die meisten Unternehmen mit 30 oder mehr Mitarbeitern und mindestens zwei Systemen (ERP plus eCommerce) profitieren von einem Lager.

Sollten wir ein Cloud Data Warehouse wie Snowflake oder BigQuery verwenden?

Für mittelständische Unternehmen bewältigt PostgreSQL die meisten analytischen Arbeitslasten gut und kostet deutlich weniger. Cloud-Warehouses wie Snowflake werden attraktiv, wenn Ihre Daten 1 TB überschreiten, wenn Sie zur Kostenoptimierung Rechenleistung vom Speicher trennen müssen oder wenn Sie komplexe Anforderungen an den Datenaustausch zwischen Organisationen haben. Beginnen Sie mit PostgreSQL und migrieren Sie, wenn Sie damit nicht mehr Schritt halten.

Wie lange dauert der Aufbau eines Data Warehouse?

Ein Minimum Viable Warehouse mit einer Faktentabelle (Verkäufe), vier Dimensionstabellen und einer ETL-Pipeline, die Odoo und Shopify verbindet, dauert für ein erfahrenes Team vier bis acht Wochen. Das Hinzufügen von Faktentabellen, das langsame Ändern von Dimensionen und die Überwachung der Datenqualität dauern pro Faktentabelle weitere vier bis acht Wochen. Planen Sie drei bis sechs Monate für ein umfassendes Lager ein, das alle wichtigen Geschäftsbereiche abdeckt.

Was kommt als nächstes?

Ein gut gestaltetes Sternschema ist die Grundlage für jede Analysefunktion – von Self-Service-Dashboards über Vorhersagemodelle bis hin zu eingebetteten Analysen. Es ist Teil einer umfassenderen BI-Strategie, die die Art und Weise verändert, wie Ihr Unternehmen Entscheidungen trifft.

ECOSIRE erstellt Data Warehouses und Analysepipelines für Unternehmen, die Odoo, Shopify und GoHighLevel betreiben. Unser Odoo-Beratungsunternehmen-Team entwirft Lagerschemata, die auf Ihr Geschäftsmodell zugeschnitten sind, und unsere OpenClaw-KI-Dienste legen darüber hinaus prädiktive Analysen auf.

Kontaktieren Sie uns, um Ihre Data-Warehouse-Architektur zu besprechen.

Veröffentlicht von ECOSIRE --- unterstützt Unternehmen bei der Skalierung mit KI-gestützten Lösungen in Odoo ERP, Shopify eCommerce und OpenClaw AI.

Diese Lücke füllt ein Data Warehouse. Und das Sternschema ist das Entwurfsmuster, das analytische Abfragen schnell, intuitiv und wartbar macht.

Wichtige Erkenntnisse

– Das Star-Schema trennt Geschäftsmetriken (Fakten) vom beschreibenden Kontext (Dimensionen) und macht Abfragen intuitiv und schnell – ERP- und E-Commerce-Analysen benötigen in der Regel vier bis sechs Faktentabellen und acht bis zwölf Dimensionstabellen, um Kerngeschäftsfragen abzudecken – ETL-Pipelines sollten inkrementelles Laden mit sich langsam ändernden Dimensionen verwenden, um historische Analysen durchzuführen, ohne alle Daten erneut zu verarbeiten

Ein gut gestaltetes Sternschema reduziert die Abfragekomplexität um 60 bis 80 Prozent im Vergleich zur direkten Abfrage normalisierter Betriebsdatenbanken

Warum nicht direkt das ERP abfragen?

Bevor sie in ein separates Data Warehouse investieren, versuchen viele Unternehmen, analytische Abfragen für ihre Betriebsdatenbank durchzuführen. Dies scheitert aus drei Gründen.

Grundlagen des Star-Schemas

Faktentabellen

Faktentabellen speichern messbare Geschäftsereignisse – Dinge, die passiert sind. Jede Zeile stellt ein Ereignis in der niedrigsten aussagekräftigen Körnung dar.

Eigenschaften:

Enthalten numerische Maße (Menge, Menge, Dauer, Anzahl)
Fremdschlüssel für Dimensionstabellen enthalten – Sind in der Regel die größten Tische im Lager
Wachsen Sie kontinuierlich, wenn neue Ereignisse eintreten
Sollte die feinste Körnung aufweisen, die geschäftliche Fragen unterstützt

Dimensionstabellen

Dimensionstabellen speichern beschreibenden Kontext – das Wer, Was, Wo, Wann und Wie von Geschäftsereignissen.

Eigenschaften:

Textattribute und Hierarchien enthalten
Sind relativ klein (Tausende bis Millionen Zeilen, nicht Milliarden)
Verändere dich langsam im Laufe der Zeit – Zur Vereinfachung der Abfrage denormalisiert
Stellen Sie Beschriftungen, Filter und Gruppierungen für Berichte bereit

Die Sternform

                    Dim: Customer
                         |
    Dim: Product ---  Fact: Sales  --- Dim: Time
                         |
                    Dim: Location

Entwerfen von Faktentabellen für ERP und E-Commerce

Ein typisches mittelständisches Unternehmen, das Odoo ERP und Shopify eCommerce betreibt, benötigt vier bis sechs Faktentabellen, um die wichtigsten analytischen Anwendungsfälle abzudecken.

Fakt: Verkäufe

Die Verkaufsfaktentabelle ist der Grundstein. Jede Zeile stellt einen Einzelposten in einem Kundenauftrag dar.

Spalte	Geben Sie	ein Beschreibung
sale_key	BIGINT	Ersatzschlüssel
date_key	INT	FK zu Dimmen: Zeit
customer_key	INT	FK zu Dimmen: Kunde
Produktschlüssel	INT	FK zu Dimmen: Produkt
location_key	INT	FK to Dim: Standort
Kanalschlüssel	INT	FK zum Dimmen: Kanal
salesperson_key	INT	FK zu Dim: Mitarbeiter
Menge	DEZIMAL	Verkaufte Einheiten
Einheitspreis	DEZIMAL	Preis pro Einheit
discount_amount	DEZIMAL	Rabatt angewendet
Steuerbetrag	DEZIMAL	Steuer erhoben
Nettobetrag	DEZIMAL	Umsatz nach Rabatt, vor Steuern
cost_amount	DEZIMAL	Kosten der verkauften Waren
gross_margin	DEZIMAL	Nettobetrag minus Kostenbetrag

Getreide: Eine Zeile pro Bestellposition und Tag.

Fakt: Inventar

Verfolgt die Lagerbestände als regelmäßige Momentaufnahmen und nicht als Ereignisse.

Spalte	Geben Sie	ein Beschreibung
inventory_key	BIGINT	Ersatzschlüssel
date_key	INT	FK to Dim: Zeit (Snapshot-Datum)
Produktschlüssel	INT	FK zu Dimmen: Produkt
Lagerschlüssel	INT	FK zu Dimmen: Lager
Menge_auf_der_Hand	DEZIMAL	Aktueller Lagerbestand
Menge_reserved	DEZIMAL	Den Aufträgen zugeordnet
Menge_verfügbar	DEZIMAL	Vorrätig minus reserviert
reorder_point	DEZIMAL	Minimum vor Nachbestellung
stock_value	DEZIMAL	Menge mal Stückkosten

Getreide: Eine Reihe pro Produkt, pro Lager und Tag.

Fakt: Produktion

Für produzierende Unternehmen verfolgt die Produktionsfaktur Arbeitsaufträge.

Spalte	Geben Sie	ein Beschreibung
Produktionsschlüssel	BIGINT	Ersatzschlüssel
date_key	INT	FK zu Dimmen: Zeit
Produktschlüssel	INT	FK zu Dimmen: Produkt
workcenter_key	INT	FK to Dim: Workcenter
geplante_menge	DEZIMAL	Zielausgabe
tatsächliche_Menge	DEZIMAL	Tatsächliche Leistung
scrap_quantity	DEZIMAL	Abfall
geplante_Dauer_Stunden	DEZIMAL	Erwartete Zeit
tatsächliche_Dauer_Stunden	DEZIMAL	Tatsächliche Zeit
yield_rate	DEZIMAL	Ist-/Planmenge

Getreide: Eine Zeile pro Arbeitsauftrag, pro Produkt und Tag.

Zusätzliche Faktentabellen

Fakt: Käufe --- Beschaffungsausgaben nach Anbieter, Produkt und Zeit.
Fakt: Support-Tickets --- Ticketvolumen, Reaktionszeit, Lösungszeit nach Agent, Kunde und Kategorie.
Fakt: Web-Traffic --- Seitenaufrufe, Sitzungen, Conversions nach Seite, Quelle und Kampagne. Nützlich für Marketing-Attributionsanalyse.

Dimensionstabellen entwerfen

Dim: Zeit

Die Zeitdimension ist in jedem Sternschema vorhanden. Berechnen Sie Kalenderattribute vorab, um komplexe Datumsfunktionen in Abfragen zu vermeiden.

Spalte	Beispiel	Zweck
date_key	20260315	Ganzzahliger Schlüssel (JJJJMMTT)
vollständiges_Datum	15.03.2026	Datumswert
day_of_week	Sonntag	Gruppierung
day_of_month	15	Gruppierung
Woche_des_Jahres	11	Gruppierung
Monatsname	März	Gruppierung
Monatsnummer	3	Sortieren
Viertel	Q1	Gruppierung
Jahr	2026	Gruppierung
geschäftsquartal	FQ4	Ausrichtung des Geschäftsjahres
geschäftsjahr	GJ2026	Ausrichtung des Geschäftsjahres
is_weekend	WAHR	Filtern
is_holiday	FALSCH	Filtern

Dim: Kunde

Denormalisieren Sie Kundenattribute aus den CRM-, Buchhaltungs- und E-Commerce-Systemen in einer einzigen Dimension.

Spalte	Beschreibung
customer_key	Ersatzschlüssel
customer_id	Natürlicher Schlüssel (Odoo-ID)
Kundenname	Vollständiger Name
Kunden-E-Mail	E-Mail-Adresse
Kundensegment	Unternehmen, KMU, Einzelperson
Industrie	Fertigung, Einzelhandel, Dienstleistungen
Land	Ländername
Region	Geografische Region
Stadt	Stadt
Acquisition_Source	Organisch, bezahlt, Empfehlung
Erwerbsdatum	Erstkaufdatum
rfm_segment	Champion, loyal, gefährdet
lifetime_value_tier	Hoch, Mittel, Niedrig

Die Spalten rfm_segment und lifetime_value_tier sind berechnete Felder, die aus der RFM-Analyse abgeleitet und regelmäßig von der ETL-Pipeline aktualisiert werden.

Dim: Produkt

Spalte	Beschreibung
Produktschlüssel	Ersatzschlüssel
Produkt_ID	Natürlicher Schlüssel
Produktname	Anzeigename
Artikelnummer	Lagereinheit
Kategorie_l1	Kategorie der obersten Ebene
Kategorie_l2	Unterkategorie
Kategorie_l3	Unter-Unterkategorie
Marke	Markenname
Unit_cost	Aktuelle Standardkosten
list_price	Aktueller Listenpreis
Gewicht	Versandgewicht
ist_aktiv	Derzeit zum Verkauf

Langsam ändernde Dimensionen

Was soll das Data Warehouse tun, wenn ein Kunde von New York nach London zieht? Die Antwort hängt von der Geschäftsfrage ab.

Typ 1: Überschreiben

Typ 2: Neue Zeile hinzufügen

customer_key	customer_id	Stadt	Wirksamkeitsdatum	Ablaufdatum	is_current
1001	CUST-042	New York	15.01.2024	28.02.2026	FALSCH
1002	CUST-042	London	01.03.2026	9999-12-31	WAHR

Typ 3: Neue Spalte hinzufügen

Speichern Sie alte und neue Werte in separaten Spalten. Nützlich, wenn Sie einen Vorher-Nachher-Vergleich durchführen müssen, aber keinen vollständigen Verlauf benötigen. In der Praxis seltener.

ETL-Entwurfsmuster

Der ETL-Prozess (Extract, Transform, Load) verschiebt Daten aus Quellsystemen in das Warehouse. Zu den Entwurfsmustern, die sich gut für ERP- und E-Commerce-Daten eignen, gehören die folgenden.

Inkrementelles Laden

1. Query source: SELECT * FROM sale_order_line WHERE write_date > last_load_timestamp
2. Transform: Map source fields to warehouse columns, look up dimension keys
3. Load: INSERT new rows, UPDATE changed rows (upsert)
4. Update: Set last_load_timestamp to current run start time

Ersatzschlüsselverwaltung

Verspätete Dimensionen

Aktualisierungsplanung

Datentyp	Aktualisierungshäufigkeit	Begründung
Verkaufstransaktionen	Alle 15-60 Minuten	Umsatzverfolgung nahezu in Echtzeit
Inventar-Snapshots	Alle 4-6 Stunden	Genauigkeit vs. Datenbanklast ausgleichen
Kundenmaße	Täglich	Änderungen sind selten
Produktabmessungen	Täglich	Änderungen sind selten
Finanzdaten	Täglich (nach Handelsschluss)	Hängt von den Buchhaltungsabläufen ab
Marketingdaten	Alle 1-4 Stunden	Kampagnenoptimierung benötigt aktuellere Daten

Informationen zu Echtzeitanforderungen finden Sie in unserem Leitfaden zu Streaming-Analysen.

Optimierung der Abfrageleistung

Ein gut gestaltetes Sternschema ist aufgrund seiner einfachen Verknüpfungsmuster bereits erfolgreich. Zu den weiteren Optimierungen gehören die folgenden.

Indizes. Erstellen Sie Indizes für alle Dimensionsfremdschlüssel in Faktentabellen und für häufig gefilterte Dimensionsattribute (Datumsbereiche, Kundensegmente, Produktkategorien).

Partitionierung. Partitionieren Sie große Faktentabellen nach Datum (monatlich oder vierteljährlich). Abfragen, die nach Datumsbereich filtern, scannen nur die relevanten Partitionen.

Spaltenstatistiken. Halten Sie die PostgreSQL-Statistiken nach Massenladevorgängen mit ANALYZE auf dem neuesten Stand, damit der Abfrageplaner optimale Entscheidungen treffen kann.

Diese Optimierungen unterstützen das Self-Service-BI-Erlebnis, bei dem Geschäftsbenutzer Ad-hoc-Abfragen ohne Leistungsbedenken ausführen.

Häufig gestellte Fragen

Wie groß muss das Unternehmen sein, um ein Data Warehouse zu rechtfertigen?

Sollten wir ein Cloud Data Warehouse wie Snowflake oder BigQuery verwenden?

Wie lange dauert der Aufbau eines Data Warehouse?

Was kommt als nächstes?

Kontaktieren Sie uns, um Ihre Data-Warehouse-Architektur zu besprechen.

Veröffentlicht von ECOSIRE --- unterstützt Unternehmen bei der Skalierung mit KI-gestützten Lösungen in Odoo ERP, Shopify eCommerce und OpenClaw AI.

Data Warehouse-Design: Star-Schema für ERP- und E-Commerce-Analysen

Warum nicht direkt das ERP abfragen?

Grundlagen des Star-Schemas

Faktentabellen

Dimensionstabellen

Die Sternform

Entwerfen von Faktentabellen für ERP und E-Commerce

Fakt: Verkäufe

Fakt: Inventar

Fakt: Produktion

Zusätzliche Faktentabellen

Dimensionstabellen entwerfen

Dim: Zeit

Dim: Kunde

Dim: Produkt

Langsam ändernde Dimensionen

Typ 1: Überschreiben

Typ 2: Neue Zeile hinzufügen

Typ 3: Neue Spalte hinzufügen

ETL-Entwurfsmuster

Inkrementelles Laden

Ersatzschlüsselverwaltung

Verspätete Dimensionen

Aktualisierungsplanung

Optimierung der Abfrageleistung

Häufig gestellte Fragen

Wie groß muss das Unternehmen sein, um ein Data Warehouse zu rechtfertigen?

Sollten wir ein Cloud Data Warehouse wie Snowflake oder BigQuery verwenden?

Wie lange dauert der Aufbau eines Data Warehouse?

Was kommt als nächstes?

Transformieren Sie Ihr Unternehmen mit Odoo ERP

Verwandte Artikel

ERP für Bekleidungs- und Modemarken: Größen-Farb-Matrix, Saisonplanung und Compliance (Leitfaden 2026)

Wie viel kostet eine ERPNext-Einführung im Jahr 2026? (Lizenzfrei, aber nicht kostenlos)

ERPNext für die Fertigung: Stückliste, Arbeitsaufträge und Werkstatt – Vollständiger Leitfaden 2026

Mehr aus Data Analytics & BI

Microsoft Fabric vs. Power BI: Was ist der Unterschied und was brauchen Sie im Jahr 2026 tatsächlich?

Power BI-Berater vs. Inhouse-Team: Kosten, Geschwindigkeit und wann man Hilfe anstellt (2026)

Power BI Embedded: Kosten, Kapazitätsdimensionierung und wann es besser ist, eigene Dashboards zu erstellen

Wie viel kostet die Power BI-Implementierung im Jahr 2026? Echte Projektbudgets erklärt

Power BI vs. Tableau vs. Looker (2026): Der ehrliche Vergleich eines Implementierungsteams

Power BI für Odoo: 12 produktionsbereite DAX-Muster

Data Warehouse-Design: Star-Schema für ERP- und E-Commerce-Analysen

Warum nicht direkt das ERP abfragen?

Grundlagen des Star-Schemas

Faktentabellen

Dimensionstabellen

Die Sternform

Entwerfen von Faktentabellen für ERP und E-Commerce

Fakt: Verkäufe

Fakt: Inventar

Fakt: Produktion

Zusätzliche Faktentabellen

Dimensionstabellen entwerfen

Dim: Zeit

Dim: Kunde

Dim: Produkt

Langsam ändernde Dimensionen

Typ 1: Überschreiben

Typ 2: Neue Zeile hinzufügen

Typ 3: Neue Spalte hinzufügen

ETL-Entwurfsmuster

Inkrementelles Laden

Ersatzschlüsselverwaltung

Verspätete Dimensionen

Aktualisierungsplanung

Optimierung der Abfrageleistung

Häufig gestellte Fragen

Wie groß muss das Unternehmen sein, um ein Data Warehouse zu rechtfertigen?

Sollten wir ein Cloud Data Warehouse wie Snowflake oder BigQuery verwenden?

Wie lange dauert der Aufbau eines Data Warehouse?

Was kommt als nächstes?

Transformieren Sie Ihr Unternehmen mit Odoo ERP

Verwandte Artikel

ERP für Bekleidungs- und Modemarken: Größen-Farb-Matrix, Saisonplanung und Compliance (Leitfaden 2026)

Wie viel kostet eine ERPNext-Einführung im Jahr 2026? (Lizenzfrei, aber nicht kostenlos)

ERPNext für die Fertigung: Stückliste, Arbeitsaufträge und Werkstatt – Vollständiger Leitfaden 2026

Mehr aus Data Analytics & BI

Microsoft Fabric vs. Power BI: Was ist der Unterschied und was brauchen Sie im Jahr 2026 tatsächlich?

Power BI-Berater vs. Inhouse-Team: Kosten, Geschwindigkeit und wann man Hilfe anstellt (2026)