SAP HANA - Schema in Data Warehouse
Gli schemi sono una descrizione logica delle tabelle in Data Warehouse. Gli schemi vengono creati unendo più tabelle dei fatti e delle dimensioni per soddisfare alcune logiche di business.
Il database utilizza il modello relazionale per archiviare i dati. Tuttavia, Data Warehouse utilizza schemi che uniscono dimensioni e tabelle dei fatti per soddisfare la logica aziendale. Esistono tre tipi di schemi utilizzati in un data warehouse:
- Schema a stella
- Schema dei fiocchi di neve
- Schema della galassia
Schema a stella
In Star Schema, ogni dimensione è unita a una singola tabella dei fatti. Ogni dimensione è rappresentata da una sola dimensione e non è ulteriormente normalizzata.
La tabella delle dimensioni contiene una serie di attributi utilizzati per analizzare i dati.
Example - Nell'esempio riportato di seguito, abbiamo una tabella FactSales che ha le chiavi primarie per tutte le tabelle Dim e misura le unità_vendute e i dollari_ venduti per eseguire l'analisi.
Abbiamo quattro tabelle Dimension: DimTime, DimItem, DimBranch, DimLocation
Ogni tabella delle dimensioni è collegata alla tabella dei fatti poiché la tabella dei fatti ha una chiave primaria per ciascuna tabella delle dimensioni utilizzata per unire due tabelle.
Fatti / misure nella tabella dei fatti vengono utilizzati a scopo di analisi insieme agli attributi nelle tabelle delle dimensioni.
Schema dei fiocchi di neve
Nello schema Snowflakes, alcune delle tabelle Dimension sono ulteriormente normalizzate e le tabelle Dim sono collegate a una singola Fact Table. La normalizzazione viene utilizzata per organizzare attributi e tabelle del database per ridurre al minimo la ridondanza dei dati.
La normalizzazione comporta la suddivisione di una tabella in tabelle più piccole meno ridondanti senza perdere alcuna informazione e le tabelle più piccole vengono unite alla tabella Dimension.
Nell'esempio precedente, le tabelle DimItem e DimLocation Dimension vengono normalizzate senza perdere alcuna informazione. Questo è chiamato schema Snowflakes in cui le tabelle delle dimensioni vengono ulteriormente normalizzate in tabelle più piccole.
Schema della galassia
In Galaxy Schema sono presenti più tabelle dei fatti e tabelle delle dimensioni. Ogni tabella dei fatti memorizza le chiavi primarie di poche tabelle delle dimensioni e misure / fatti per eseguire l'analisi.
Nell'esempio sopra, ci sono due tabelle Fact FactSales, FactShipping e più tabelle Dimension unite a tabelle Fact. Ogni tabella Fact contiene la chiave primaria per le tabelle Dim unite e le misure / Fatti per eseguire l'analisi.