Data Warehouse - Schemi
Uno schema è definito come una descrizione logica del database in cui le tabelle dei fatti e delle dimensioni sono unite in modo logico. Data Warehouse viene mantenuto sotto forma di schema Star, Snow flakes e Fact Constellation.
Schema a stella
Uno schema Star contiene una tabella dei fatti e più tabelle delle dimensioni. Ogni dimensione è rappresentata con una sola tabella unidimensionale e non sono normalizzate. La tabella Dimension contiene una serie di attributi.
Caratteristiche
- In uno schema Star, c'è solo una tabella dei fatti e più tabelle delle dimensioni.
- In uno schema Star, ogni dimensione è rappresentata da una tabella a una dimensione.
- Le tabelle delle dimensioni non sono normalizzate in uno schema Star.
- Ogni tabella Dimension è unita a una chiave in una tabella dei fatti.
La seguente illustrazione mostra i dati di vendita di una società rispetto alle quattro dimensioni, vale a dire Ora, Articolo, Filiale e Ubicazione.
C'è una tabella dei fatti al centro. Contiene le chiavi di ciascuna delle quattro dimensioni. La tabella dei fatti contiene anche gli attributi, ovvero i dollari venduti e le unità vendute.
Note- Ogni dimensione ha solo una tabella di una dimensione e ogni tabella contiene una serie di attributi. Ad esempio, la tabella delle dimensioni della posizione contiene il set di attributi {location_key, street, city, province_or_state, country}. Questo vincolo può causare la ridondanza dei dati.
For example- "Vancouver" e "Victoria" entrambe le città si trovano nella provincia canadese della British Columbia. Le voci per tali città possono causare la ridondanza dei dati lungo gli attributi province_or_state e country.
Schema dei fiocchi di neve
Alcune tabelle delle dimensioni nello schema Snowflake sono normalizzate. La normalizzazione suddivide i dati in tabelle aggiuntive come mostrato nell'illustrazione seguente.
A differenza dello schema Star, la tabella della dimensione in uno schema a fiocco di neve viene normalizzata.
For example- La tabella delle dimensioni degli articoli in uno schema a stella viene normalizzata e suddivisa in due tabelle delle dimensioni, ovvero la tabella degli articoli e quella dei fornitori. Ora la tabella delle dimensioni dell'articolo contiene gli attributi chiave_articolo, nome_articolo, tipo, marca e chiave-fornitore.
La chiave del fornitore è collegata alla tabella delle dimensioni del fornitore. La tabella delle dimensioni del fornitore contiene gli attributi fornitore_key e fornitore_type.
Note - A causa della normalizzazione nello schema Snowflake, la ridondanza viene ridotta e quindi diventa facile da mantenere e risparmiare spazio di archiviazione.
Schema delle costellazioni dei fatti (schema galattico)
Una costellazione dei fatti ha più tabelle dei fatti. È anche noto come Galaxy Schema.
La figura seguente mostra due tabelle dei fatti, ovvero Vendite e Spedizione -
La tabella dei fatti di vendita è la stessa di quella nello schema a stella. La tabella dei fatti di spedizione ha cinque dimensioni, ovvero item_key, time_key, shipper_key, from_location, to_location. La tabella dei dati di spedizione contiene anche due misure, vale a dire dollari venduti e unità vendute. È anche possibile condividere tabelle delle dimensioni tra tabelle dei fatti.
For example - Le tabelle delle dimensioni di tempo, articolo e posizione sono condivise tra la tabella dei fatti di vendita e di spedizione.