Data Warehouse - Schemi

Uno schema è definito come una descrizione logica del database in cui le tabelle dei fatti e delle dimensioni sono unite in modo logico. Data Warehouse viene mantenuto sotto forma di schema Star, Snow flakes e Fact Constellation.

Schema a stella

Uno schema Star contiene una tabella dei fatti e più tabelle delle dimensioni. Ogni dimensione è rappresentata con una sola tabella unidimensionale e non sono normalizzate. La tabella Dimension contiene una serie di attributi.

Caratteristiche

  • In uno schema Star, c'è solo una tabella dei fatti e più tabelle delle dimensioni.
  • In uno schema Star, ogni dimensione è rappresentata da una tabella a una dimensione.
  • Le tabelle delle dimensioni non sono normalizzate in uno schema Star.
  • Ogni tabella Dimension è unita a una chiave in una tabella dei fatti.

La seguente illustrazione mostra i dati di vendita di una società rispetto alle quattro dimensioni, vale a dire Ora, Articolo, Filiale e Ubicazione.

C'è una tabella dei fatti al centro. Contiene le chiavi di ciascuna delle quattro dimensioni. La tabella dei fatti contiene anche gli attributi, ovvero i dollari venduti e le unità vendute.

Note- Ogni dimensione ha solo una tabella di una dimensione e ogni tabella contiene una serie di attributi. Ad esempio, la tabella delle dimensioni della posizione contiene il set di attributi {location_key, street, city, province_or_state, country}. Questo vincolo può causare la ridondanza dei dati.

For example- "Vancouver" e "Victoria" entrambe le città si trovano nella provincia canadese della British Columbia. Le voci per tali città possono causare la ridondanza dei dati lungo gli attributi province_or_state e country.

Schema dei fiocchi di neve

Alcune tabelle delle dimensioni nello schema Snowflake sono normalizzate. La normalizzazione suddivide i dati in tabelle aggiuntive come mostrato nell'illustrazione seguente.

A differenza dello schema Star, la tabella della dimensione in uno schema a fiocco di neve viene normalizzata.

For example- La tabella delle dimensioni degli articoli in uno schema a stella viene normalizzata e suddivisa in due tabelle delle dimensioni, ovvero la tabella degli articoli e quella dei fornitori. Ora la tabella delle dimensioni dell'articolo contiene gli attributi chiave_articolo, nome_articolo, tipo, marca e chiave-fornitore.

La chiave del fornitore è collegata alla tabella delle dimensioni del fornitore. La tabella delle dimensioni del fornitore contiene gli attributi fornitore_key e fornitore_type.

Note - A causa della normalizzazione nello schema Snowflake, la ridondanza viene ridotta e quindi diventa facile da mantenere e risparmiare spazio di archiviazione.

Schema delle costellazioni dei fatti (schema galattico)

Una costellazione dei fatti ha più tabelle dei fatti. È anche noto come Galaxy Schema.

La figura seguente mostra due tabelle dei fatti, ovvero Vendite e Spedizione -

La tabella dei fatti di vendita è la stessa di quella nello schema a stella. La tabella dei fatti di spedizione ha cinque dimensioni, ovvero item_key, time_key, shipper_key, from_location, to_location. La tabella dei dati di spedizione contiene anche due misure, vale a dire dollari venduti e unità vendute. È anche possibile condividere tabelle delle dimensioni tra tabelle dei fatti.

For example - Le tabelle delle dimensioni di tempo, articolo e posizione sono condivise tra la tabella dei fatti di vendita e di spedizione.