Data Warehousing - OLAP

Online Analytical Processing Server (OLAP) si basa sul modello di dati multidimensionali. Consente a manager e analisti di ottenere una visione delle informazioni attraverso un accesso rapido, coerente e interattivo alle informazioni. Questo capitolo tratta i tipi di OLAP, le operazioni su OLAP, la differenza tra OLAP e database statistici e OLTP.

Tipi di server OLAP

Abbiamo quattro tipi di server OLAP:

  • OLAP relazionale (ROLAP)
  • OLAP multidimensionale (MOLAP)
  • OLAP ibrido (HOLAP)
  • Server SQL specializzati

OLAP relazionale

I server ROLAP vengono inseriti tra il server relazionale back-end e gli strumenti front-end del client. Per archiviare e gestire i dati del magazzino, ROLAP utilizza DBMS relazionali o relazionali estesi.

ROLAP include quanto segue:

  • Implementazione della logica di navigazione di aggregazione.
  • Ottimizzazione per ogni back-end DBMS.
  • Strumenti e servizi aggiuntivi.

OLAP multidimensionale

MOLAP utilizza motori di archiviazione multidimensionale basati su array per visualizzazioni multidimensionali dei dati. Con archivi di dati multidimensionali, l'utilizzo dello spazio di archiviazione potrebbe essere basso se il set di dati è scarso. Pertanto, molti server MOLAP utilizzano due livelli di rappresentazione dell'archiviazione dei dati per gestire set di dati densi e sparsi.

OLAP ibrido

OLAP ibrido è una combinazione di ROLAP e MOLAP. Offre una maggiore scalabilità di ROLAP e un calcolo più veloce di MOLAP. I server HOLAP consentono di memorizzare grandi volumi di dati di informazioni dettagliate. Le aggregazioni vengono archiviate separatamente nel negozio MOLAP.

Server SQL specializzati

I server SQL specializzati forniscono un linguaggio di query avanzato e supporto per l'elaborazione delle query per le query SQL su schemi a stella e fiocco di neve in un ambiente di sola lettura.

Operazioni OLAP

Poiché i server OLAP si basano su una visualizzazione multidimensionale dei dati, discuteremo delle operazioni OLAP nei dati multidimensionali.

Ecco l'elenco delle operazioni OLAP:

  • Roll-up
  • Drill-down
  • Fare a pezzi
  • Pivot (ruota)

Roll-up

Il roll-up esegue l'aggregazione su un cubo di dati in uno dei seguenti modi:

  • Scalando una gerarchia di concetti per una dimensione
  • Per riduzione dimensionale

Il diagramma seguente illustra come funziona il roll-up.

  • Il roll-up viene eseguito risalendo una gerarchia di concetti per la posizione della dimensione.

  • Inizialmente la gerarchia del concetto era "strada <città <provincia <paese".

  • Al momento dell'aggiornamento, i dati vengono aggregati ascendendo la gerarchia della posizione dal livello di città al livello di paese.

  • I dati sono raggruppati in città anziché in paesi.

  • Quando viene eseguito il roll-up, una o più dimensioni dal cubo di dati vengono rimosse.

Scavare a fondo

Il drill-down è l'operazione inversa del roll-up. Viene eseguito in uno dei seguenti modi:

  • Riducendo una gerarchia di concetti per una dimensione
  • Introducendo una nuova dimensione.

Il diagramma seguente illustra come funziona il drill-down:

  • Il drill-down viene eseguito abbassando una gerarchia di concetti per la dimensione tempo.

  • Inizialmente la gerarchia del concetto era "giorno <mese <trimestre <anno".

  • Durante il drill-down, la dimensione temporale viene discendente dal livello del trimestre al livello del mese.

  • Quando viene eseguito il drill-down, vengono aggiunte una o più dimensioni dal cubo di dati.

  • Sposta i dati da dati meno dettagliati a dati altamente dettagliati.

Fetta

L'operazione slice seleziona una dimensione particolare da un dato cubo e fornisce un nuovo sottocubo. Considera il seguente diagramma che mostra come funziona lo slice.

  • Qui Slice viene eseguito per la dimensione "time" utilizzando il criterio time = "Q1".

  • Formerà un nuovo sottocubo selezionando una o più dimensioni.

Dado

Dice seleziona due o più dimensioni da un dato cubo e fornisce un nuovo sottocubo. Considera il seguente diagramma che mostra il funzionamento dei dadi.

L'operazione dei dadi sul cubo basata sui seguenti criteri di selezione coinvolge tre dimensioni.

  • (location = "Toronto" o "Vancouver")
  • (ora = "Q1" o "Q2")
  • (item = "Mobile" o "Modem")

Perno

L'operazione di rotazione è anche nota come rotazione. Ruota gli assi dei dati in vista per fornire una presentazione alternativa dei dati. Considera il diagramma seguente che mostra l'operazione pivot.

OLAP vs OLTP

Sr.No. Data Warehouse (OLAP) Database operativo (OLTP)
1 Coinvolge l'elaborazione storica delle informazioni. Coinvolge l'elaborazione quotidiana.
2 I sistemi OLAP vengono utilizzati da knowledge worker quali dirigenti, manager e analisti. I sistemi OLTP vengono utilizzati da impiegati, amministratori di database o professionisti del database.
3 Utile per analizzare il business. Utile nella gestione dell'attività.
4 Si concentra sull'informazione fuori. Si concentra sui dati in formato.
5 Basato su Star Schema, Snowflake, Schema e Fact Constellation Schema. Basato sul modello di relazione tra entità.
6 Contiene dati storici. Contiene i dati correnti.
7 Fornisce dati riepilogati e consolidati. Fornisce dati primitivi e altamente dettagliati.
8 Fornisce una vista riepilogativa e multidimensionale dei dati. Fornisce una vista relazionale dettagliata e semplice dei dati.
9 Il numero o gli utenti sono in centinaia. Il numero di utenti è in migliaia.
10 Il numero di record a cui si accede è in milioni. Il numero di record a cui si accede è espresso in decine.
11 La dimensione del database va da 100 GB a 1 TB La dimensione del database va da 100 MB a 1 GB.
12 Altamente flessibile. Fornisce prestazioni elevate.