DW - Panoramica

Un data warehouse è noto come un archivio centrale per archiviare i dati da una o più origini dati eterogenee. Il data warehouse viene utilizzato per la creazione di report e l'analisi delle informazioni e archivia sia i dati storici che quelli correnti. I dati nel sistema DW vengono utilizzati per il reporting analitico, che viene successivamente utilizzato da analisti aziendali, responsabili delle vendite o lavoratori della conoscenza per il processo decisionale.

I dati nel sistema DW vengono caricati da un sistema di transazioni operative come Vendite, Marketing, Risorse umane, SCM, ecc. Possono passare attraverso l'archivio dati operativi o altre trasformazioni prima di essere caricati nel sistema DW per l'elaborazione delle informazioni.

Data Warehouse - Caratteristiche principali

Le caratteristiche principali di un sistema DW sono:

  • È un archivio di dati centrale in cui i dati vengono archiviati da una o più origini dati eterogenee.

  • Un sistema DW memorizza sia i dati attuali che quelli storici. Normalmente un sistema DW memorizza 5-10 anni di dati storici.

  • Un sistema DW è sempre tenuto separato da un sistema di transazioni operative.

  • I dati nel sistema DW vengono utilizzati per diversi tipi di rapporti analitici, dal confronto trimestrale a quello annuale.

Necessità di un sistema DW

Supponiamo che tu abbia un'agenzia di mutui per la casa in cui i dati provengono da più applicazioni come marketing, vendite, ERP, HRM, MM ecc. Questi dati vengono estratti, trasformati e caricati in Data Warehouse.

Ad esempio, se è necessario confrontare le vendite trimestrali / annuali di un prodotto, non è possibile utilizzare un database transazionale operativo, poiché questo bloccherà il sistema di transazione. Pertanto, a questo scopo viene utilizzato un Data Warehouse.

Differenza tra DW e ODB

Le differenze tra un data warehouse e un database operativo (database transazionale) sono le seguenti:

  • Un sistema transazionale è progettato per carichi di lavoro noti e transazioni come l'aggiornamento di un record utente, la ricerca di un record, ecc. Tuttavia, le transazioni di Data Warehouse sono più complesse e presentano una forma generale di dati.

  • Un sistema transazionale contiene i dati correnti di un'organizzazione e il data warehouse normalmente contiene i dati storici.

  • Il sistema transazionale supporta l'elaborazione parallela di più transazioni. Il controllo della concorrenza e i meccanismi di ripristino sono necessari per mantenere la coerenza del database.

  • Una query del database operativo consente di leggere e modificare le operazioni (Elimina e Aggiorna) mentre una query OLAP richiede solo l'accesso in sola lettura dei dati memorizzati (istruzione Select).

Architettura DW

Il data warehousing prevede la pulizia dei dati, l'integrazione dei dati e il consolidamento dei dati.

Un data warehouse ha un'architettura a 3 livelli: Data Source Layer, Integration Layer, e Presentation Layer. L'illustrazione sopra mostra l'architettura comune di un sistema Data Warehouse.