ETL vs test del database

Sia il test ETL che il test del database implicano la convalida dei dati, ma non sono la stessa cosa. Il test ETL viene normalmente eseguito sui dati in un sistema di data warehouse, mentre il test del database viene comunemente eseguito su sistemi transazionali in cui i dati provengono da diverse applicazioni nel database transazionale.

Qui abbiamo evidenziato le principali differenze tra il test ETL e il test del database.

Test ETL

Il test ETL prevede le seguenti operazioni:

  • Convalida dello spostamento dei dati dalla sorgente al sistema di destinazione.

  • Verifica del conteggio dei dati nel sistema di origine e di destinazione.

  • Verifica dell'estrazione dei dati, trasformazione secondo i requisiti e le aspettative.

  • Verifica se le relazioni tra tabelle, join e chiavi, vengono conservate durante la trasformazione.

Gli strumenti di test ETL comuni includono QuerySurge, Informatica, eccetera.

Test di database

Il test del database sottolinea maggiormente l'accuratezza dei dati, la correttezza dei dati e i valori validi. Comporta le seguenti operazioni:

  • Verifica se le chiavi primarie ed esterne vengono mantenute.

  • Verifica se le colonne in una tabella hanno valori di dati validi.

  • Verifica dell'accuratezza dei dati nelle colonne. Example - La colonna Numero di mesi non deve avere un valore maggiore di 12.

  • Verifica dei dati mancanti nelle colonne. Controlla se ci sono colonne nulle che in realtà dovrebbero avere un valore valido.

Gli strumenti di test di database comuni includono Selenium, QTP, eccetera.

La tabella seguente mostra le caratteristiche chiave dei test di database ed ETL e il loro confronto:

Funzione Test di database Test ETL
Obbiettivo primario Validazione e integrazione dei dati Estrazione, trasformazione e caricamento dei dati per il reporting BI
Sistema applicabile Sistema transazionale in cui si verifica il flusso aziendale Sistema contenente dati storici e non in ambiente di flusso aziendale
Strumenti comuni QTP, selenio, ecc. QuerySurge, Informatica, ecc.
Esigenza aziendale Viene utilizzato per integrare i dati di più applicazioni, impatto grave. Viene utilizzato per rapporti analitici, informazioni e previsioni.
Modellazione Metodo ER Multidimensionale
Tipo di database Viene normalmente utilizzato nei sistemi OLTP Si applica ai sistemi OLAP
Tipo di dati Dati normalizzati con più join Dati denormalizzati con meno join, più indici e aggregazioni.