Data Warehousing - Domande di intervista
Cari lettori, questi Data Warehousing Interview Questions sono stati progettati appositamente per farti conoscere la natura delle domande che potresti incontrare durante il colloquio sull'argomento Data Warehousing.
A : Il data warehouse è una raccolta di dati orientata al soggetto, integrata, variabile nel tempo e non volatile che supporta il processo decisionale del management.
A : Orientato al soggetto significa che il data warehouse memorizza le informazioni su un particolare argomento come prodotto, cliente, vendite, ecc.
A : Alcune applicazioni includono servizi finanziari, servizi bancari, beni dei clienti, settori di vendita al dettaglio, produzione controllata.
A : OLAP è l'acronimo di Online Analytical Processing e OLTP è l'acronimo di Online Transactional Processing.
A : Un data warehouse contiene informazioni cronologiche rese disponibili per l'analisi dell'attività, mentre un database operativo contiene le informazioni correnti necessarie per eseguire l'attività.
A : Un data warehouse può implementare uno schema a stella, uno schema a fiocco di neve e uno schema di costellazione dei fatti.
A : Il data warehouse è il processo di costruzione e utilizzo del data warehouse.
A : Il data warehousing prevede la pulizia dei dati, l'integrazione dei dati e il consolidamento dei dati.
A : Le funzioni svolte dallo strumento e dalle utilità del data warehouse sono estrazione dati, pulizia dati, trasformazione dati, caricamento e aggiornamento dati.
A : Estrazione dei dati significa raccogliere dati da più fonti eterogenee.
A: I metadati sono definiti semplicemente come dati sui dati. In altre parole, possiamo dire che i metadati sono i dati riassunti che ci portano ai dati dettagliati.
A : Metadata respiratory contiene la definizione del data warehouse, i metadati aziendali, i metadati operativi, i dati per la mappatura dall'ambiente operativo al data warehouse e gli algoritmi per il riepilogo.
A: Il cubo di dati ci aiuta a rappresentare i dati in più dimensioni. Il cubo di dati è definito da dimensioni e fatti.
A : Le dimensioni sono le entità rispetto alle quali un'impresa conserva i record.
A: Il data mart contiene il sottoinsieme di dati a livello di organizzazione. Questo sottoinsieme di dati è prezioso per gruppi specifici di un'organizzazione. In altre parole, possiamo dire che un data mart contiene dati specifici per un particolare gruppo.
A : La visualizzazione su un data warehouse operativo è nota come magazzino virtuale.
A : Le fasi sono: strategia IT, istruzione, analisi dei casi aziendali, progetto tecnico, creazione della versione, caricamento della cronologia, query ad hoc, evoluzione dei requisiti, automazione ed estensione dell'ambito.
A: Un gestore del carico esegue le operazioni richieste per estrarre e caricare il processo. Le dimensioni e la complessità del gestore del carico variano tra soluzioni specifiche dal data warehouse al data warehouse.
A: Un gestore di carico estrae i dati dal sistema di origine. Carica rapidamente i dati estratti nell'archivio dati temporaneo. Eseguire semplici trasformazioni in una struttura simile a quella nel data warehouse.
A: Il responsabile del magazzino è responsabile del processo di gestione del magazzino. Il gestore del magazzino è costituito da software di sistema di terze parti, programmi C e script della shell. Le dimensioni e la complessità del responsabile del magazzino variano tra le soluzioni specifiche.
A : Il responsabile del magazzino esegue controlli di coerenza e integrità referenziale, crea gli indici, le viste aziendali, le viste delle partizioni rispetto ai dati di base, trasforma e unisce i dati di origine nell'archivio temporaneo nel data warehouse pubblicato, esegue il backup dei dati nel data warehouse, e archivia i dati che hanno raggiunto la fine della loro vita catturata.
A : Informazioni di riepilogo è l'area del data warehouse in cui vengono conservate le aggregazioni predefinite.
A : Query Manager è responsabile di indirizzare le query alle tabelle appropriate.
A : Esistono quattro tipi di server OLAP, ovvero OLAP relazionale, OLAP multidimensionale, OLAP ibrido e server SQL specializzati.
A : OLAP multidimensionale è più veloce di OLAP relazionale.
A : OLAP esegue funzioni come roll-up, drill-down, slice, dadi e pivot.
A : Viene selezionata solo una dimensione per l'operazione di sezione.
A : Per l'operazione con i dadi vengono selezionate due o più dimensioni per un dato cubo.
A : C'è solo una tabella dei fatti in uno schema a stella.
A : La normalizzazione suddivide i dati in tabelle aggiuntive.
A : Lo schema Snowflake utilizza il concetto di normalizzazione.
A : La normalizzazione aiuta a ridurre la ridondanza dei dati.
A : Data Mining Query Language (DMQL) viene utilizzato per la definizione dello schema.
A : DMQL è basato su SQL (Structured Query Language).
A : Il partizionamento viene eseguito per vari motivi, ad esempio una facile gestione, per assistere il ripristino del backup e per migliorare le prestazioni.
A : Il data marting implica costi hardware e software, costi di accesso alla rete e tempi.