Data Warehousing - Gestori di sistema

La gestione del sistema è obbligatoria per la corretta implementazione di un data warehouse. I gestori di sistema più importanti sono:

  • Gestore della configurazione del sistema
  • Gestore della pianificazione del sistema
  • Gestore degli eventi di sistema
  • Gestore database di sistema
  • Gestore ripristino backup di sistema

System Configuration Manager

  • Il gestore della configurazione del sistema è responsabile della gestione del setup e della configurazione del data warehouse.

  • La struttura del Configuration Manager varia da un sistema operativo all'altro.

  • Nella struttura di configurazione Unix, il gestore varia da fornitore a fornitore.

  • I gestori di configurazione hanno un'unica interfaccia utente.

  • L'interfaccia del Configuration Manager ci permette di controllare tutti gli aspetti del sistema.

Note - Lo strumento di configurazione più importante è il gestore I / O.

System Scheduling Manager

System Scheduling Manager è responsabile della corretta implementazione del data warehouse. Il suo scopo è pianificare query ad hoc. Ogni sistema operativo ha il proprio scheduler con una qualche forma di meccanismo di controllo batch. L'elenco delle funzionalità che un gestore della pianificazione del sistema deve avere è il seguente:

  • Lavora oltre i confini di cluster o MPP
  • Gestisci le differenze di orario internazionali
  • Gestire il fallimento del lavoro
  • Gestisci più query
  • Supportare le priorità del lavoro
  • Riavviare o rimettere in coda i lavori non riusciti
  • Avvisare l'utente o un processo quando il lavoro è stato completato
  • Mantieni le pianificazioni dei lavori durante le interruzioni del sistema
  • Re-accodare i lavori ad altre code
  • Supporta l'arresto e l'avvio delle code
  • Log lavori in coda
  • Gestisci l'elaborazione tra le code

Note - L'elenco sopra può essere utilizzato come parametri di valutazione per la valutazione di un buon scheduler.

Alcuni lavori importanti che uno scheduler deve essere in grado di gestire sono i seguenti:

  • Pianificazione delle query giornaliera e ad hoc
  • Esecuzione dei requisiti di report periodici
  • Caricamento dei dati
  • Elaborazione dati
  • Creazione dell'indice
  • Backup
  • Creazione di aggregazioni
  • Trasformazione dei dati

Note - Se il data warehouse è in esecuzione su un'architettura cluster o MPP, il gestore della pianificazione del sistema deve essere in grado di funzionare sull'architettura.

System Event Manager

L'event manager è una specie di software. Il gestore eventi gestisce gli eventi definiti nel sistema di data warehouse. Non possiamo gestire manualmente il data warehouse perché la struttura del data warehouse è molto complessa. Abbiamo quindi bisogno di uno strumento che gestisca automaticamente tutti gli eventi senza alcun intervento da parte dell'utente.

Note- L'Event manager monitora gli eventi che si verificano e li gestisce. Il gestore degli eventi tiene traccia anche della miriade di cose che possono andare storte in questo complesso sistema di data warehouse.

Eventi

Gli eventi sono le azioni che vengono generate dall'utente o dal sistema stesso. Si può notare che l'evento è un'occorrenza misurabile, osservabile, di un'azione definita.

Di seguito è riportato un elenco di eventi comuni che devono essere monitorati.

  • Errore hardware
  • Spazio esaurito su alcuni dischi chiave
  • Un processo che sta morendo
  • Un processo che restituisce un errore
  • Utilizzo della CPU che supera la soglia 805
  • Contesa interna sui punti di serializzazione del database
  • Rapporti di riscontro della cache del buffer superiori alla soglia o errore inferiore alla soglia
  • Un tavolo che arriva al massimo delle sue dimensioni
  • Eccessivo scambio di memoria
  • Un tavolo che non si allunga per mancanza di spazio
  • Il disco presenta colli di bottiglia di I / O
  • Utilizzo di aree temporanee o di smistamento che raggiungono determinate soglie
  • Qualsiasi altro utilizzo della memoria condivisa del database

La cosa più importante degli eventi è che dovrebbero essere in grado di eseguirsi da soli. I pacchetti di eventi definiscono le procedure per gli eventi predefiniti. Il codice associato a ogni evento è noto come gestore eventi. Questo codice viene eseguito ogni volta che si verifica un evento.

Gestore di sistema e database

Il gestore di sistema e database possono essere due parti separate del software, ma svolgono lo stesso lavoro. L'obiettivo di questi strumenti è automatizzare determinati processi e semplificare l'esecuzione di altri. I criteri per la scelta di un sistema e del database manager sono i seguenti:

  • aumentare la quota dell'utente.
  • assegnare e de-assegnare ruoli agli utenti
  • assegnare e de-assegnare i profili agli utenti
  • eseguire la gestione dello spazio del database
  • monitorare e creare report sull'utilizzo dello spazio
  • riordinare lo spazio frammentato e inutilizzato
  • aggiungere ed espandere lo spazio
  • aggiungere e rimuovere utenti
  • gestire la password utente
  • gestire tabelle di riepilogo o temporanee
  • assegnare o assegnare uno spazio temporaneo ae dall'utente
  • recuperare lo spazio da tabelle temporanee vecchie o non aggiornate
  • gestire gli errori e i registri di traccia
  • per sfogliare i file di registro e traccia
  • reindirizzare l'errore o rintracciare le informazioni
  • attivare e disattivare la registrazione degli errori e delle tracce
  • eseguire la gestione dello spazio di sistema
  • monitorare e creare report sull'utilizzo dello spazio
  • ripulire le directory di file vecchie e inutilizzate
  • aggiungere o espandere lo spazio.

System Backup Recovery Manager

Lo strumento di backup e ripristino semplifica il backup dei dati da parte del personale operativo e di gestione. Notare che il gestore di backup del sistema deve essere integrato con il software del gestore di pianificazione utilizzato. Le caratteristiche importanti necessarie per la gestione dei backup sono le seguenti:

  • Scheduling
  • Monitoraggio dei dati di backup
  • Consapevolezza del database

I backup vengono eseguiti solo per proteggersi dalla perdita di dati. Di seguito sono riportati i punti importanti da ricordare:

  • Il software di backup manterrà una qualche forma di database di dove e quando è stato eseguito il backup del pezzo di dati.

  • Il gestore ripristino backup deve disporre di un buon front-end per quel database.

  • Il software di ripristino del backup dovrebbe essere a conoscenza del database.

  • Essendo a conoscenza del database, il software può quindi essere indirizzato in termini di database e non eseguirà backup che non sarebbero fattibili.