SAP BODS - Tecniche di ottimizzazione
Le prestazioni di un lavoro ETL dipendono dal sistema su cui si utilizza il software Data Services, dal numero di spostamenti, ecc.
Esistono vari altri fattori che contribuiscono alle prestazioni in un'attività ETL. Sono -
Source Data Base - Il database di origine deve essere impostato per eseguire il Selectdichiarazioni rapidamente. Questo può essere fatto aumentando la dimensione dell'I / O del database, aumentando la dimensione del buffer condiviso per memorizzare nella cache più dati e non consentendo il parallelismo per tabelle piccole, ecc.
Source Operating System- Il sistema operativo di origine deve essere configurato per leggere rapidamente i dati dai dischi. Imposta il protocollo di lettura anticipata su 64 KB.
Target Database - Il database di destinazione deve essere configurato per funzionare INSERT e UPDATEvelocemente. Questo può essere fatto:
- Disattivazione della registrazione dell'archivio.
- Disattivazione della registrazione Redo per tutte le tabelle.
- Massimizzare le dimensioni del buffer condiviso.
Target Operating System- Il sistema operativo di destinazione deve essere configurato per scrivere rapidamente i dati sui dischi. È possibile attivare l'I / O asincrono per rendere le operazioni di input / output più veloci possibile.
Network - La larghezza di banda della rete dovrebbe essere sufficiente per trasferire i dati dall'origine al sistema di destinazione.
BODS Repository Database - Per migliorare le prestazioni dei lavori BODS, è possibile eseguire quanto segue:
Monitor Sample Rate - Nel caso in cui si stia elaborando una grande quantità di set di dati in un lavoro ETL, monitorare la frequenza di campionamento a un valore più alto per ridurre il numero di chiamate I / O al file di registro migliorando così le prestazioni.
È inoltre possibile escludere i registri di Data Services dalla scansione antivirus se la scansione antivirus è configurata sul job server poiché può causare un degrado delle prestazioni
Job Server OS - In Data Services, un flusso di dati in un lavoro ne avvia uno ‘al_engine’processo, che avvia quattro thread. Per le massime prestazioni, considera un progetto che ne esegua uno‘al_engine’processo per CPU alla volta. Il sistema operativo di Job Server dovrebbe essere ottimizzato in modo tale che tutti i thread siano distribuiti a tutte le CPU disponibili.