SAP BODS - Query Transform

Questa è la trasformazione più comune utilizzata in Data Services ed è possibile eseguire le seguenti funzioni:

  • Filtraggio dei dati dalle fonti
  • Unione di dati da più origini
  • Eseguire funzioni e trasformazioni sui dati
  • Mappatura delle colonne dagli schemi di input a quelli di output
  • Assegnazione di chiavi primarie
  • Aggiungere nuove colonne, schemi e funzioni risultanti agli schemi di output

Poiché la trasformazione della query è la trasformazione più comunemente utilizzata, viene fornito un collegamento per questa query nella tavolozza degli strumenti.

Per aggiungere la trasformazione della query, seguire i passaggi indicati di seguito:

Step 1- Fare clic sulla tavolozza degli strumenti di trasformazione delle query. Fare clic in un punto qualsiasi dell'area di lavoro del flusso di dati. Collegalo agli ingressi e alle uscite.

Quando si fa doppio clic sull'icona Trasformazione query, viene aperto un editor di query utilizzato per eseguire operazioni di query.

Le seguenti aree sono presenti in Query Transform:

  • Schema di input
  • Schema di output
  • Parameters

Gli schemi di input e output contengono colonne, schemi nidificati e funzioni. Schema In e Schema Out mostrano lo schema attualmente selezionato in trasformazione.

Per modificare lo schema di output, selezionare lo schema nell'elenco, fare clic con il tasto destro e selezionare Rendi corrente.

Trasformazione della qualità dei dati

Le trasformazioni della qualità dei dati non possono essere collegate direttamente alla trasformazione a monte, che contiene tabelle nidificate. Per connettere queste trasformazioni è necessario aggiungere una trasformazione della query o una trasformazione della pipeline XML tra la trasformazione dalla tabella nidificata e la trasformazione della qualità dei dati.

Come utilizzare la trasformazione della qualità dei dati?

Step 1 - Vai a Libreria oggetti → scheda Trasforma

Step 2 - Espandi la trasformazione della qualità dei dati e aggiungi la trasformazione o la configurazione della trasformazione che desideri aggiungere al flusso di dati.

Step 3- Disegna le connessioni del flusso di dati. Fare doppio clic sul nome della trasformazione, si apre l'editor della trasformazione. Nello schema di input selezionare i campi di input che si desidera mappare.

Note - Per utilizzare Associate Transform, è possibile aggiungere campi definiti dall'utente alla scheda di input.

Trasformazione di elaborazione dati di testo

La trasformazione dell'elaborazione dei dati di testo consente di estrarre le informazioni specifiche da un grande volume di testo. Puoi cercare fatti ed entità come clienti, prodotti e fatti finanziari, specifici di un'organizzazione.

Questa trasformazione controlla anche la relazione tra le entità e consente l'estrazione. I dati estratti, utilizzando l'elaborazione dei dati di testo, possono essere utilizzati in Business Intelligence, Reporting, query e analisi.

Trasformazione di estrazione di entità

In Data Services, l'elaborazione dei dati di testo viene eseguita con l'aiuto di Entity Extraction, che estrae entità e fatti da dati non strutturati.

Ciò comporta l'analisi e l'elaborazione di grandi volumi di dati di testo, la ricerca di entità, l'assegnazione di un tipo appropriato e la presentazione di metadati in formato standard.

La trasformazione Entity Extraction può estrarre informazioni da qualsiasi contenuto di testo, HTML, XML o alcuni formati binari (come PDF) e generare output strutturato. È possibile utilizzare l'output in diversi modi in base al flusso di lavoro. È possibile utilizzarlo come input per un'altra trasformazione o scrivere su più origini di output come una tabella di database o un file flat. L'output viene generato nella codifica UTF-16.

Entity Extract Transform can be used in the following scenarios −

  • Trovare informazioni specifiche da una grande quantità di volume di testo.

  • Trovare informazioni strutturate da testo non strutturato con informazioni esistenti per creare nuove connessioni.

  • Reportistica e analisi per la qualità del prodotto.

Differenze tra TDP e Data Cleansing

L'elaborazione dei dati di testo viene utilizzata per trovare informazioni rilevanti da dati di testo non strutturati. Tuttavia, la pulizia dei dati viene utilizzata per la standardizzazione e la pulizia dei dati strutturati.

Parametri Elaborazione dati di testo Pulizia dei dati
Tipo di ingresso Dati non strutturati Dati strutturati
Dimensioni input Più di 5 KB Meno di 5 KB
Ambito di input Ampio dominio con molte varianti Variazioni limitate
Potenziale utilizzo Potenziali informazioni significative da dati non strutturati Qualità dei dati per l'archiviazione nel repository
Produzione Crea annotazioni sotto forma di entità, tipo, ecc. L'input non viene modificato Crea campi standardizzati, l'Input è cambiato