Big Data Analytics - Data Scientist

Il ruolo di un data scientist è normalmente associato a compiti come la modellazione predittiva, lo sviluppo di algoritmi di segmentazione, sistemi di raccomandazione, framework di test A / B e spesso lavorando con dati non strutturati grezzi.

La natura del loro lavoro richiede una profonda comprensione della matematica, della statistica applicata e della programmazione. Esistono alcune abilità comuni tra un analista di dati e un scienziato di dati, ad esempio la capacità di eseguire query sui database. Entrambi analizzano i dati, ma la decisione di un data scientist può avere un impatto maggiore in un'organizzazione.

Ecco una serie di competenze che normalmente un data scientist deve avere:

  • Programmazione in un pacchetto statistico come: R, Python, SAS, SPSS o Julia
  • In grado di pulire, estrarre ed esplorare i dati da diverse fonti
  • Ricerca, progettazione e implementazione di modelli statistici
  • Conoscenza statistica, matematica e informatica approfondita

Nell'analisi dei big data, le persone normalmente confondono il ruolo di un data scientist con quello di un data architect. In realtà, la differenza è abbastanza semplice. Un architetto dei dati definisce gli strumenti e l'architettura in cui verranno archiviati i dati, mentre uno scienziato dei dati utilizza questa architettura. Ovviamente, un data scientist dovrebbe essere in grado di creare nuovi strumenti, se necessario, per progetti ad-hoc, ma la definizione e la progettazione dell'infrastruttura non dovrebbero far parte del suo compito.