Agile Data Science - Processo di Data Science

In questo capitolo, comprenderemo il processo di data science e le terminologie necessarie per comprendere il processo.

"La scienza dei dati è la miscela di interfaccia dati, sviluppo di algoritmi e tecnologia per risolvere problemi analitici complessi".

La scienza dei dati è un campo interdisciplinare che comprende metodi, processi e sistemi scientifici con categorie incluse in esso come apprendimento automatico, matematica e conoscenza statistica con la ricerca tradizionale. Include anche una combinazione di capacità di hacking con competenze sostanziali. La scienza dei dati trae principi da matematica, statistica, scienza dell'informazione e informatica, data mining e analisi predittiva.

I diversi ruoli che fanno parte del team di data science sono menzionati di seguito:

I clienti

I clienti sono le persone che utilizzano il prodotto. Il loro interesse determina il successo del progetto e il loro feedback è molto prezioso nella scienza dei dati.

Sviluppo aziendale

Questo team di data science firma i primi clienti, in prima persona o attraverso la creazione di pagine di destinazione e promozioni. Il team di sviluppo aziendale offre il valore del prodotto.

Responsabili del prodotto

I responsabili di prodotto prendono l'importanza di creare il miglior prodotto, che è prezioso nel mercato.

Designer di interazione

Si concentrano sulle interazioni di progettazione attorno ai modelli di dati in modo che gli utenti trovino il valore appropriato.

Scienziati di dati

I data scientist esplorano e trasformano i dati in nuovi modi per creare e pubblicare nuove funzionalità. Questi scienziati combinano anche dati provenienti da diverse fonti per creare un nuovo valore. Svolgono un ruolo importante nella creazione di visualizzazioni con ricercatori, ingegneri e sviluppatori web.

Ricercatori

Come indica il nome, i ricercatori sono coinvolti in attività di ricerca. Risolvono problemi complicati, cosa che i data scientist non possono fare. Questi problemi comportano un'intensa concentrazione e tempo di apprendimento automatico e modulo statistico.

Adattarsi al cambiamento

Tutti i membri del team di data science devono adattarsi ai nuovi cambiamenti e lavorare sulla base dei requisiti. Diversi cambiamenti dovrebbero essere fatti per adottare una metodologia agile con la scienza dei dati, che sono menzionati come segue:

  • Scegliere i generalisti rispetto agli specialisti.

  • Preferenza di piccoli team rispetto a grandi team.

  • Utilizzo di strumenti e piattaforme di alto livello.

  • Condivisione continua e iterativa del lavoro intermedio.

Note

Nel team di data science Agile, un piccolo team di generalisti utilizza strumenti di alto livello scalabili e perfeziona i dati attraverso iterazioni in stati di valore sempre più elevati.

Considera i seguenti esempi relativi al lavoro dei membri del team di data science:

  • I designer forniscono CSS.

  • Gli sviluppatori Web creano intere applicazioni, comprendono l'esperienza dell'utente e il design dell'interfaccia.

  • I data scientist dovrebbero lavorare sia sulla ricerca che sulla creazione di servizi web, comprese le applicazioni web.

  • I ricercatori lavorano in base al codice, che mostra i risultati che spiegano i risultati intermedi.

  • I responsabili di prodotto cercano di identificare e comprendere i difetti in tutte le aree correlate.