Regressione logistica in Python - Case Study
Considera che una banca si avvicina a te per sviluppare un'applicazione di machine learning che le aiuterà a identificare i potenziali clienti che aprirebbero con loro un deposito a termine (chiamato anche deposito fisso da alcune banche). La banca conduce regolarmente un sondaggio tramite chiamate telefoniche o moduli web per raccogliere informazioni sui potenziali clienti. L'indagine è di natura generale e viene condotta su un pubblico molto vasto al quale molti potrebbero non essere interessati a trattare con questa banca stessa. Del resto, solo pochi potrebbero essere interessati ad aprire un deposito a termine. Altri potrebbero essere interessati ad altri servizi offerti dalla banca. Quindi il sondaggio non è necessariamente condotto per identificare i clienti che aprono i TD. Il tuo compito è identificare tutti quei clienti con un'alta probabilità di aprire TD dai dati del sondaggio che la banca condividerà con te.
Fortunatamente, un tale tipo di dati è pubblicamente disponibile per coloro che aspirano a sviluppare modelli di machine learning. Questi dati sono stati preparati da alcuni studenti della UC Irvine con finanziamenti esterni. Il database è disponibile come parte diUCI Machine Learning Repositoryed è ampiamente utilizzato da studenti, educatori e ricercatori in tutto il mondo. I dati possono essere scaricati da qui .
Nei prossimi capitoli, eseguiamo ora lo sviluppo dell'applicazione utilizzando gli stessi dati.