Analisi dei dati - Panoramica

L'analisi dei dati è un processo di ispezione, pulizia, trasformazione e modellazione dei dati con l'obiettivo di scoprire informazioni utili, suggerire conclusioni e supportare il processo decisionale

.

Tipi di analisi dei dati

Esistono diverse tecniche di analisi dei dati che comprendono vari domini come affari, scienza, scienze sociali, ecc. Con una varietà di nomi. I principali approcci di analisi dei dati sono:

  • Estrazione dei dati
  • Business Intelligence
  • Analisi statistica
  • Analisi predittiva
  • Analisi del testo

Estrazione dei dati

Il Data Mining è l'analisi di grandi quantità di dati per estrarre modelli di dati precedentemente sconosciuti e interessanti, dati insoliti e le dipendenze. Si noti che l'obiettivo è l'estrazione di modelli e conoscenze da grandi quantità di dati e non l'estrazione dei dati stessi.

L'analisi del data mining coinvolge metodi di informatica all'intersezione tra intelligenza artificiale, apprendimento automatico, statistiche e sistemi di database.

I modelli ottenuti dal data mining possono essere considerati come un riepilogo dei dati di input che possono essere utilizzati in ulteriori analisi o per ottenere risultati di previsione più accurati da un sistema di supporto decisionale.

Business Intelligence

Le tecniche e gli strumenti di Business Intelligence servono per l'acquisizione e la trasformazione di grandi quantità di dati aziendali non strutturati per aiutare a identificare, sviluppare e creare nuove opportunità di business strategiche.

L'obiettivo della business intelligence è consentire una facile interpretazione di grandi volumi di dati per identificare nuove opportunità. Aiuta a implementare una strategia efficace basata su intuizioni che possono fornire alle aziende un vantaggio competitivo sul mercato e stabilità a lungo termine.

Analisi statistica

La statistica è lo studio della raccolta, analisi, interpretazione, presentazione e organizzazione dei dati.

Nell'analisi dei dati vengono utilizzate due principali metodologie statistiche:

  • Descriptive statistics - Nelle statistiche descrittive, i dati dell'intera popolazione o di un campione sono riassunti con descrittori numerici come:

    • Media, deviazione standard per dati continui

    • Frequenza, percentuale per dati categoriali

  • Inferential statistics- Utilizza modelli nei dati del campione per trarre inferenze sulla popolazione rappresentata o per tenere conto della casualità. Queste inferenze possono essere:

    • rispondere a domande sì / no sui dati (verifica delle ipotesi)

    • stima delle caratteristiche numeriche dei dati (stima)

    • descrivere le associazioni all'interno dei dati (correlazione)

    • modellazione delle relazioni all'interno dei dati (es. analisi di regressione)

Analisi predittiva

L'analisi predittiva utilizza modelli statistici per analizzare i dati attuali e storici per la previsione (previsioni) su eventi futuri o altrimenti sconosciuti. Negli affari, l'analisi predittiva viene utilizzata per identificare rischi e opportunità che aiutano nel processo decisionale.

Analisi del testo

L'analisi del testo, nota anche come estrazione di testo o estrazione di dati di testo, è il processo di derivazione di informazioni di alta qualità dal testo. Il text mining di solito implica il processo di strutturazione del testo di input, derivando modelli all'interno dei dati strutturati utilizzando mezzi come l'apprendimento di modelli statistici e infine la valutazione e l'interpretazione dell'output.

Processo di analisi dei dati

L'analisi dei dati è definita dallo statistico John Tukey nel 1961 come "Procedure per analizzare i dati, tecniche per interpretare i risultati di tali procedure, modi di pianificare la raccolta dei dati per rendere la sua analisi più facile, più precisa o più accurata e tutti i macchinari e risultati di statistiche (matematiche) che si applicano all'analisi dei dati. "

Pertanto, l'analisi dei dati è un processo per ottenere dati di grandi dimensioni e non strutturati da varie fonti e convertirli in informazioni utili per:

  • Rispondendo alle domande
  • Verifica le ipotesi
  • Decision-making
  • Smentire le teorie

Analisi dei dati con Excel

Microsoft Excel fornisce diversi mezzi e modi per analizzare e interpretare i dati. I dati possono provenire da varie fonti. I dati possono essere convertiti e formattati in diversi modi. Può essere analizzato con i comandi, le funzioni e gli strumenti di Excel pertinenti: formattazione condizionale, intervalli, tabelle, funzioni di testo, funzioni di data, funzioni di tempo, funzioni finanziarie, totali parziali, analisi rapida, verifica delle formule, strumento di ricerca, analisi what-if, Risolutori, modello di dati, PowerPivot, PowerView, PowerMap, ecc.

Imparerai queste tecniche di analisi dei dati con Excel come parte di due parti:

  • Analisi dei dati con Excel e
  • Analisi avanzata dei dati con Excel