Serie storica - Metriche di errore
Per noi è importante quantificare le prestazioni di un modello per utilizzarlo come feedback e confronto. In questo tutorial abbiamo utilizzato uno dei più popolari errori quadratici medi della radice della metrica. Sono disponibili varie altre metriche di errore. Questo capitolo li discute in breve.
Errore quadratico medio
È la media del quadrato della differenza tra i valori previsti e i valori veri. Sklearn lo fornisce come una funzione. Ha le stesse unità dei valori vero e previsto al quadrato ed è sempre positivo.
$$ MSE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ lgroup y '_ {t} \: - y_ {t} \ rgroup ^ {2} $$
Dove $ y '_ {t} $ è il valore previsto,
$ y_ {t} $ è il valore effettivo e
n è il numero totale di valori nel set di test.
È chiaro dall'equazione che MSE è più penalizzante per errori più grandi o valori anomali.
Root Mean Square Error
È la radice quadrata dell'errore quadratico medio. Inoltre è sempre positivo e rientra nell'intervallo dei dati.
$$ RMSE = \ sqrt {\ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ lgroup y '_ {t} -y_ {t} \ rgroup ^ 2} $$
Dove, $ y '_ {t} $ è il valore previsto
$ y_ {t} $ è il valore effettivo e
n è il numero totale di valori nel set di test.
È nel potere dell'unità e quindi è più interpretabile rispetto a MSE. RMSE è anche più penalizzante per errori più grandi. Abbiamo utilizzato la metrica RMSE nel nostro tutorial.
Errore assoluto medio
È la media della differenza assoluta tra i valori previsti e i valori reali. Ha le stesse unità del valore previsto e reale ed è sempre positivo.
$$ MAE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ {t = n} | y '{t} -y_ {t} \ lvert $$
Dove, $ y '_ {t} $ è il valore previsto,
$ y_ {t} $ è il valore effettivo e
n è il numero totale di valori nel set di test.
Errore percentuale medio
È la percentuale della media della differenza assoluta tra i valori previsti e i valori veri, divisa per il valore reale.
$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {y '_ {t} -y_ {t}} {y_ {t}} * 100 \: \% $$
Dove, $ y '_ {t} $ è il valore previsto,
$ y_ {t} $ è il valore effettivo en è il numero totale di valori nel set di test.
Tuttavia, lo svantaggio dell'utilizzo di questo errore è che l'errore positivo e gli errori negativi possono compensarsi a vicenda. Quindi viene utilizzato l'errore percentuale medio assoluto.
Errore percentuale medio assoluto
È la percentuale della media della differenza assoluta tra i valori previsti e i valori veri, divisa per il valore reale.
$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {| y '_ {t} -y_ {t} \ lvert} {y_ {t}} * 100 \: \% $$
Dove $ y '_ {t} $ è il valore previsto
$ y_ {t} $ è il valore effettivo e
n è il numero totale di valori nel set di test.