Python - Serie temporali

Le serie temporali sono una serie di punti dati in cui ogni punto dati è associato a un timestamp. Un semplice esempio è il prezzo di un'azione nel mercato azionario in diversi momenti in un dato giorno. Un altro esempio è la quantità di pioggia in una regione in diversi mesi dell'anno.

Nell'esempio seguente prendiamo il valore dei prezzi delle azioni ogni giorno per un trimestre per un particolare simbolo di borsa. Catturiamo questi valori come file csv e quindi li organizziamo in un dataframe utilizzando la libreria pandas. Abbiamo quindi impostato il campo della data come indice del dataframe ricreando la colonna Valuedate aggiuntiva come indice ed eliminando la vecchia colonna Valuedate.

Dati di esempio

Di seguito sono riportati i dati di esempio per il prezzo del titolo in giorni diversi di un determinato trimestre. I dati vengono salvati in un file denominato stock.csv

ValueDate	Price
01-01-2018,	1042.05
02-01-2018,	1033.55
03-01-2018,	1029.7
04-01-2018,	1021.3
05-01-2018,	1015.4
...
...
...
...
23-03-2018,	1161.3
26-03-2018,	1167.6
27-03-2018,	1155.25
28-03-2018,	1154

Creazione di serie storiche

from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])

# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']


df.plot(figsize=(15, 6))
plt.show()

Suo output è il seguente -