Python - Configurazione dell'ambiente di scienza dei dati

Per creare ed eseguire con successo il codice di esempio in questo tutorial, avremo bisogno di un ambiente configurato che avrà sia python generico che i pacchetti speciali richiesti per la scienza dei dati. Per prima cosa guarderemo come installare il python generico che può essere python 2 o python 3. Ma preferiremo python 2 per questo tutorial principalmente a causa della sua maturità e del più ampio supporto di pacchetti esterni.

Ottenere Python

Il codice sorgente, i binari, la documentazione, le notizie, ecc. Più aggiornati e attuali sono disponibili sul sito Web ufficiale di Python https://www.python.org/

Puoi scaricare la documentazione di Python da https://www.python.org/doc/. La documentazione è disponibile nei formati HTML, PDF e PostScript.

Installazione di Python

La distribuzione di Python è disponibile per un'ampia varietà di piattaforme. Devi scaricare solo il codice binario applicabile alla tua piattaforma e installare Python.

Se il codice binario per la tua piattaforma non è disponibile, hai bisogno di un compilatore C per compilare manualmente il codice sorgente. La compilazione del codice sorgente offre maggiore flessibilità in termini di scelta delle funzionalità richieste durante l'installazione.

Ecco una rapida panoramica dell'installazione di Python su varie piattaforme:

Installazione di Unix e Linux

Ecco i semplici passaggi per installare Python su macchine Unix / Linux.

  • Apri un browser Web e vai a https://www.python.org/downloads/.

  • Segui il link per scaricare il codice sorgente zippato disponibile per Unix / Linux.

  • Scarica ed estrai file.

  • Modificare il file Modules / Setup se si desidera personalizzare alcune opzioni.

  • eseguire lo script ./configure

  • make

  • fare installazione

Questo installa Python nella posizione standard / usr / local / bin e le sue librerie in / usr / local / lib / pythonXX dove XX è la versione di Python.

Installazione di Windows

Ecco i passaggi per installare Python su macchina Windows.

  • Apri un browser Web e vai a https://www.python.org/downloads/.

  • Segui il collegamento per il file python-XYZ.msi del programma di installazione di Windows in cui XYZ è la versione che devi installare.

  • Per utilizzare questo programma di installazione python-XYZ.msi , il sistema Windows deve supportare Microsoft Installer 2.0. Salva il file di installazione sul tuo computer locale e poi eseguilo per scoprire se il tuo computer supporta MSI.

  • Esegui il file scaricato. Questo fa apparire la procedura guidata di installazione di Python, che è davvero facile da usare. Accetta le impostazioni predefinite, attendi fino al termine dell'installazione e il gioco è fatto.

Installazione su Macintosh

I Mac recenti vengono forniti con Python installato, ma potrebbe essere obsoleto di diversi anni. Vederehttp://www.python.org/download/mac/per istruzioni su come ottenere la versione corrente insieme a strumenti aggiuntivi per supportare lo sviluppo su Mac. Per Mac OS precedenti a Mac OS X 10.3 (rilasciato nel 2003), è disponibile MacPython.

Jack Jansen lo mantiene e puoi avere pieno accesso all'intera documentazione sul suo sito web - http://www.cwi.nl/~jack/macpython.html. È possibile trovare i dettagli completi dell'installazione per l'installazione di Mac OS.

Configurazione di PATH

Programmi e altri file eseguibili possono trovarsi in molte directory, quindi i sistemi operativi forniscono un percorso di ricerca che elenca le directory in cui il sistema operativo cerca gli eseguibili.

Il percorso è memorizzato in una variabile di ambiente, che è una stringa denominata gestita dal sistema operativo. Questa variabile contiene le informazioni disponibili per la shell dei comandi e altri programmi.

Il path la variabile è denominata PATH in Unix o Path in Windows (Unix fa distinzione tra maiuscole e minuscole; Windows no).

In Mac OS, il programma di installazione gestisce i dettagli del percorso. Per richiamare l'interprete Python da una directory particolare, è necessario aggiungere la directory Python al percorso.

Impostazione del percorso su Unix / Linux

Per aggiungere la directory Python al percorso per una particolare sessione in Unix -

  • In the csh shell - digita setenv PATH "$ PATH: / usr / local / bin / python" e premi Invio.

  • In the bash shell (Linux) - digita export ATH = "$ PATH: / usr / local / bin / python" e premi Invio.

  • In the sh or ksh shell - digita PATH = "$ PATH: / usr / local / bin / python" e premi Invio.

  • Note - / usr / local / bin / python è il percorso della directory Python

Impostazione del percorso in Windows

Per aggiungere la directory Python al percorso di una particolare sessione in Windows:

At the command prompt - digita path% path%; C: \ Python e premi Invio.

Note - C: \ Python è il percorso della directory Python

Variabili d'ambiente Python

Qui ci sono importanti variabili d'ambiente, che possono essere riconosciute da Python -

Sr.No. Variabile e descrizione
1

PYTHONPATH

Ha un ruolo simile a PATH. Questa variabile indica all'interprete Python dove individuare i file del modulo importati in un programma. Dovrebbe includere la directory della libreria sorgente Python e le directory contenenti il ​​codice sorgente Python. PYTHONPATH a volte è preimpostato dall'installer di Python.

2

PYTHONSTARTUP

Contiene il percorso di un file di inizializzazione contenente il codice sorgente Python. Viene eseguito ogni volta che si avvia l'interprete. Si chiama .pythonrc.py in Unix e contiene comandi che caricano utilità o modificano PYTHONPATH.

3

PYTHONCASEOK

Viene utilizzato in Windows per istruire Python a trovare la prima corrispondenza senza distinzione tra maiuscole e minuscole in un'istruzione import. Impostare questa variabile su qualsiasi valore per attivarla.

4

PYTHONHOME

È un percorso di ricerca del modulo alternativo. Di solito è incorporato nelle directory PYTHONSTARTUP o PYTHONPATH per semplificare la commutazione delle librerie dei moduli.

Esecuzione di Python

Esistono tre modi diversi per avviare Python:

Interprete interattivo

Puoi avviare Python da Unix, DOS o qualsiasi altro sistema che ti fornisce un interprete della riga di comando o una finestra della shell.

accedere python la riga di comando.

Inizia subito a scrivere codice nell'interprete interattivo.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Ecco l'elenco di tutte le opzioni disponibili della riga di comando:

Sr.No. Opzione e descrizione
1

-d

Fornisce l'output di debug.

2

-O

Genera bytecode ottimizzato (risultante in file .pyo).

3

-S

Non eseguire il sito di importazione per cercare i percorsi Python all'avvio.

4

-v

output dettagliato (traccia dettagliata sulle istruzioni di importazione).

5

-X

disabilitare le eccezioni incorporate basate sulla classe (basta usare le stringhe); obsoleto a partire dalla versione 1.6.

6

-c cmd

eseguire lo script Python inviato come stringa cmd

7

file

eseguire lo script Python da un determinato file

Script dalla riga di comando

Uno script Python può essere eseguito dalla riga di comando invocando l'interprete sulla tua applicazione, come di seguito:

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Note - Assicurati che la modalità di autorizzazione del file consenta l'esecuzione.

Ambiente di sviluppo integrato

Puoi eseguire Python anche da un ambiente GUI (Graphical User Interface), se hai un'applicazione GUI sul tuo sistema che supporta Python.

  • Unix - IDLE è il primo IDE Unix per Python.

  • Windows - PythonWin è la prima interfaccia Windows per Python ed è un IDE con una GUI.

  • Macintosh - La versione Macintosh di Python insieme all'IDE IDE è disponibile dal sito Web principale, scaricabile come file MacBinary o BinHex.

Installazione di SciPy Pack

Il modo migliore per abilitare i pacchetti richiesti è utilizzare un pacchetto binario installabile specifico per il proprio sistema operativo. Questi binari contengono lo stack SciPy completo (inclusi NumPy, SciPy, matplotlib, IPython, SymPy e i pacchetti nose insieme al core Python).

finestre

Anaconda (da www.continuum.io ) è una distribuzione Python gratuita per lo stack SciPy. È disponibile anche per Linux e Mac.

Canopy ( www.enthought.com/products/canopy/ ) è disponibile come distribuzione gratuita e commerciale con lo stack SciPy completo per Windows, Linux e Mac.

Python (x, y): è una distribuzione Python gratuita con stack SciPy e Spyder IDE per il sistema operativo Windows. (Scaricabile da www.python-xy.github.io/ )

Linux

I gestori di pacchetti delle rispettive distribuzioni Linux vengono utilizzati per installare uno o più pacchetti nello stack SciPy.

Per Ubuntu

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

Per Fedora

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

Costruire dalla sorgente

Core Python (2.6.x, 2.7.xe 3.2.x in poi) deve essere installato con distutils e il modulo zlib dovrebbe essere abilitato.

Il compilatore C GNU gcc (4.2 e superiori) deve essere disponibile.

Per installare NumPy, esegui il seguente comando.

Python setup.py install

Testiamo se il modulo NumPy è installato correttamente, prova ad importarlo dal prompt di Python.

Se non è installato, verrà visualizzato il seguente messaggio di errore.

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

Allo stesso modo possiamo verificare l'installazione di tutti i pacchetti Data Science richiesti mostrati nei prossimi capitoli.