Apache Tajo - Installazione

Per installare Apache Tajo, è necessario disporre del seguente software sul sistema:

  • Hadoop versione 2.3 o successiva
  • Java versione 1.7 o successiva
  • Linux o Mac OS

Continuiamo ora con i seguenti passaggi per installare Tajo.

Verifica dell'installazione di Java

Si spera che tu abbia già installato Java versione 8 sulla tua macchina. Ora, devi solo procedere verificandolo.

Per verificare, utilizzare il seguente comando:

$ java -version

Se Java è installato correttamente sulla tua macchina, potresti vedere la versione attuale di Java installato. Se Java non è installato, segui questi passaggi per installare Java 8 sulla tua macchina.

Scarica JDK

Scarica l'ultima versione di JDK visitando il seguente collegamento, quindi scarica l'ultima versione.

https://www.oracle.com

L'ultima versione è JDK 8u 92 e il file è “jdk-8u92-linux-x64.tar.gz”. Scarica il file sulla tua macchina. Successivamente, estrai i file e spostali in una directory specifica. Ora, imposta le alternative Java. Infine, Java è installato sulla tua macchina.

Verifica dell'installazione di Hadoop

Hai già installato Hadoopsul tuo sistema. Ora, verificalo utilizzando il seguente comando:

$ hadoop version

Se tutto va bene con la tua configurazione, potresti vedere la versione di Hadoop. Se Hadoop non è installato, scarica e installa Hadoop visitando il seguente link:https://www.apache.org

Installazione di Apache Tajo

Apache Tajo fornisce due modalità di esecuzione: modalità locale e modalità completamente distribuita. Dopo aver verificato l'installazione di Java e Hadoop, procedere con i seguenti passaggi per installare il cluster Tajo sulla macchina. Un'istanza Tajo in modalità locale richiede configurazioni molto semplici.

Scarica l'ultima versione di Tajo visitando il seguente link - https://www.apache.org/dyn/closer.cgi/tajo

Ora puoi scaricare il file “tajo-0.11.3.tar.gz” dalla tua macchina.

Estrai file Tar

Estrai il file tar utilizzando il seguente comando:

$ cd opt/ 
$ tar tajo-0.11.3.tar.gz 
$ cd tajo-0.11.3

Imposta variabile d'ambiente

Aggiungi le seguenti modifiche a “conf/tajo-env.sh” file

$ cd tajo-0.11.3 
$ vi conf/tajo-env.sh
 
# Hadoop home. Required 
export HADOOP_HOME = /Users/path/to/Hadoop/hadoop-2.6.2
 
# The java implementation to use.  Required. 
export JAVA_HOME = /path/to/jdk1.8.0_92.jdk/

Qui, è necessario specificare Hadoop e il percorso Java per “tajo-env.sh”file. Dopo aver apportato le modifiche, salva il file e chiudi il terminale.

Avvia Tajo Server

Per avviare il server Tajo, eseguire il seguente comando:

$ bin/start-tajo.sh

Riceverai una risposta simile alla seguente:

Starting single TajoMaster 
starting master, logging to /Users/path/to/Tajo/tajo-0.11.3/bin/../ 
localhost: starting worker, logging to /Users/path/toe/Tajo/tajo-0.11.3/bin/../logs/
 
Tajo master web UI: http://local:26080 
Tajo Client Service: local:26002

Ora digita il comando "jps" per vedere i demoni in esecuzione.

$ jps  
1010 TajoWorker 
1140 Jps 
933 TajoMaster

Avvia Tajo Shell (Tsql)

Per avviare il client della shell Tajo, utilizzare il seguente comando:

$ bin/tsql

Riceverai il seguente output:

welcome to
   _____ ___  _____ ___ 
  /_  _/ _  |/_  _/   / 
   / // /_| |_/ // / / 
  /_//_/ /_/___/ \__/  0.11.3
  
Try \? for help.

Esci da Tajo Shell

Esegui il seguente comando per uscire da Tsql -

default> \q 
bye!

Qui, l'impostazione predefinita si riferisce al catalogo in Tajo.

Interfaccia utente Web

Digita il seguente URL per avviare l'interfaccia utente web Tajo - http://localhost:26080/

Ora vedrai la seguente schermata che è simile all'opzione ExecuteQuery.

Ferma Tajo

Per arrestare il server Tajo, utilizzare il seguente comando:

$ bin/stop-tajo.sh

Riceverai la seguente risposta:

localhost: stopping worker 
stopping master