Apache Presto - Connettore HIVE

Il connettore Hive consente di eseguire query sui dati archiviati in un data warehouse Hive.

Prerequisiti

  • Hadoop
  • Hive

Si spera che tu abbia installato Hadoop e Hive sulla tua macchina. Avvia tutti i servizi uno per uno nel nuovo terminale. Quindi, avvia hive metastore utilizzando il seguente comando,

hive --service metastore

Presto usa il servizio metastore Hive per ottenere i dettagli della tabella hive.

Impostazioni di configurazione

Crea un file “hive.properties” sotto “etc/catalog”directory. Usa il seguente comando.

$ cd etc 
$ cd catalog 
$ vi hive.properties  

connector.name = hive-cdh4 
hive.metastore.uri = thrift://localhost:9083

Dopo aver apportato tutte le modifiche, salva il file e chiudi il terminale.

Crea database

Crea un database in Hive utilizzando la seguente query:

Query

hive> CREATE SCHEMA tutorials;

Dopo aver creato il database, puoi verificarlo utilizzando il file “show databases” comando.

Crea tabella

Crea tabella è un'istruzione utilizzata per creare una tabella in Hive. Ad esempio, utilizza la seguente query.

hive> create table author(auth_id int, auth_name varchar(50), 
topic varchar(100) STORED AS SEQUENCEFILE;

Inserisci tabella

La seguente query viene utilizzata per inserire record nella tabella di hive.

hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);

Avvia Presto CLI

Puoi avviare Presto CLI per connettere il plug-in di archiviazione Hive utilizzando il comando seguente.

$ ./presto --server localhost:8080 --catalog hive —schema tutorials;

Riceverai la seguente risposta.

presto:tutorials >

Schemi di elenco

Per elencare tutti gli schemi nel connettore Hive, digita il seguente comando.

Query

presto:tutorials > show schemas from hive;

Risultato

default  

tutorials

Elenca tabelle

Per elencare tutte le tabelle nello schema "tutorial", utilizzare la seguente query.

Query

presto:tutorials > show tables from hive.tutorials;

Risultato

author

Recupera tabella

La seguente query viene utilizzata per recuperare tutti i record dalla tabella di hive.

Query

presto:tutorials > select * from hive.tutorials.author;

Risultato

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C