Apache Presto - Connettore HIVE
Il connettore Hive consente di eseguire query sui dati archiviati in un data warehouse Hive.
Prerequisiti
- Hadoop
- Hive
Si spera che tu abbia installato Hadoop e Hive sulla tua macchina. Avvia tutti i servizi uno per uno nel nuovo terminale. Quindi, avvia hive metastore utilizzando il seguente comando,
hive --service metastore
Presto usa il servizio metastore Hive per ottenere i dettagli della tabella hive.
Impostazioni di configurazione
Crea un file “hive.properties” sotto “etc/catalog”directory. Usa il seguente comando.
$ cd etc
$ cd catalog
$ vi hive.properties
connector.name = hive-cdh4
hive.metastore.uri = thrift://localhost:9083
Dopo aver apportato tutte le modifiche, salva il file e chiudi il terminale.
Crea database
Crea un database in Hive utilizzando la seguente query:
Query
hive> CREATE SCHEMA tutorials;
Dopo aver creato il database, puoi verificarlo utilizzando il file “show databases” comando.
Crea tabella
Crea tabella è un'istruzione utilizzata per creare una tabella in Hive. Ad esempio, utilizza la seguente query.
hive> create table author(auth_id int, auth_name varchar(50),
topic varchar(100) STORED AS SEQUENCEFILE;
Inserisci tabella
La seguente query viene utilizzata per inserire record nella tabella di hive.
hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);
Avvia Presto CLI
Puoi avviare Presto CLI per connettere il plug-in di archiviazione Hive utilizzando il comando seguente.
$ ./presto --server localhost:8080 --catalog hive —schema tutorials;
Riceverai la seguente risposta.
presto:tutorials >
Schemi di elenco
Per elencare tutti gli schemi nel connettore Hive, digita il seguente comando.
Query
presto:tutorials > show schemas from hive;
Risultato
default
tutorials
Elenca tabelle
Per elencare tutte le tabelle nello schema "tutorial", utilizzare la seguente query.
Query
presto:tutorials > show tables from hive.tutorials;
Risultato
author
Recupera tabella
La seguente query viene utilizzata per recuperare tutti i record dalla tabella di hive.
Query
presto:tutorials > select * from hive.tutorials.author;
Risultato
auth_id | auth_name | topic
---------+----------------+--------
1 | Doug Cutting | Hadoop
2 | James Gosling | java
3 | Dennis Ritchie | C