Hive - Funzioni integrate

Questo capitolo spiega le funzioni integrate disponibili in Hive. Le funzioni sono abbastanza simili alle funzioni SQL, tranne per il loro utilizzo.

Funzioni integrate

Hive supporta le seguenti funzioni integrate:

Tipo di ritorno Firma Descrizione
BIGINT rotondo (doppia a) Restituisce il valore BIGINT arrotondato del double.
BIGINT pavimento (doppia a) Restituisce il valore BIGINT massimo che è uguale o inferiore al doppio.
BIGINT ceil (doppia a) Restituisce il valore BIGINT minimo che è uguale o maggiore del double.
Doppio rand (), rand (int seed) Restituisce un numero casuale che cambia da riga a riga.
corda concat (stringa A, stringa B, ...) Restituisce la stringa risultante dalla concatenazione di B dopo A.
corda substr (stringa A, int inizio) Restituisce la sottostringa di A a partire dalla posizione iniziale fino alla fine della stringa A.
corda substr (stringa A, int inizio, int lunghezza) Restituisce la sottostringa di A a partire dalla posizione iniziale con la lunghezza data.
corda superiore (stringa A) Restituisce la stringa risultante dalla conversione di tutti i caratteri di A in maiuscolo.
corda ucase (stringa A) Come sopra.
corda inferiore (stringa A) Restituisce la stringa risultante dalla conversione di tutti i caratteri di B in minuscolo.
corda lcase (stringa A) Come sopra.
corda trim (stringa A) Restituisce la stringa risultante dal taglio degli spazi da entrambe le estremità di A.
corda ltrim (stringa A) Restituisce la stringa risultante dal taglio degli spazi dall'inizio (lato sinistro) di A.
corda rtrim (stringa A) rtrim (stringa A) Restituisce la stringa risultante dal taglio degli spazi dalla fine (lato destro) di A.
corda regexp_replace (stringa A, stringa B, stringa C) Restituisce la stringa risultante dalla sostituzione di tutte le sottostringhe in B che corrispondono alla sintassi dell'espressione regolare Java con C.
int dimensione (mappa <KV>) Restituisce il numero di elementi nel tipo di mappa.
int dimensione (Array <T>) Restituisce il numero di elementi nel tipo di matrice.
valore di <type> cast (<expr> come <type>) Converte i risultati dell'espressione expr in <type> es. Cast ('1' as BIGINT) converte la stringa '1' in una sua rappresentazione integrale. Se la conversione non riesce, viene restituito un valore NULL.
corda from_unixtime (int unixtime) converte il numero di secondi dall'epoca Unix (1970-01-01 00:00:00 UTC) in una stringa che rappresenta il timestamp di quel momento nel fuso orario del sistema corrente nel formato "1970-01-01 00:00: 00 "
corda to_date (stringa timestamp) Restituisce la parte della data di una stringa timestamp: to_date ("1970-01-01 00:00:00") = "1970-01-01"
int anno (data stringa) Restituisce la parte relativa all'anno di una data o una stringa di timestamp: anno ("1970-01-01 00:00:00") = 1970, anno ("1970-01-01") = 1970
int mese (data stringa) Restituisce la parte relativa al mese di una data o una stringa di timestamp: month ("1970-11-01 00:00:00") = 11, month ("1970-11-01") = 11
int giorno (data stringa) Restituisce la parte relativa al giorno di una data o una stringa di timestamp: day ("1970-11-01 00:00:00") = 1, day ("1970-11-01") = 1
corda get_json_object (stringa json_string, percorso stringa) Estrae l'oggetto json da una stringa json in base al percorso json specificato e restituisce la stringa json dell'oggetto json estratto. Restituisce NULL se la stringa json di input non è valida.

Esempio

Le seguenti query dimostrano alcune funzioni integrate:

funzione round ()

hive> SELECT round(2.6) from temp;

In caso di corretta esecuzione della query, viene visualizzata la seguente risposta:

3.0

funzione floor ()

hive> SELECT floor(2.6) from temp;

In caso di corretta esecuzione della query, viene visualizzata la seguente risposta:

2.0

funzione ceil ()

hive> SELECT ceil(2.6) from temp;

In caso di corretta esecuzione della query, viene visualizzata la seguente risposta:

3.0

Funzioni aggregate

Hive supporta il seguente built-in aggregate functions. L'utilizzo di queste funzioni è lo stesso delle funzioni di aggregazione SQL.

Tipo di ritorno Firma Descrizione
BIGINT count (*), count (expr), count (*) - Restituisce il numero totale di righe recuperate.
DOPPIO sum (col), sum (DISTINCT col) Restituisce la somma degli elementi nel gruppo o la somma dei valori distinti della colonna nel gruppo.
DOPPIO avg (col), avg (DISTINCT col) Restituisce la media degli elementi nel gruppo o la media dei valori distinti della colonna nel gruppo.
DOPPIO min (col) Restituisce il valore minimo della colonna nel gruppo.
DOPPIO max (col) Restituisce il valore massimo della colonna nel gruppo.