Amazon Web Services - Redshift
Amazon Redshiftè un servizio di data warehouse completamente gestito nel cloud. I suoi set di dati vanno da centinaia di gigabyte a un petabyte. Il processo iniziale per creare un data warehouse è avviare una serie di risorse di calcolo chiamatenodes, che sono organizzati in gruppi chiamati cluster. Dopodiché puoi elaborare le tue domande.
Come configurare Amazon Redshift?
Di seguito sono riportati i passaggi per configurare Amazon Redshift.
Step 1 - Accedi e avvia un cluster Redshift utilizzando i seguenti passaggi.
Accedi alla console di gestione AWS e utilizza il seguente collegamento per aprire la console Amazon Redshift: https://console.aws.amazon.com/redshift/
Selezionare la regione in cui creare il cluster utilizzando il menu Regione nell'angolo in alto a destra dello schermo.
Fare clic sul pulsante Avvia cluster.
Viene visualizzata la pagina Dettagli cluster. Fornire i dettagli richiesti e fare clic sul pulsante Continua fino alla pagina di revisione.
Si apre una pagina di conferma. Fare clic sul pulsante Chiudi per terminare in modo che il cluster sia visibile nell'elenco dei cluster.
Selezionare il cluster nell'elenco e rivedere le informazioni sullo stato del cluster. La pagina mostrerà lo stato del cluster.
Step 2- Configurare il gruppo di sicurezza per autorizzare le connessioni client al cluster. L'autorizzazione all'accesso a Redshift dipende dal fatto che il client autorizzi o meno un'istanza EC2.
Segui questi passaggi per il gruppo di sicurezza sulla piattaforma EC2-VPC.
Apri la console Amazon Redshift e fai clic su Cluster nel pannello di navigazione.
Seleziona il cluster desiderato. Si apre la sua scheda Configurazione.
Fare clic sul gruppo di sicurezza.
Una volta aperta la pagina Gruppo di sicurezza, fare clic sulla scheda In entrata.
Fare clic sul pulsante Modifica. Impostare i campi come mostrato di seguito e fare clic sul pulsante Salva.
Type - Regola TCP personalizzata.
Protocol - TCP.
Port Range- Digitare lo stesso numero di porta utilizzato durante l'avvio del cluster. La porta predefinita per Amazon Redshift è 5439.
Source - Seleziona IP personalizzato, quindi digita 0.0.0.0/0.
Step 3 - Connettiti a Redshift Cluster.
Esistono due modi per connettersi a Redshift Cluster: direttamente o tramite SSL.
Di seguito sono riportati i passaggi per connettersi direttamente.
Connetti il cluster utilizzando uno strumento client SQL. Supporta gli strumenti client SQL compatibili con i driver PostgreSQL JDBC o ODBC.
Utilizzare i seguenti collegamenti per il download: JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar
ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip o http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip per macchine a 64 bit
Utilizzare i passaggi seguenti per ottenere la stringa di connessione.
Apri la console Amazon Redshift e seleziona Cluster nel pannello di navigazione.
Seleziona il cluster di scelta e fai clic sulla scheda Configurazione.
Si apre una pagina come mostrato nella seguente schermata con l'URL JDBC in Proprietà database cluster. Copia l'URL.
Utilizzare i passaggi seguenti per connettere il cluster con SQL Workbench / J.
Apri SQL Workbench / J.
Seleziona il file e fai clic sulla finestra Connetti.
Seleziona Crea un nuovo profilo di connessione e inserisci i dettagli richiesti come nome, ecc.
Fare clic su Gestisci driver e si apre la finestra di dialogo Gestisci driver.
Fare clic sul pulsante Crea una nuova voce e inserire i dettagli richiesti.
Fare clic sull'icona della cartella e accedere alla posizione del driver. Infine, fai clic sul pulsante Apri.
Lasciare vuote le caselle Classname e Sample URL. Fare clic su OK.
Scegli il driver dall'elenco.
Nel campo URL, incolla l'URL JDBC copiato.
Immettere il nome utente e la password nei rispettivi campi.
Seleziona la casella Autocommit e fai clic su Salva elenco profili.
Caratteristiche di Amazon Redshift
Di seguito sono riportate le caratteristiche di Amazon Redshift:
Supports VPC - Gli utenti possono avviare Redshift all'interno di VPC e controllare l'accesso al cluster attraverso l'ambiente di rete virtuale.
Encryption - I dati archiviati in Redshift possono essere crittografati e configurati durante la creazione di tabelle in Redshift.
SSL - La crittografia SSL viene utilizzata per crittografare le connessioni tra i client e Redshift.
Scalable- Con pochi semplici clic, il numero di nodi può essere facilmente ridimensionato nel tuo data warehouse Redshift secondo i requisiti. Consente inoltre di scalare la capacità di archiviazione senza alcuna perdita di prestazioni.
Cost-effective- Amazon Redshift è un'alternativa conveniente alle pratiche di data warehousing tradizionali. Non ci sono costi iniziali, impegni a lungo termine e struttura dei prezzi su richiesta.