Amazon Web Services - Redshift

Amazon Redshiftè un servizio di data warehouse completamente gestito nel cloud. I suoi set di dati vanno da centinaia di gigabyte a un petabyte. Il processo iniziale per creare un data warehouse è avviare una serie di risorse di calcolo chiamatenodes, che sono organizzati in gruppi chiamati cluster. Dopodiché puoi elaborare le tue domande.

Come configurare Amazon Redshift?

Di seguito sono riportati i passaggi per configurare Amazon Redshift.

Step 1 - Accedi e avvia un cluster Redshift utilizzando i seguenti passaggi.

  • Accedi alla console di gestione AWS e utilizza il seguente collegamento per aprire la console Amazon Redshift: https://console.aws.amazon.com/redshift/

  • Selezionare la regione in cui creare il cluster utilizzando il menu Regione nell'angolo in alto a destra dello schermo.

  • Fare clic sul pulsante Avvia cluster.

  • Viene visualizzata la pagina Dettagli cluster. Fornire i dettagli richiesti e fare clic sul pulsante Continua fino alla pagina di revisione.

  • Si apre una pagina di conferma. Fare clic sul pulsante Chiudi per terminare in modo che il cluster sia visibile nell'elenco dei cluster.

  • Selezionare il cluster nell'elenco e rivedere le informazioni sullo stato del cluster. La pagina mostrerà lo stato del cluster.

Step 2- Configurare il gruppo di sicurezza per autorizzare le connessioni client al cluster. L'autorizzazione all'accesso a Redshift dipende dal fatto che il client autorizzi o meno un'istanza EC2.

Segui questi passaggi per il gruppo di sicurezza sulla piattaforma EC2-VPC.

  • Apri la console Amazon Redshift e fai clic su Cluster nel pannello di navigazione.

  • Seleziona il cluster desiderato. Si apre la sua scheda Configurazione.

  • Fare clic sul gruppo di sicurezza.

  • Una volta aperta la pagina Gruppo di sicurezza, fare clic sulla scheda In entrata.

  • Fare clic sul pulsante Modifica. Impostare i campi come mostrato di seguito e fare clic sul pulsante Salva.

    • Type - Regola TCP personalizzata.

    • Protocol - TCP.

    • Port Range- Digitare lo stesso numero di porta utilizzato durante l'avvio del cluster. La porta predefinita per Amazon Redshift è 5439.

    • Source - Seleziona IP personalizzato, quindi digita 0.0.0.0/0.

Step 3 - Connettiti a Redshift Cluster.

Esistono due modi per connettersi a Redshift Cluster: direttamente o tramite SSL.

Di seguito sono riportati i passaggi per connettersi direttamente.

  • Connetti il ​​cluster utilizzando uno strumento client SQL. Supporta gli strumenti client SQL compatibili con i driver PostgreSQL JDBC o ODBC.

    Utilizzare i seguenti collegamenti per il download: JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar

    ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip o http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip per macchine a 64 bit

  • Utilizzare i passaggi seguenti per ottenere la stringa di connessione.

    • Apri la console Amazon Redshift e seleziona Cluster nel pannello di navigazione.

    • Seleziona il cluster di scelta e fai clic sulla scheda Configurazione.

    • Si apre una pagina come mostrato nella seguente schermata con l'URL JDBC in Proprietà database cluster. Copia l'URL.

  • Utilizzare i passaggi seguenti per connettere il cluster con SQL Workbench / J.

    • Apri SQL Workbench / J.

    • Seleziona il file e fai clic sulla finestra Connetti.

    • Seleziona Crea un nuovo profilo di connessione e inserisci i dettagli richiesti come nome, ecc.

    • Fare clic su Gestisci driver e si apre la finestra di dialogo Gestisci driver.

    • Fare clic sul pulsante Crea una nuova voce e inserire i dettagli richiesti.

  • Fare clic sull'icona della cartella e accedere alla posizione del driver. Infine, fai clic sul pulsante Apri.

  • Lasciare vuote le caselle Classname e Sample URL. Fare clic su OK.

  • Scegli il driver dall'elenco.

  • Nel campo URL, incolla l'URL JDBC copiato.

  • Immettere il nome utente e la password nei rispettivi campi.

  • Seleziona la casella Autocommit e fai clic su Salva elenco profili.

Caratteristiche di Amazon Redshift

Di seguito sono riportate le caratteristiche di Amazon Redshift:

  • Supports VPC - Gli utenti possono avviare Redshift all'interno di VPC e controllare l'accesso al cluster attraverso l'ambiente di rete virtuale.

  • Encryption - I dati archiviati in Redshift possono essere crittografati e configurati durante la creazione di tabelle in Redshift.

  • SSL - La crittografia SSL viene utilizzata per crittografare le connessioni tra i client e Redshift.

  • Scalable- Con pochi semplici clic, il numero di nodi può essere facilmente ridimensionato nel tuo data warehouse Redshift secondo i requisiti. Consente inoltre di scalare la capacità di archiviazione senza alcuna perdita di prestazioni.

  • Cost-effective- Amazon Redshift è un'alternativa conveniente alle pratiche di data warehousing tradizionali. Non ci sono costi iniziali, impegni a lungo termine e struttura dei prezzi su richiesta.