DBMS distribuito - Database distribuiti

Questo capitolo introduce il concetto di DDBMS. In un database distribuito, ci sono un certo numero di database che possono essere distribuiti geograficamente in tutto il mondo. Un DBMS distribuito gestisce il database distribuito in modo che appaia come un unico database agli utenti. Nella parte successiva del capitolo, andremo a studiare i fattori che portano a database distribuiti, i suoi vantaggi e svantaggi.

UN distributed database è una raccolta di più database interconnessi, distribuiti fisicamente in varie posizioni che comunicano tramite una rete di computer.

Caratteristiche

  • I database nella raccolta sono logicamente correlati tra loro. Spesso rappresentano un unico database logico.

  • I dati vengono archiviati fisicamente su più siti. I dati in ogni sito possono essere gestiti da un DBMS indipendente dagli altri siti.

  • I processori nei siti sono collegati tramite una rete. Non hanno alcuna configurazione multiprocessore.

  • Un database distribuito non è un file system poco connesso.

  • Un database distribuito incorpora l'elaborazione delle transazioni, ma non è sinonimo di un sistema di elaborazione delle transazioni.

Sistema di gestione database distribuito

Un sistema di gestione del database distribuito (DDBMS) è un sistema software centralizzato che gestisce un database distribuito come se fosse tutto archiviato in un'unica posizione.

Caratteristiche

  • Viene utilizzato per creare, recuperare, aggiornare ed eliminare database distribuiti.

  • Sincronizza periodicamente il database e fornisce meccanismi di accesso in virtù dei quali la distribuzione diventa trasparente per gli utenti.

  • Assicura che i dati modificati in qualsiasi sito siano universalmente aggiornati.

  • Viene utilizzato in aree applicative in cui vengono elaborati grandi volumi di dati e l'accesso simultaneo a numerosi utenti.

  • È progettato per piattaforme di database eterogenee.

  • Mantiene la riservatezza e l'integrità dei dati dei database.

Fattori che incoraggiano il DDBMS

I seguenti fattori incoraggiano il passaggio a DDBMS:

  • Distributed Nature of Organizational Units- La maggior parte delle organizzazioni dei tempi attuali sono suddivise in più unità distribuite fisicamente in tutto il mondo. Ogni unità richiede il proprio set di dati locali. Pertanto, il database generale dell'organizzazione viene distribuito.

  • Need for Sharing of Data- Le molteplici unità organizzative hanno spesso bisogno di comunicare tra loro e condividere i propri dati e risorse. Ciò richiede database comuni o database replicati che dovrebbero essere utilizzati in modo sincronizzato.

  • Support for Both OLTP and OLAP- Online Transaction Processing (OLTP) e Online Analytical Processing (OLAP) funzionano su sistemi diversificati che possono avere dati comuni. I sistemi di database distribuiti aiutano entrambe queste elaborazioni fornendo dati sincronizzati.

  • Database Recovery- Una delle tecniche comuni utilizzate in DDBMS è la replica dei dati su diversi siti. La replica dei dati aiuta automaticamente nel recupero dei dati se il database in qualsiasi sito è danneggiato. Gli utenti possono accedere ai dati di altri siti durante la ricostruzione del sito danneggiato. Pertanto, l'errore del database può diventare quasi invisibile per gli utenti.

  • Support for Multiple Application Software- La maggior parte delle organizzazioni utilizza una varietà di software applicativo, ciascuno con il proprio supporto database specifico. DDBMS fornisce una funzionalità uniforme per l'utilizzo degli stessi dati su piattaforme diverse.

Vantaggi dei database distribuiti

Di seguito sono riportati i vantaggi dei database distribuiti rispetto ai database centralizzati.

Modular Development- Se il sistema deve essere espanso a nuove sedi o nuove unità, in sistemi di database centralizzati, l'azione richiede sforzi sostanziali e interruzioni del funzionamento esistente. Tuttavia, nei database distribuiti, il lavoro richiede semplicemente di aggiungere nuovi computer e dati locali al nuovo sito e infine collegarli al sistema distribuito, senza interruzioni nelle funzioni correnti.

More Reliable- In caso di malfunzionamenti del database, l'intero sistema di database centralizzati si arresta. Tuttavia, nei sistemi distribuiti, quando un componente si guasta, il funzionamento del sistema continua potrebbe avere prestazioni ridotte. Quindi DDBMS è più affidabile.

Better Response- Se i dati vengono distribuiti in modo efficiente, le richieste degli utenti possono essere soddisfatte dai dati locali stessi, fornendo così una risposta più rapida. D'altra parte, nei sistemi centralizzati, tutte le query devono passare attraverso il computer centrale per l'elaborazione, il che aumenta il tempo di risposta.

Lower Communication Cost- Nei sistemi di database distribuiti, se i dati si trovano localmente dove vengono utilizzati principalmente, i costi di comunicazione per la manipolazione dei dati possono essere ridotti al minimo. Ciò non è fattibile nei sistemi centralizzati.

Avversità dei database distribuiti

Di seguito sono riportate alcune delle avversità associate ai database distribuiti.

  • Need for complex and expensive software - DDBMS richiede un software complesso e spesso costoso per fornire trasparenza e coordinamento dei dati tra i diversi siti.

  • Processing overhead - Anche operazioni semplici possono richiedere un gran numero di comunicazioni e calcoli aggiuntivi per fornire l'uniformità dei dati nei siti.

  • Data integrity - La necessità di aggiornare i dati in più siti pone problemi di integrità dei dati.

  • Overheads for improper data distribution- La reattività delle query dipende in gran parte dalla corretta distribuzione dei dati. La distribuzione impropria dei dati spesso porta a una risposta molto lenta alle richieste degli utenti.