XML - entità carattere

Questo capitolo descrive l'XML Character Entities. Prima di comprendere le entità carattere, dobbiamo prima capire cos'è un'entità XML.

Come indicato da W3 Consortium, la definizione di entità è la seguente:

"L'entità documento funge da radice dell'albero delle entità e da punto di partenza per un processore XML".

Ciò significa che le entità sono i segnaposto in XML. Questi possono essere dichiarati nel prologo del documento o in un DTD. Esistono diversi tipi di entità e in questo capitolo discuteremo di Character Entity.

Entrambi, HTML e XML, hanno alcuni simboli riservati al loro utilizzo, che non possono essere utilizzati come contenuto nel codice XML. Per esempio,< e >i segni vengono utilizzati per aprire e chiudere i tag XML. Per visualizzare questi caratteri speciali, vengono utilizzate le entità carattere.

Ci sono pochi caratteri speciali o simboli che non possono essere digitati direttamente dalla tastiera. Le entità carattere possono essere utilizzate anche per visualizzare quei simboli / caratteri speciali.

Tipi di entità carattere

Esistono tre tipi di entità carattere:

  • Entità carattere predefinite
  • Entità di caratteri numerati
  • Entità personaggio con nome

Entità carattere predefinite

Vengono introdotti per evitare l'ambiguità durante l'utilizzo di alcuni simboli. Ad esempio, si osserva un'ambiguità quando minore di (< ) o maggiore di ( > ) viene utilizzato con il tag dell'angolo (<>). Le entità carattere sono fondamentalmente utilizzate per delimitare i tag in XML. Di seguito è riportato un elenco di entità carattere predefinite dalla specifica XML. Questi possono essere usati per esprimere caratteri senza ambiguità.

  • E commerciale - &amp;

  • Virgoletta singola - &apos;

  • Maggiore di - &gt;

  • Meno di - &lt;

  • Virgolette doppie - &quot;

Entità di caratteri numerici

Il riferimento numerico viene utilizzato per fare riferimento a un'entità carattere. Il riferimento numerico può essere in formato decimale o esadecimale. Poiché sono disponibili migliaia di riferimenti numerici, questi sono un po 'difficili da ricordare. Il riferimento numerico si riferisce al carattere tramite il suo numero nel set di caratteri Unicode.

La sintassi generale per il riferimento numerico decimale è -

&# decimal number ;

La sintassi generale per il riferimento numerico esadecimale è -

&#x Hexadecimal number ;

La tabella seguente elenca alcune entità carattere predefinite con i loro valori numerici:

Nome dell'entità Personaggio Riferimento decimale Riferimento esadecimale
quot " & # 34; & # x22;
amp & & # 38; & # x26;
apos ' & # 39; & # x27;
lt < & # 60; & # x3C;
gt > & # 62; & # x3E;

Entità personaggio con nome

Poiché è difficile ricordare i caratteri numerici, il tipo più preferito di entità carattere è l'entità carattere nominata. Qui, ogni entità è identificata con un nome.

Ad esempio:

  • "Aacute" rappresenta il carattere maiuscolo con accento acuto.

  • 'ugrave' rappresenta il piccolo con accento grave.