XML - Sintassi

In questo capitolo, discuteremo le semplici regole di sintassi per scrivere un documento XML. Di seguito è riportato un documento XML completo:

<?xml version = "1.0"?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

Puoi notare che ci sono due tipi di informazioni nell'esempio sopra:

  • Markup, come <contact-info>

  • Il testo o i dati del carattere, Punto tutorial e (040) 123-4567 .

Il diagramma seguente illustra le regole di sintassi per scrivere diversi tipi di markup e testo in un documento XML.

Vediamo in dettaglio ogni componente del diagramma sopra.

Dichiarazione XML

Il documento XML può opzionalmente avere una dichiarazione XML. È scritto come segue:

<?xml version = "1.0" encoding = "UTF-8"?>

Dove versione è la versione XML e codifica specifica la codifica dei caratteri utilizzata nel documento.

Regole di sintassi per la dichiarazione XML

  • La dichiarazione XML fa distinzione tra maiuscole e minuscole e deve iniziare con "<?xml>" dove "xml"è scritto in minuscolo.

  • Se il documento contiene una dichiarazione XML, deve essere strettamente la prima dichiarazione del documento XML.

  • La dichiarazione XML deve essere strettamente la prima dichiarazione nel documento XML.

  • Un protocollo HTTP può sovrascrivere il valore di codifica inserito nella dichiarazione XML.

Tag ed elementi

Un file XML è strutturato da diversi elementi XML, chiamati anche nodi XML o tag XML. I nomi degli elementi XML sono racchiusi tra parentesi triangolari <> come mostrato di seguito -

<element>

Regole di sintassi per tag ed elementi

Element Syntax - Ogni elemento XML deve essere chiuso con gli elementi di inizio o di fine come mostrato di seguito -

<element>....</element>

o in casi semplici, proprio in questo modo -

<element/>

Nesting of Elements- Un elemento XML può contenere più elementi XML come suoi figli, ma gli elementi figli non devono sovrapporsi. cioè, un tag di fine di un elemento deve avere lo stesso nome di quello del tag di inizio senza corrispondenza più recente.

L'esempio seguente mostra tag nidificati non corretti:

<?xml version = "1.0"?>
<contact-info>
<company>TutorialsPoint
</contact-info>
</company>

L'esempio seguente mostra i tag nidificati corretti:

<?xml version = "1.0"?>
<contact-info>
   <company>TutorialsPoint</company>
<contact-info>

Root Element- Un documento XML può avere un solo elemento radice. Ad esempio, quello che segue non è un documento XML corretto, perché sia ​​il filex e y gli elementi si verificano al livello superiore senza un elemento radice -

<x>...</x>
<y>...</y>

L'esempio seguente mostra un documento XML formato correttamente:

<root>
   <x>...</x>
   <y>...</y>
</root>

Case Sensitivity- I nomi degli elementi XML fanno distinzione tra maiuscole e minuscole. Ciò significa che il nome dell'elemento iniziale e quello finale devono essere esattamente nello stesso caso.

Per esempio, <contact-info> è diverso da <Contact-Info>

Attributi XML

Un attributespecifica una singola proprietà per l'elemento, utilizzando una coppia nome / valore. Un elemento XML può avere uno o più attributi. Ad esempio:

<a href = "http://www.tutorialspoint.com/">Tutorialspoint!</a>

Qui href è il nome dell'attributo e http://www.tutorialspoint.com/ è il valore dell'attributo.

Regole di sintassi per attributi XML

  • I nomi degli attributi in XML (a differenza dell'HTML) fanno distinzione tra maiuscole e minuscole. Cioè, HREF e href sono considerati due diversi attributi XML.

  • Lo stesso attributo non può avere due valori in una sintassi. L'esempio seguente mostra una sintassi errata perché l'attributo b è specificato due volte

    -
<a b = "x" c = "y" b = "z">....</a>
  • I nomi degli attributi sono definiti senza virgolette, mentre i valori degli attributi devono sempre apparire tra virgolette. L'esempio seguente mostra una sintassi xml errata

    -
<a b = x>....</a>

Nella sintassi precedente, il valore dell'attributo non è definito tra virgolette.

Riferimenti XML

I riferimenti in genere consentono di aggiungere o includere testo o markup aggiuntivo in un documento XML. I riferimenti iniziano sempre con il simbolo"&" che è un carattere riservato e termina con il simbolo ";". XML ha due tipi di riferimenti:

  • Entity References- Un riferimento all'entità contiene un nome tra i delimitatori di inizio e di fine. Per esempio&amp;dove amp è il nome . Il nome si riferisce a una stringa di testo e / o markup predefinita.

  • Character References - Questi contengono riferimenti, come &#65;, contiene un segno cancelletto ("#") seguito da un numero. Il numero si riferisce sempre al codice Unicode di un carattere. In questo caso, 65 si riferisce all'alfabeto "A".

Testo XML

I nomi degli elementi XML e degli attributi XML fanno distinzione tra maiuscole e minuscole, il che significa che il nome degli elementi iniziale e finale devono essere scritti nello stesso caso. Per evitare problemi di codifica dei caratteri, tutti i file XML devono essere salvati come file Unicode UTF-8 o UTF-16.

I caratteri di spazio vuoto come spazi, tabulazioni e interruzioni di riga tra gli elementi XML e tra gli attributi XML verranno ignorati.

Alcuni caratteri sono riservati dalla sintassi XML stessa. Quindi, non possono essere utilizzati direttamente. Per usarli, vengono utilizzate alcune entità di sostituzione, elencate di seguito:

Carattere non consentito Entità sostitutiva Descrizione del personaggio
< & lt; meno di
> & gt; più grande di
& & amp; e commerciale
' & apos; apostrofo
" & quot; Virgolette