- Generisches Markup
- Beim generischen (oder symbolischen oder strukturellen o. ä.) Markup werden die Elemente eines Textes nach ihrer Funktion im Text ausgezeichnet, nicht nach ihrem Aussehen (wie es z. B. bei vielen Textverarbeitungsprogrammen üblich ist). Generisches Markup erlaubt es, die so ausgezeichneten Texte automatisch weiterzuverarbeiten.
- Die Wurzeln von XML sind HTML und SGML
- Die Hypertext Markup Language HTML war die erste wirklich populäre Auszeichnungssprache, ist aber für viele Anwendungen zu unflexibel. Die Standard Generalized Markup Language SGML bietet die bei HTML fehlende Flexibilität, ist aber für praktische Anwendungen im Web zu komplex. Die eXtensible Markup Language XML versucht ein Kompromiss zwischen beiden zu sein.
- Wohlgeformtes XML
- XML ist eine Teilmenge von SGML. XML soll als Auszeichnungssprache mit 20% der Komplexität 80% der Möglichkeiten von SGML bieten. Vor allem soll es einfacher zu verarbeiten sein. Dieses Ziel wird dadurch erreicht, dass strenge Syntaxregeln eingeführt werden, die bestimmen, wann ein XML-Dokument wohlgeformt ist.
- Gültigs XML
- Mit einer Document Type Definition (DTD) können formale Anforderungen an die Struktur eines wohlgeformten XML-Dokuments definiert werden. Eine DTD beschreibt eine Gammatik, die fest legt, welchen Inhalt ein Element haben darf. Die Syntax ähnelt dabei der von regulären Ausdrücken. Ein Dokument, dessen Struktur einer DTD entsprich, heißt ein gültiges XML-Dokument.
- Ergänzungen und Erweiterungen
- Auf der in den vorangehenden Abschnitte beschriebenen Grundlage von XML bauen verschiedene Empfehlungen auf, die XML um weitergehende Funktionalitäten erweitern sollen, wie die Adressierung beliebiger Teile eines Dokuments, die Kombination von Markup-Definitionen aus verschiedenen Gebieten und andere Konzeptionen von "Gültigkeit" eines Dokuments.
Weiter geht es mit einigen Reflexionen über rechten Gebrauch von XML.