XML - Die Grundlagen

Die folgenden Seiten geben einen Überblick über die Motivation hinter XML und einige wichtige Definitionen aus dem Umfeld der Sprache.
Generisches Markup
Beim generischen (oder symbolischen oder strukturellen o. ä.) Markup werden die Elemente eines Textes nach ihrer Funktion im Text ausgezeichnet, nicht nach ihrem Aussehen (wie es z. B. bei vielen [Ext. Link]Textverarbeitungsprogrammen üblich ist). Generisches Markup erlaubt es, die so ausgezeichneten Texte automatisch weiterzuverarbeiten.
Die Wurzeln von XML sind HTML und SGML
Die Hypertext Markup Language HTML war die erste wirklich populäre Auszeichnungssprache, ist aber für viele Anwendungen zu unflexibel. Die Standard Generalized Markup Language SGML bietet die bei HTML fehlende Flexibilität, ist aber für praktische Anwendungen im Web zu komplex. Die eXtensible Markup Language XML versucht ein Kompromiss zwischen beiden zu sein.
Wohlgeformtes XML
XML ist eine Teilmenge von SGML. XML soll als Auszeichnungssprache mit 20% der Komplexität 80% der Möglichkeiten von SGML bieten. Vor allem soll es einfacher zu verarbeiten sein. Dieses Ziel wird dadurch erreicht, dass strenge Syntaxregeln eingeführt werden, die bestimmen, wann ein XML-Dokument wohlgeformt ist.
Gültigs XML
Mit einer Document Type Definition (DTD) können formale Anforderungen an die Struktur eines wohlgeformten XML-Dokuments definiert werden. Eine DTD beschreibt eine Gammatik, die fest legt, welchen Inhalt ein Element haben darf. Die Syntax ähnelt dabei der von regulären Ausdrücken. Ein Dokument, dessen Struktur einer DTD entsprich, heißt ein gültiges XML-Dokument.
Ergänzungen und Erweiterungen
Auf der in den vorangehenden Abschnitte beschriebenen Grundlage von XML bauen verschiedene Empfehlungen auf, die XML um weitergehende Funktionalitäten erweitern sollen, wie die Adressierung beliebiger Teile eines Dokuments, die Kombination von Markup-Definitionen aus verschiedenen Gebieten und andere Konzeptionen von "Gültigkeit" eines Dokuments.

Weiter geht es mit einigen Reflexionen über rechten Gebrauch von XML.

Florian Hars <florian@hars.de>, 2007-10-15 (orig: 2000-06-14)