next up previous contents
Nächste Seite: 3 Implementierung Aufwärts: 2 Theoretische Grundlagen Vorherige Seite: 2.4.3 Mutual Information   Inhalt


2.5 XML

Das World Wide Web Consortium (W3C) beschreibt die Extensible Markup Language (XML) in seiner Empfehlung (Recommendation) vom 6. Oktober 2000 wie folgt:

Extensible Markup Language, abbreviated XML, describes a class of data objects called XML documents and partially describes the behavior of computer programs which process them. XML is an application profile or restricted form of SGML, the Standard Generalized Markup Language [ISO 8879]. By construction, XML documents are conforming SGML documents. [W3C00]

XML ist demnach eine eingeschränkte Form von SGML und teilt somit viele seiner Eigenschaften. Im Gegensatz zu HTML, das ebenfalls aus SGML hervorgegangen ist, erlaubt XML die Definition eigener Tags. Auf diese Weise kann XML flexibel für die strukturierte Beschreibung verschiedenster Daten verwendet werden.

Mit Document Type Descriptions (DTD) wird die Struktur eines XML-Dokuments als Grammatik beschrieben, insbesondere wie die einzelnen Tags zueinander in Beziehung stehen. Weiterhin illustrieren die verschiedenen Möglichkeiten von Deklarationen in einer DTD die Mächtigkeit von XML. Ein XML-Dokument, daß den XML-Spezifikationen entspricht wird als wohlgeformt bezeichnet. Hält es sich zusätzlich noch an alle Regeln seiner DTD, so bezeichnet man es als gültig (vgl. [Eck00]). Zentrale Bestandteile einer DTD sind:

Ein Beispiel für eine einfach gehaltene DTD (ohne Attributdeklarationen), die im Rahmen dieser Arbeit entwickelt wurde, findet sich im Anhang A.1.


next up previous contents
Nächste Seite: 3 Implementierung Aufwärts: 2 Theoretische Grundlagen Vorherige Seite: 2.4.3 Mutual Information   Inhalt