next up previous contents
Nächste Seite: 3.2 Daten Aufwärts: 3 Implementierung Vorherige Seite: 3 Implementierung   Inhalt

3.1 Vorüberlegungen

Während reine Textdokumente für die Textrepräsentation in ihre einzelnen Terme zerlegt werden, bietet es sich bei XML-Dokumenten an, darüber hinaus die Struktur des Dokuments miteinzubeziehen. Zu diesem Zweck können Paare von Tags und deren Inhalt gebildet werden; ein Tag <TITLE>Kleiner Test</TITLE> würde demnach zerlegt in die Menge {(TITLE, Kleiner), (TITLE, Test)}. Auf diese Weise beinhalten die entstehenden Features einen Kontextbezug, da über die DTD eines XML-Dokuments festgelegt ist, auf welche Weise Tags auseinander hervorgehen. Durch diese Kombination aus Struktur- und inhaltlicher Information erhält man also ein ,,strukturiertes Feature``.

Um diese strukturierten Features einfach zu halten, wird ein XML-Schema verwendet, daß auf Attribute in Tags verzichtet.