In den folgenden Kapiteln soll methodisch an die Thematik der automatischen Klassifikation von XML-Dokumenten herangegangen werden.
Kapitel 2 befaßt sich mit den theoretischen Grundlagen, wobei zuerst der Begriff des Information Retrieval geklärt wird (2.1). Im Anschluß daran wird die Bedeutung von hierarchischen Ontologien insbesondere für die Wissensrepräsentation betrachtet (2.2). Für die Pflege von hierarchischen Ontologien spielt die automatische Klassifikation (2.3) eine große Rolle; dabei verwendete Methoden sind die Naive-Bayes-Klassifikation (2.3.1), die k-Nearest-Neighbor-Klassifikation (2.3.2) und die Support Vector Machines (2.3.3). Zur Verbesserung von Klassifikationsverfahren in Bezug auf Qualität und Performance kann die Feature-Selektion (2.4) verwendet werden.
In Kapitel 2.5 wird auf die Struktur von XML-Dokumenten eingegangen.
Daraufhin werden im Kapitel 3 die Vorüberlegungen zur Implementierung erläutert und die technischen Details zusammengefaßt, die für die äußeren Bedingungen relevant sind, unter denen die Experimente zur Klassifikation von XML-Dokumenten (s. Kapitel 4) erfolgen.
Das abschließende Kapitel 5 dient der Zusammenfassung der gesamten Arbeit, wobei Schlußfolgerungen der Ergebnisse gezogen werden und ein Ausblick auf zukünftige Untersuchungen erfolgt.