Im folgenden Kapitel werden die theoretischen Grundlagen dieser Arbeit erläutert. Insbesondere wird dabei den Fragen nachgegangen, was unter automatischer Klassifikation zu verstehen ist, welche Methoden zur automatischen Klassifikation bereits existieren und worin die Besonderheiten und die Struktur von XML bestehen.
Einführend wird der Begriff des Information Retrieval als Grundlage der Klassifikation und aller damit zusammenhängender Begriffe geklärt.