5.2 Ausblick

Nächste Seite: A. Anhang Aufwärts: 5 Zusammenfassung Vorherige Seite: 5.1 Schlußfolgerungen Inhalt

5.2 Ausblick

Das Konzept von ,,strukturierten`` Features hat sich im Rahmen dieser Arbeit als durchaus konkurrenzfähig gegenüber der Dokumenten-Repräsentation durch Terme herausgestellt, und es ist denkbar, daß speziell auf diese Struktur zugeschnittene Methoden sogar bessere Ergebnisse erzielen können.

Aufgrund der Erkenntnisse bezüglich der verwendeten Daten wäre es sicherlich angebracht, die vorgestellten Methoden und Konzepte mit einer alternativen Datenbasis zu testen, wobei alternativ sowohl in Bezug auf Quantität als auch auf die Konstruktion der Datenbasis zu verstehen ist.

Weiterhin wäre es wünschenswert gewesen, einen weiteren Klassifikationalgorithmus, wie z. B. den k-Nearest-Neighbor-Klassifikator oder Support Vector Machines, zum Vergleich heranzuziehen. Diese Algorithmen werden nämlich in der Literatur zu der Problematik der automatischen Klassifikation von Textdokumenten als effiziente Klassifikationsverfahren beschrieben. Es wäre somit interessant, ob sich z. B. diese beiden Verfahren für die Klassifikation von XML-Dokumenten mit Hilfe ,,strukturierter`` Features eignen und ob diese das Naive-Bayes-Verfahren in seiner Leistungsfähigkeit übertreffen.