|
Abstract |
Motiviert durch WebWatcher, einen Tour-Guide-Agenten für das World Wide
Web (WWW), wird die Frage untersucht, wie das von WebWatcher benötigte
Wissen mit Methoden des maschinellen Lernens automatisch gelernt werden
kann. WebWatchers Aufgabe ist es, Benutzer beim Browsing auf dem WWW
zu begleiten und jeweils vielversprechende Hyperlinks auf der aktuellen
Seite hervorzuheben. Zwei Informationsquellen, aus denen Wissen hierfür
gelernt
werden kann, werden aufgezeigt. Zum einen wird gezeigt, wie mit Methoden
der Textkategorisierung aus Touren von vorangegangenen Benutzern gelernt
werden kann. Zum anderen wird das Problem mit Methoden des Reinforcement
Learning modelliert. Durch Analyse der Hypertextstruktur und der
Dokumentinhalte werden dem Benutzer Pfade durch das WWW vorgeschlagen, die
möglichst viel relevante Information enthalten. Beide Ansätze werden
experimentell evaluiert. Es zeigt sich, dass der
Textkategorisierungsansatz eine höhere
Performanz erzielt, wenn genügend Benutzerinteraktionen als
Trainingsbeispiele zur Verfügung stehen. Ansonsten ist der
Reinforcement-Learning-Ansatz von
Vorteil, da er nicht auf solche Trainingbeispiele angewiesen ist, sondern
direkt
aus den Dokumenten und der Hypertextstruktur lernt.
|