Skip to main content

Stemming

Was ist Stemming?

Beim Verfahren des Stemmings, oder auch Stammformreduktion genannt, werden Worte auf ihren Wortstamm verkürzt. So werden beispielsweise die Wörter “Bäume” und “Baumes” auf den Wortstamm “Baum” reduziert. Dieses Verfahren stammt ursprünglich aus der Linguistik und wurde auf den Bereich des Online Marketings im Bereich der Suchmaschinenorientierung übertragen. Das Ziel dieses Konzeptes ist es, die Ergebnisse in den Suchmaschinen zu maximieren.

Stemming ermöglicht es, dass sowohl relevantere als auch verbesserte Suchergebnisse erreicht werden können. Die Suchergebnisse werden mit dieser Methode auf jeden Fall erweitert. Denn mögliche Inklinationen des Begriffs werden in den Suchergebnissen einbezogen. Zudem ergeben sich weitere Vorteile bei der Suche. So wird der benötigte Speicherplatz geringer und die Suche verläuft insgesamt schneller.

Beispiel

Wer nach dem Begriff “krank” sucht erhält auch die Begriffe “erkrankt” oder “Krankheit” in den Suchergebnissen.

Das Konzept des Stemmings ist bei den meisten fortschrittlichen Suchmaschinen in den Suchalgorithmus integriert. Google nutzt das Verfahren des Stemmings bereits seit 2004 im deutschsprachigen Raum.

Der Porter-Stemmer-Algorithmus

Der Porter-Stemmer-Algorithmus gilt beim Stemming als einer der verbreitetsten Algorithmen in der Computerlinguistik, wenn es darum geht, Wörter automatisch auf ihren Wortstamm zurückzuführen. Dabei basiert der Algorithmus auf einer großen Anzahl von Verürzungsregeln, die beim Stemming angewendet werden. Ein Wort wird so lange verkürzt, bis eine Minimalanzahl von Silben erreicht ist. Dieser ursprünglich für die englische Sprache entwickelte Algorithmus konnte mühelos auch für andere Sprachen, wie etwa Deutsch, adaptiert werden.
Häufig ist es dabei so, dass die abgeleiteten, verkürzten Stämme nicht korrekt den linguistischen Wortstämmen entsprechen. Da es beim Suchmaschineneinsatz allerdings nicht um linguistische Analysen geht, ist dieses Problem zu vernachlässigen. Obwohl der Algorithmus nicht mit einhundertprozentiger Genauigkeit arbeitet, ist er doch hinreichend zuverlässig, sodass er sich weites gehend etablieren konnte.

Sie haben noch Fragen?

Kontaktieren Sie uns