Fuzzy Search

Fuzzy Search

Copyright ┬ę Shutterstock /svetlichniy_igor

Was ist Fuzzy Search?

Definition

Eine Fuzzy Search, in der Langform auch Fuzzy-String-Search genannt, ist eine Suchtechnik, die es erm├Âglicht, neben exakten Treffern f├╝r den Suchbegriff auch ├Ąhnliche W├Ârter zu finden.

So listen Suchmaschinen bei einer Fuzzy-Search mit dem Suchbegriff Onlinemarketing nicht nur Treffer auf, die den Suchbegriff exakt wiedergeben. Daneben erscheinen auch Internetseiten in den Ergebnissen, die f├╝r das Wort eine andere Schreibweise, beispielsweise “Online Marketing”, verwenden. Eine andere Bezeichnung f├╝r diese Art einer Suchanfrage ist unscharfe Suche. Mithilfe eines mathematischen Algorithmus wird bestimmt, wie verwandt sich ├Ąhnlich lautende W├Ârter sind und ob ihr ├ähnlichkeitsgrad ausreicht, sie in die Suchergebnisse aufzunehmen.

Screenshot Google

Verschiedene Ans├Ątze einer unscharfen Suche

Die Herausforderung bei der Implementierung einer Anwendung, die eine Fuzzy Search erm├Âglicht, ist nicht nur das tats├Ąchliche Auffinden der Suchtreffer. Knackpunkt ist vielmehr der Algorithmus, der die Ergebnisse untereinander gewichtet. Ein h├Ąufig daf├╝r genutztes Berechnungsverfahren ist die Levenshtein-Distanz. Hinter der nach dem russischen Wissenschaftler Wladimir Lewenstein benannten Methode steht eine Ma├čzahl f├╝r die ├ähnlichkeit von zwei Zeichenketten. Ein Suchbegriff stellt in der Informationsverarbeitung nichts anderes als eine Zeichenkette (englisch: string) dar.

Die Levenshtein-Distanz errechnet, welche Anzahl an Ver├Ąnderungsoperationen an einer der Zeichenketten minimal ausgef├╝hrt werden muss, um zwei gleiche Zeichenketten zu erhalten. Zu den Ver├Ąnderungsoperationen z├Ąhlen Buchstabenl├Âschungen und -verschiebungen sowie Einf├╝gen oder Ersetzen von Zeichen. Je kleiner der ermittelte Wert, umso ├Ąhnlicher sind sich die untersuchten W├Ârter und umso besser eignen sie sich als Suchtreffer einer Fuzzy Search. Die ├ähnlichkeitsbeziehung kann man auch ├╝ber N-Gramme ermitteln. Sie zerlegen Texte in Fragmente und analysieren die einzelnen Teile. F├╝r diese Zerlegungen berechnet man Wahrscheinlichkeiten f├╝r nachfolgende Zeichenkombinationen. Der phonetische Ansatz legt den Schwerpunkt nicht auf die in einem Suchbegriff enthaltenen Buchstaben, sondern vergleicht W├Ârter ├╝ber ihre klanglichen Eigenschaften. Eines dieser Verfahren ist der f├╝r die englische Sprache entwickelte Soundex-Algorithmus. Bei allen Ans├Ątzen erfolgt die Ermittlung der Suchtreffer dynamisch und nicht ├╝ber im Vorfeld hinterlegte Wortlisten.

Einsatzm├Âglichkeiten einer Fuzzy Search

Die unscharfe Suchtechnik ist fehlertolerant und bietet sich daher f├╝r Suchbegriffe an, f├╝r die verschiedene Schreibweisen g├Ąngig sind oder wenn der Nutzer die korrekte Schreibweise des Wortes nicht kennt. Auch f├╝r Recherchen zu W├Ârtern, die anf├Ąllig f├╝r Tippfehler sind, eignet sich eine Fuzzy Search. Ebenso findet sie Flexionen von W├Ârtern. Die Technik der Fuzzy-String-Search wird sowohl f├╝r die Suche in lokalen Datenbanken wie auch f├╝r die Suche in Internet-Suchmaschinen eingesetzt. User k├Ânnen auf diese Art Inhalte leichter finden. Wichtig ist, bei der Parametrisierung der Algorithmen zur ├ähnlichkeitsbestimmung abzuw├Ągen, wie sich eine h├Âhere Trefferanzahl bei einer verringerten Genauigkeit der Wort├╝bereinstimmungen auf die Qualit├Ąt der Suchergebnisse auswirkt.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG


Weitere Inhalte