WDF*IDF

WDF*IDF

Copyright © Shutterstock/Who is Danny

Was ist eine WDF*IDF Analyse?

Das Verfahren WDF*IDF dient der Termgewichtungsanalyse und spielt bei der Suchmaschinenoptimierung (SEO = search engine optimization) eine zentrale Rolle. Mit dieser effizienten Formel lässt sich die optimale Verteilung von themenrelevanten Begriffen oder Keywords (Schlagwörter) in einem beliebigen Text bestimmen.

Bei dieser wichtigen Analyse steht nicht die Dichte der Keywords (Keyword-Density), sondern der gesamte Inhalt des Textes im Mittelpunkt. Mit den Ergebnissen dieser Analyse lassen sich Texte darauf optimieren, dass sie ein bestimmtes Thema besonders detailreich darstellen. Im direkten Vergleich zur Keyword-Density, bei der die einfache Häufigkeitsverteilung der Keywords eine Rolle spielt, ist das WDF*IDF-Verfahren um einiges komplexer.

Was bedeuten WDF und IDF?

Die Abkürzung WDF steht für die “Within Document Frequency”. Mit dieser Formel lässt sich die Häufigkeit eines bestimmten Keywords in einem Dokument im direkten Verhältnis zu den anderen Keywords im selben Text darstellen. Da der Logarithmus bei der Berechnung zum Einsatz kommt, wird das Ergebnis gestaucht.

Die Abkürzung IDF steht für die “Inverse Document Frequency”. Mit dieser Formel lässt sich die Häufigkeit von einem Keyword in einem Text in Relation zu der Häufigkeit des Keywords auf alle anderen Textdokumente setzen. IDF steht somit für eine Termgewichtung von einem bestimmten Begriff innerhalb mehrerer Dokumente. Bei der Berechnung kommt ebenfalls der Logarithmus zum Einsatz.

Termfrequenz und Keyword-Density

Die Termfrequenz ist die Häufigkeit, mit dem ein bestimmtes Wort (Term) in einem Textdokument (Internetseite) erscheint. Die Termfrequenz lässt sich einfach messen, jedoch sagt das Ergebnis sehr wenig über die Webseite aus. Hat ein Autor beispielsweise 1000 Wörter über das Thema Handball geschrieben, kommt das Keyword “Tor” zufällig 3-mal darin vor. Dies macht den Artikel jedoch noch lange nicht so relevant für das Keyword “Tor” wie eine Seite mit nur 20 Wörtern, in denen der Begriff 2-mal vorkommt.

Die Keyworddichte beschreibt genau wie häufig ein bestimmtes Wort in Relation zu allen anderen Begriffen zum Einsatz kommt. Die Keyword-Density lässt sich leicht berechnen, indem die Häufigkeit mit 100 multipliziert und durch die Gesamtzahl aller Wörter geteilt wird. Leider ist die Keyworddichte leicht manipulierbar und nicht jeder Begriff besitzt die gleiche Relevanz.

Hintergründe und Einsatzmöglichkeiten von WDF*IDF

Bei der Verwendung der Formel werden die Keywords im Grunde nicht mehr als Schlüsselwörter, sondern als Terme bezeichnet. Die WDF*IDF-Formel ist spätestens seit 2012 ein wichtiges Thema im Rahmen der Suchmaschinenoptimierung. Die Formel stammt ursprünglich aus dem sogenannten Information Retrieval. Bereits im Jahr 1992 erwähnte diese Formel die bekannte Informationswissenschaftlerin Donna Harman.

Durch den SEO-Experten und Online-Marketer Karl Kratz hat sich die Formel danach in der SEO-Szene etabliert. In Zusammenarbeit mit einer Mathematikerin namens Jana Engelmann fand Karl Kratz durch verschiedene Vektorrechnungen heraus, dass die Dichte der Keywords im Hinblick auf die Suchmaschinenoptimierung im Grunde vollkommen wertlos ist.

Eine besonders hohe Brisanz erlangt die WDF*IDF-Analyse, da Karl Kratz diese Formel öffentlich und offensiv als eine Ablösung der bisher gängigen Keyworddichte propagiert.

Hinter der Formel steht ganz einfach ausgedrückt nachfolgende Überlegung: Je mehr ein bestimmtes Wort in Texten vorkommt, die von den Suchmaschinen als besonders passend für einen bestimmten Begriff bewertet werden, umso wichtiger ist das Wort für den jeweiligen Suchbegriff.

Anhand dieses einfachen und effektiven Prinzips lässt sich mit der WDF*IDF-Analyse ermitteln, wie hoch die thematische Relevanz von ergänzenden Keywords zu einem beliebigen Suchbegriff ist. Mit den gängigen Tools wird die Termgewichtung der Seiten ausgewertet, die zu einem gesuchten Keyword das beste Ranking haben.

Auf Basis der effektiven Analyse erhalten die Nutzer von den Tools entsprechende Proofkeywords als Vorschläge. Diese ergänzenden Keywords sind thematisch passend und sollen in einem Textdokument zusätzlich zu den eigentlichen Suchbegriffen erscheinen.

So funktioniert die Formel in der Praxis

Als Erstes wird ein Hauptkeyword definiert und im Hinblick auf dieses soll ein Dokument optimiert werden. Für dieses Keyword lässt sich mittels verschiedener Tools eine WDF*IDF-Analyse durchführen. Mit diesen lassen sich beliebige Texte von einem Dokument streng nach der oben genannten Formel für die optimale Termgewichtung optimieren.

Bei den meisten Tools gibt der Nutzer ein Keyword ein, auf welches er optimieren möchte. Danach wählt er ein Land aus, für welches das Dokument optimiert werden soll. Anhand dieser beiden Einstellungen erkennen die meisten WDF*IDF-Tools sofort, ob es sich um eine Webseite aus Deutschland, der Schweiz oder aus Österreich handelt.

Im Anschluss daran ermitteln die Programme auf der Basis der zuvor analysierten Seiten die für den jeweiligen Suchbegriff relevanten Terme und die Termgewichtung. Dies geschieht, indem die WDF*IDF-Tools alle Webseiten mit dem besten Ranking im Hinblick auf den angegebenen Begriff untersuchen.

Danach zeigen die Tools sowohl alle relevanten Begriffe als auch deren Häufigkeitsverteilung an. Der Nutzer erhält diese in einer detaillierten Übersicht. Für jeden einzelnen Begriff ermittelt das Programm noch den besten WDF-Wert. Dank dieser detaillierten Ergebnisse kann der Nutzer seinen eigenen Text mit den zuvor ermittelten Werten vergleichen und ihn gegebenenfalls optimieren. Der Text sollte so nahe wie möglich an der idealen Termgewichtung, die das Tool vorgeschlagen hat, liegen.

Mit diesen Tools lassen sich WDF*IDF-Analysen durchführen

Für eine Analyse bieten sich mehrere Tools an. Zwar unterscheiden sich diese im Hinblick auf die grafische Gestaltung und die Kosten, trotzdem besitzen sie eine ähnliche Funktionsweise.

  • Sistrix Toolbox
  • kostenlose WDF*IDF-Analyse von Seobility (*Anzeige)
  • Searchmetrics Tool
  • XOVI SEO Tools
  • Seolyse (30 Tage kostenlos)
Screenshot einer wdf-idf von Seobility

(c) Screenshot wdf-idf von Seobility

Schwächen von WDF*IDF

Werden Dokumente im Hinblick auf die Termgewichtung optimiert, muss der Nutzer berücksichtigen, dass alle Seitenelemente analysiert werden. Eine WDF*IDF-Analyse macht vor allem auf Webseiten mit viel Text Sinn. Dies bedeutet, dass manche Webseiten mit wenig Text, wie beispielsweise Online-Shops, von der Optimierung kaum profitieren.

Die Nutzer müssen die Inverse Document Frequency genau kennen, damit die Formel richtig eingesetzt werden kann. Wurden nur wenige Webseiten durchgezählt, ist keine optimale Analyse möglich. Die Ergebnisse der WDF*IDF-Analyse sind im Hinblick aus redaktioneller Sicht schwer umsetzbar. Kein Texter wird alle Begriffe auf eine natürliche Art und Weise im Text unterbringen können. Versucht er dies, leidet darunter die Qualität der Texte.

Die mit Sternchen (*) gekennzeichneten Links sind sogenannte Affiliate-Links. Wenn Sie auf so einen Affiliate-Link klicken und über diesen Link einkaufen, bekommen wir von dem betreffenden Anbieter eine Provision. Für Sie verändert sich der Preis nicht.

Tipp

Wenn Sie noch Fragen bezüglich eines Online Marketing Themas haben, dann können Sie gerne unseren Glossar besuchen und sich über das Thema informieren, wo Sie noch speziell Fragen haben.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG


Weitere Inhalte