TrustRank

Was ist der TrustRank?

Der TrustRank ist eine Link-Analyse-Technik zur halbautomatischen Trennung von n├╝tzlichen Webseiten von Spam. Viele Web-Spam-Seiten werden nur mit der Absicht erstellt, Suchmaschinen irrezuf├╝hren. Diese Seiten, die haupts├Ąchlich aus kommerziellen Gr├╝nden erstellt wurden, verwenden verschiedene Techniken, um auf den Ergebnisseiten der Suchmaschinen ├╝berdurchschnittliche Platzierungen zu erzielen. Obwohl menschliche Experten Spam leicht erkennen k├Ânnen, ist eine manuelle ├ťberpr├╝fung des Internets unpraktisch. TrustRank automatisiert die Suche.

TrustRank soll Web-Spam erkennen

Der Begriff Web-Spam bezieht sich auf Seiten im World Wide Web, die mit der Absicht erstellt wurden, Suchmaschinen irrezuf├╝hren. Zum Beispiel kann eine Pornografie-Website das Web spammen, indem sie Tausende von Schl├╝sselw├Ârtern zu ihrer Homepage hinzuf├╝gt, wodurch der Text f├╝r den Menschen oft durch den genialen Einsatz von Farbschemata unsichtbar wird. Eine Suchmaschine indiziert dann die zus├Ątzlichen Schl├╝sselw├Ârter und gibt die Pornoseite als Antwort auf Anfragen zur├╝ck, die einige der Schl├╝sselw├Ârter enthalten. Da die hinzugef├╝gten Schl├╝sselw├Ârter in der Regel nicht ausschlie├člich erwachsener Natur sind, werden Personen, die nach anderen Themen suchen, auf die Seite gef├╝hrt.

Genau wie bei E-Mail-Spam ist die Bestimmung, ob eine Seite oder eine Gruppe von Seiten Spam ist, subjektiv. Betrachtet man zum Beispiel eine Gruppe von Websites, die wiederholt auf die Seiten des anderen verlinken. Diese Links k├Ânnen n├╝tzliche Beziehungen zwischen den Sites darstellen oder sie wurden mit der ausdr├╝cklichen Absicht geschaffen, den Rang der anderen Seiten zu erh├Âhen. Im Allgemeinen ist es schwierig, zwischen diesen beiden Szenarien zu unterscheiden. Doch genau wie bei E-Mail-Spam k├Ânnen die meisten Menschen die F├Ąlle von Web-Spam leicht erkennen.

Web-Spam

Zum Beispiel w├╝rden die meisten zustimmen, dass eine Seite eine irref├╝hrende Absicht verfolgt, wenn ein Gro├čteil des Textes auf einer Seite f├╝r Menschen unsichtbar gemacht wird (wie oben erw├Ąhnt) und f├╝r das Hauptthema der Seite irrelevant ist. Dies gilt ebenso, wenn eine Seite mit Tausenden von URLs wirbt, die auf Hosts wie “kaufen Sie Kamera XY” verweisen und alle Hostnamen auf die gleiche IP-Adresse abbilden. Auch hier w├╝rde man feststellen, dass die Seite erstellt wurde, um Suchmaschinen irrezuf├╝hren. Die Motivation hinter URL-Spamming ist, dass viele Suchmaschinen den W├Ârtern in Hostnamen besondere Aufmerksamkeit schenken und diesen W├Ârtern ein h├Âheres Gewicht geben, als wenn sie im Klartext aufgetreten w├Ąren.

Tipp

Wenn Sie noch Fragen bez├╝glich IP-Adresse haben, dann k├Ânnen Sie gerne den jeweiligen Glossar dazu besuchen und sich ├╝ber das Thema informieren.

W├Ąhrend die meisten Personen so etwas schnell erkennen, bedeutet dies nicht, dass es f├╝r einen Computer einfach ist, solche F├Ąlle zu erkennen. Suchmaschinenfirmen besch├Ąftigen in der Regel Mitarbeiter, die auf die Erkennung von Web-Spam spezialisiert sind und das Internet st├Ąndig nach T├Ątern durchsuchen. Wenn eine Spam-Seite identifiziert ist, stoppt eine Suchmaschine das Crawlen und ihr Inhalt wird nicht mehr indiziert. Dieser Spam-Erkennungsprozess ist sehr teuer und langsam, aber entscheidend f├╝r den Erfolg von Suchmaschinen: Ohne die Entfernung der T├Ąter w├╝rde die Qualit├Ąt der Suchergebnisse immer schlechter.

Funktionsweise von TrustRank

Der TrustRank versucht, Spam zu bek├Ąmpfen, indem er das Internet nach seiner Zuverl├Ąssigkeit filtert. Die Methode erfordert die Auswahl eines kleinen Satzes von Samenseiten, die von einem Experten bewertet werden sollen. Sobald die seri├Âsen Seiten manuell identifiziert wurden, sucht ein Crawling-Algorithmus, der sich von den identifizierten Seiten nach au├čen erstreckt, ├Ąhnlich zuverl├Ąssige und vertrauensw├╝rdige Seiten. Die Zuverl├Ąssigkeit von TrustRank nimmt mit zunehmendem Abstand zwischen den Dokumenten und dem Seed-Set ab. Die Logik funktioniert auch in umgekehrter Weise, die als Anti-Trust Rank bezeichnet wird. Je n├Ąher eine Seite an den Spam-Ressourcen ist, desto wahrscheinlicher ist es auch, dass es sich um Spam handelt und so wird sie entsprechend klassifiziert.

Tipp

Wenn Sie noch Fragen bez├╝glich eines Online Marketing Themas haben, dann k├Ânnen Sie gerne unseren Glossar besuchen und sich ├╝ber das Thema informieren, wo Sie noch speziell Fragen haben.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG


Weitere Inhalte