Skip to main content

TrustRank

Was ist der TrustRank?

Der TrustRank ist eine Link-Analyse-Technik zur halbautomatischen Trennung von nützlichen Webseiten von Spam. Viele Web-Spam-Seiten werden nur mit der Absicht erstellt, Suchmaschinen irrezuführen. Diese Seiten, die hauptsächlich aus kommerziellen Gründen erstellt wurden, verwenden verschiedene Techniken, um auf den Ergebnisseiten der Suchmaschinen überdurchschnittliche Platzierungen zu erzielen. Obwohl menschliche Experten Spam leicht erkennen können, ist eine manuelle Überprüfung des Internets unpraktisch. TrustRank automatisiert die Suche.

TrustRank soll Web-Spam erkennen

Der Begriff Web-Spam bezieht sich auf Seiten im World Wide Web, die mit der Absicht erstellt wurden, Suchmaschinen irrezuführen. Zum Beispiel kann eine Pornografie-Website das Web spammen, indem sie Tausende von Schlüsselwörtern zu ihrer Homepage hinzufügt, wodurch der Text für den Menschen oft durch den genialen Einsatz von Farbschemata unsichtbar wird. Eine Suchmaschine indiziert dann die zusätzlichen Schlüsselwörter und gibt die Pornoseite als Antwort auf Anfragen zurück, die einige der Schlüsselwörter enthalten. Da die hinzugefügten Schlüsselwörter in der Regel nicht ausschließlich erwachsener Natur sind, werden Personen, die nach anderen Themen suchen, auf die Seite geführt.

Genau wie bei E-Mail-Spam ist die Bestimmung, ob eine Seite oder eine Gruppe von Seiten Spam ist, subjektiv. Betrachtet man zum Beispiel eine Gruppe von Websites, die wiederholt auf die Seiten des anderen verlinken. Diese Links können nützliche Beziehungen zwischen den Sites darstellen oder sie wurden mit der ausdrücklichen Absicht geschaffen, den Rang der anderen Seiten zu erhöhen. Im Allgemeinen ist es schwierig, zwischen diesen beiden Szenarien zu unterscheiden. Doch genau wie bei E-Mail-Spam können die meisten Menschen die Fälle von Web-Spam leicht erkennen.

Web-Spam

Zum Beispiel würden die meisten zustimmen, dass eine Seite eine irreführende Absicht verfolgt, wenn ein Großteil des Textes auf einer Seite für Menschen unsichtbar gemacht wird (wie oben erwähnt) und für das Hauptthema der Seite irrelevant ist. Dies gilt ebenso, wenn eine Seite mit Tausenden von URLs wirbt, die auf Hosts wie “kaufen Sie Kamera XY” verweisen und alle Hostnamen auf die gleiche IP-Adresse abbilden. Auch hier würde man feststellen, dass die Seite erstellt wurde, um Suchmaschinen irrezuführen. Die Motivation hinter URL-Spamming ist, dass viele Suchmaschinen den Wörtern in Hostnamen besondere Aufmerksamkeit schenken und diesen Wörtern ein höheres Gewicht geben, als wenn sie im Klartext aufgetreten wären.

Während die meisten Personen so etwas schnell erkennen, bedeutet dies nicht, dass es für einen Computer einfach ist, solche Fälle zu erkennen. Suchmaschinenfirmen beschäftigen in der Regel Mitarbeiter, die auf die Erkennung von Web-Spam spezialisiert sind und das Internet ständig nach Tätern durchsuchen. Wenn eine Spam-Seite identifiziert ist, stoppt eine Suchmaschine das Crawlen und ihr Inhalt wird nicht mehr indiziert. Dieser Spam-Erkennungsprozess ist sehr teuer und langsam, aber entscheidend für den Erfolg von Suchmaschinen: Ohne die Entfernung der Täter würde die Qualität der Suchergebnisse immer schlechter.

Funktionsweise von TrustRank

Der TrustRank versucht, Spam zu bekämpfen, indem er das Internet nach seiner Zuverlässigkeit filtert. Die Methode erfordert die Auswahl eines kleinen Satzes von Samenseiten, die von einem Experten bewertet werden sollen. Sobald die seriösen Seiten manuell identifiziert wurden, sucht ein Crawling-Algorithmus, der sich von den identifizierten Seiten nach außen erstreckt, ähnlich zuverlässige und vertrauenswürdige Seiten. Die Zuverlässigkeit von TrustRank nimmt mit zunehmendem Abstand zwischen den Dokumenten und dem Seed-Set ab. Die Logik funktioniert auch in umgekehrter Weise, die als Anti-Trust Rank bezeichnet wird. Je näher eine Seite an den Spam-Ressourcen ist, desto wahrscheinlicher ist es auch, dass es sich um Spam handelt und so wird sie entsprechend klassifiziert.

Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenloser SEO-Check der OSG