Duplicate und Near Duplicate Content, wie kann er vermieden werden?

Veröffentlicht von Florian Müller (GF) 03.04.2017 · Kategorie(n): SEO

Duplicate und Near Duplicate Content vermeiden - OSG Blog

Einzigartige Inhalte sind weiterhin ein wichtiger Rankingfaktor. Doch was geschieht, wenn Inhalte doppelt oder mehrfach auf Webseiten oder verschiedenen Domains zu finden sind? In einem solchen Fall spricht man von Duplicate Content. In diesem Artikel zeigen wir, wie diese Inhalte entstehen und wie ihnen begegnet werden kann. Als i-Tüpfelchen erklären wir abschließend, wie identischen Inhalten vorgebeugt werden kann.

Inhaltsverzeichnis

Was ist Duplicate Content und wie entsteht er?

Bei Duplicate Content handelt es sich um identische Inhalte, die auf verschiedenen oder derselben Webseiten präsentiert werden. So sind auf Seite A www.xyz.de und auf Seite B www.abc.de dieselben Texte zu finden. Zudem kann auf Seite A www.xyz.de auch interner Duplicate Content vorkommen, weil beispielsweise das Verzeichnis www.xyz.de/A/ einen identischen Inhalt aufweist wie das Verzeichnis www.xyz.de/B/.

Generell ist es wichtig, Duplicate Content von der Keyword Kannibalisierung zu unterscheiden. Bei der Keyword Kannibalisierung konkurrieren mehrere Seiten um das Ranking für ein Keyword. Es gibt also mehrere Seiten mit unterschiedlichen Inhalten, die auf ein bestimmtes Keyword optimiert sind.

Interner Duplicate Content

Interner Duplicate Content entsteht, wenn identische Inhalte innerhalb einer Domain auf verschiedenen Seiten abrufbar sind. Online Shops haben häufig mit diesem Problem zu kämpfen, wenn Produkte einer Kategorie identische Beschreibungen aufweisen. Zudem kann dieses Problem auftreten, wenn Produkte für Varianten eines Produkts kopiert werden oder Blogartikel die selben Inhalte wie Kategorietexte aufweisen.

So können innerhalb einer Webseite identische Inhalte dadurch entstehen, dass diese mit und ohne www. erreichbar ist. Beispielsweise entstehen identische Inhalte im Fall von www.beispiel.de und beispiel.de. Dieses Problem kann durch eine entsprechende Serverkonfiguration gelöst werden. Eine andere Ursache kann in nicht vorhandenen Trailing Slashes liegen. Trailing Slashes sind die Schrägstriche am Ende einer URL, die auf ein Verzeichnis und nicht auf einen Dateinamen zeigt. Wird die URL http://www.beispiel.de/verzeichnis_x/verzeichnis_y/ in die Adresszeile eingegeben und geladen, ruft der Server die Inhalte im Verzeichnis verzeichnis_y auf. Beim Aufruf der URL http://www.beispiel.de/verzeichnis_x/verzeichnis_y wird der Server ebenso die Inhalte unter verzeichnis_y aufrufen. Als Folge entsteht interner Duplicate Content.

Externer Duplicate Content

Sind identische Inhalte auf unterschiedlichen Domains zu finden, spricht man von externem Duplicate Content. Dies kann zum Beispiel der Fall sein, wenn Produktbeschreibungen vom Hersteller einfach übernommen werden. Zudem entstehen identische Inhalte wenn Texte einfach von anderen Webseiten kopiert und auf der eigenen Seite verwendet werden.

Externer Duplicate Content kann entstehen, wenn sich ein anderer Webmaster unerlaubt der Inhalte der eigenen Webseite bedient. Sprich, wenn Inhalte und Texte einfach geklaut werden. Bei einem Online Shop entsteht er, wenn Produktbeschreibungen des Herstellers einfach übernommen und nicht angepasst werden. Die identischen Produktbeschreibungen sind auf zwei unterschiedlichen Domains abrufbar.

Welche Probleme entstehen durch Duplicate Content?

Sowohl durch internen als auch durch externen Duplicate Content ergibt sich folgendes Problem: Google weiß nicht, welches der Original-Inhalt ist. Es weiß daher auch nicht, welche Seite gerankt werden soll. Oder anders ausgedrückt: Google kann nicht eindeutig bestimmen, welche Seite für die Suchanfrage eines Nutzers die höchste Relevanz aufweist. Im schlimmsten Fall bewertet Google alle Seiten gleich schlecht. Die Original-Inhalte erhalten dann ein schlechtes Ranking. Oder es wird nur eine Seite bewertet und vermeintliche Duplikate erhalten keine Bewertung. Im Fall von externem Duplicate Content, der durch Content-Klau entstanden ist, kann das Duplikat besser ranken als das Original. Dies ist für den Urheber des Originals sehr ärgerlich, da so wertvoller Traffic verloren geht.

Wie kann Duplicate Content begegnet werden?

Interner Duplicate Content

Sollte interner Duplicate Content vorhanden sein, kann mittels eines Canonical Tags auf den Original-Inhalt verwiesen werden. Google erkennt diesen Tag und bewertet automatisch die Seite mit den ursprünglichen Inhalten. Im speziellen Fall von Duplicate Content, der durch die Paginierung entsteht, können die HTML-Tags rel=”next” und rel=”prev” verwendet werden, um Google den Bezug zwischen den Seiten zu verdeutlichen. Es sollte jedoch beachtet werden, dass entweder die rel=”next” und rel=”prev” Tags oder der Canonical Tag verwendet werden. Eine Mischung der beiden Vorgehensweisen ist nicht zu empfehlen.

Externer Duplicate Content

Sollten identische Inhalte auf unterschiedlichen Domains eines Webmasters zu finden sein, kann eine permanente Weiterleitung Abhilfe schaffen. Dieser 301 Redirect verweist auf die Seite mit den originalen Inhalten bzw. auf die Seite, deren Inhalte von Google bewertet werden sollen. Liegt ein Fall von Content-Klau vor, so kann im ersten Schritt der Webmaster der Seite mit der Bitte um Entfernung der Inhalte kontaktiert werden. Dies könnte eine Möglichkeit sein, einen Backlink zu erhalten. Allerdings sollte in diesem Fall auf die Seite hochwertig sein und hohe SEO-Werte aufweisen, z.B. gute Sichtbarkeit und Top-Ten-Platzierungen. Sollte sich der Betreiber jedoch nicht kooperativ zeigen, kann die entsprechende Seite über die Google Search Console gemeldet werden. Es liegt schließlich eine Verletzung des Urheberrechts vor. Im Extremfall sollten als letzter Schritt rechtliche Mittel wie eine Abmahnung in Erwägung gezogen werden.

Near Duplicate Content

Zu guter Letzt beschäftigen wir uns mit einer besonderen Form des Duplicate Content. Near Duplicate Content entsteht, wenn sehr ähnliche Inhalte auf einer Webseite oder innerhalb einer Domain zu finden sind. Dies kann bei Online-Shops oder generell bei Seiten der Fall sein, die viele sehr ähnliche Texte oder Textbausteine in Produktbeschreibungen verwenden. Die Inhalte der Seiten werden dann von Google als sehr ähnlich behandelt.

Dies kann folglich auch zu Verschlechterungen im Ranking der betroffenen Seiten führen. Es bietet sich auch in diesem Fall an, mit einem Canonical Tag oder im Fall eines Onlineshops mit einer Paginierung durch rel=”next” und rel=”prev” Tags zu arbeiten. Zudem kann eine gründliche Prüfung der Inhalte Abhilfe schaffen. Existieren ähnliche Inhalte, die sich auf ein übergeordnetes Thema beziehen, sollten diese sinnvoll zusammengefasst werden. Die Bildung holistischen Contents kann diesem Problem von sehr gut vorbeugen.

Fazit

Duplicate und Near Duplicate Content können auf vielerlei Weisen entstehen. Diese kann man nicht immer kontrollieren. Solltest du als Webmaster oder SEO doch einmal mit dem Problem identischer Inhalte konfrontiert werden, gibt es verschiedene Ansätze, diesem Problem zu begegnen. Das effektivste Mittel sind aber immer noch einzigartige Texte und Inhalte. So werden nicht nur identische Inhalte vermieden, als netter Nebeneffekt wird die eigene Marke gestärkt. Zudem erhalten die Angebote von Online Shops bei Preisvergleichen eine individuelle Note. Des Weiteren kann eine gründliche Planung der Seitenhierarchie mögliche Quellen von Duplicate und Near Duplicate Content im Vorfeld sichtbar machen. Online Shops sollten außerdem Vorkehrungen treffen Canonical Tags schnell implementieren zu können, um beispielsweise bestimmte Kategorieseiten ranken zu lassen.