3 Min Lesezeit

Duplicate Content: warum er entsteht und was er kostet

Wenn von Duplicate Content gesprochen wird, denken viele zuerst an kopierte Texte. In der Praxis ist das aber nur ein kleiner Teil des Problems. Viel häufiger entsteht doppelter Inhalt durch die Struktur einer Website selbst, nicht durch redaktionelle Entscheidungen.

Das macht das Thema unangenehm. Wer Inhalte sauber pflegt, kann trotzdem Duplicate Content haben, ohne es zu merken. Und Google muss in diesen Fällen entscheiden, welche Variante einer Seite die richtige ist. Diese Entscheidung trifft die Suchmaschine nicht immer im Sinne des Unternehmens.

Was Duplicate Content wirklich bedeutet

Duplicate Content meint im SEO-Kontext: gleicher oder fast gleicher Inhalt unter mehreren URLs. Es geht nicht um eine moralische Frage und auch nicht zwangsläufig um eine Strafe. Es geht darum, dass Suchmaschinen für ein Thema eine Hauptversion suchen.

Wenn eine Seite in mehreren Varianten existiert, verteilt sich die Wirkung. Externe Links zeigen mal auf die eine, mal auf die andere Version. Rankings entstehen halbherzig, weil Google nicht eindeutig weiss, welche Variante zählt.

Typische Quellen im Alltag

Auf den meisten Websites gibt es eine kleine Zahl wiederkehrender Quellen für Duplicate Content.

Eine Seite ist sowohl mit als auch ohne Trailing Slash erreichbar.
HTTP- und HTTPS-Varianten existieren parallel.
URLs mit und ohne www. zeigen denselben Inhalt.
Filter, Sortierungen oder Trackingparameter erzeugen viele URL-Varianten derselben Seite.
Ein Beitrag taucht in mehreren Kategorien auf, jeweils mit eigener URL.
Druckansichten oder Mobilvarianten existieren als separate Seiten.

Keiner dieser Punkte ist böse Absicht. Sie sind das Ergebnis pragmatischer Entscheidungen, die sich über die Zeit summieren.

Warum es teurer ist als gedacht

Duplicate Content führt selten zu einer harten Abstrafung. Aber er führt oft zu schleichenden Verlusten.

Crawl-Budget wird auf Varianten verschwendet, statt auf neue oder wichtige Inhalte. Externe Links verlieren an Wirkung, weil sie sich zwischen Varianten verteilen. Die falsche Version einer Seite kann ranken und Nutzer in eine schlechtere Variante schicken.

Vor allem aber entsteht Unsicherheit. Wenn Inhalte in mehreren Versionen existieren, weiss niemand mehr genau, welche die kanonische ist. Das wird in der laufenden Pflege zum Stolperstein.

Canonicals als ruhiges Werkzeug

Das wichtigste technische Werkzeug gegen Duplicate Content ist der Canonical Tag. Er sagt Google: das ist die Hauptversion dieser Seite, andere Varianten bitte ignorieren.

Canonicals sind kein Allheilmittel. Sie funktionieren nur, wenn sie sauber gesetzt sind und konsistent über die Website hinweg eingesetzt werden. Falsch gesetzte Canonicals verschlimmern das Problem oft, statt es zu lösen.

Wer das Thema vertiefen will, findet im Beitrag Canonical Tags: das stille Werkzeug gegen Inhaltschaos eine genauere Einordnung.

Strukturelle Hebel zuerst

Bevor Canonicals zum Einsatz kommen, lohnt es sich, strukturelle Quellen abzustellen. Eine eindeutige Domain-Variante, einheitliche Trailing-Slash-Logik, saubere HTTPS-Weiterleitungen und durchdachter Umgang mit URL-Parametern sind die ruhigeren, robusteren Hebel.

Eine Website mit klarer Grundstruktur hat von vornherein weniger Duplicate-Content-Quellen. Die technischen Werkzeuge müssen dann nur noch Restbestände auffangen, nicht ständig grundlegende Strukturprobleme korrigieren.

Inhaltliche Doppelungen

Neben technischem Duplicate Content gibt es auch redaktionelle Doppelungen. Sehr ähnliche Leistungstexte für leicht unterschiedliche Angebote, fast identische Standortseiten, mehrere Beiträge zu sehr nahen Themen.

Hier hilft kein Canonical, sondern eine ehrliche redaktionelle Entscheidung. Manchmal ist es besser, zwei schwache Seiten zu einer starken Seite zusammenzuführen, statt sie nebeneinander stehen zu lassen.

Was im Alltag wirklich hilft

Für die meisten Unternehmen reicht ein pragmatisches Vorgehen. Bestandsaufnahme der wichtigsten Seitentypen, kurze Prüfung der Domain- und Parameterlogik, eindeutige Canonicals an den richtigen Stellen, ehrliche Bewertung von inhaltlichen Doppelungen.

Wer das einmal sauber aufgesetzt hat, muss es nur noch pflegen. Die meisten Probleme entstehen nicht durch fehlendes Wissen, sondern dadurch, dass sich nach einem Relaunch oder Systemwechsel niemand mehr zuständig fühlt.

Schluss

Duplicate Content ist selten ein dramatisches Problem, aber oft ein zähes. Er kostet langsam, leise und meist an Stellen, an denen niemand hinschaut.

Wenn du den Verdacht hast, dass Inhalte auf deiner Website in mehreren Varianten existieren oder dass sich Sichtbarkeit auf merkwürdige Seiten verteilt, lässt sich das in einer ruhigen Sichtung gut einordnen, bevor daraus ein grösserer Aufwand wird.