Inhaltsverzeichnis

Wenn ein Hidden Champion aus dem Großraum Würzburg seine Datenblätter parallel im Produkt-PIM, im Kataloggenerator und im Marketing-CMS ausspielt, sind drei nahezu identische Texte das Ergebnis — und Google steht vor der Frage, welche Version den Schlüsselsatz „CNC-gefräst" verdient. Genauso ergeht es Hotelportalen im Allgäu mit dynamischen Saisonseiten oder Versicherungsmaklern in München, deren Tarifrechner pro Bundesland eine eigene URL erzeugt. Duplicate Content gehört zu den häufigsten und gleichzeitig am meisten unterschätzten Problemen im technischen SEO. Wenn identische oder nahezu identische Inhalte unter mehreren URLs erreichbar sind, kann Google nicht entscheiden, welche Version ranken soll — und im schlimmsten Fall rankt keine davon gut.

Was ist Duplicate Content?

Duplicate Content bezeichnet Inhalte, die in identischer oder sehr ähnlicher Form unter verschiedenen URLs abrufbar sind. Google muss in solchen Fällen entscheiden, welche Version die "richtige" ist — und trifft dabei nicht immer die Wahl, die Sie sich wünschen.

Interner Duplicate Content

Interner Duplicate Content entsteht innerhalb Ihrer eigenen Website. Typische Ursachen sind URL-Variationen, CMS-Fehler oder fehlende Weiterleitungen. Diese Form ist am häufigsten und gleichzeitig am einfachsten zu beheben, da Sie die volle Kontrolle über Ihre eigene Infrastruktur haben.

Externer Duplicate Content

Externer Duplicate Content liegt vor, wenn identische Inhalte auf verschiedenen Domains erscheinen — etwa durch Content-Syndizierung, Scraping oder bewusste Übernahme. Hier ist die Kontrolle eingeschränkter, aber mit den richtigen Signalen können Sie Google zeigen, wer die Originalquelle ist.

aller Webinhalte bestehen aus Duplicate Content

Quelle: Raven Tools

der Websites haben unbemerkte Duplicate-Content-Probleme

Quelle: SEMrush

Häufige Ursachen für Duplicate Content

URL-Variationen

Die häufigste Ursache sind technische URL-Variationen, bei denen derselbe Inhalt unter mehreren Adressen erreichbar ist:

https://beispiel.de/seite/
https://www.beispiel.de/seite/
http://beispiel.de/seite/
https://beispiel.de/seite
https://beispiel.de/Seite/
https://beispiel.de/index.html

Jede dieser URLs kann von Google als eigenständige Seite betrachtet werden. Ohne klare Signale verteilt sich Ihre Ranking-Power auf alle Varianten.

Parameter-URLs

Session IDs, Tracking-Parameter und Sortieroptionen erzeugen unzählige URL-Varianten mit identischem Inhalt:

https://shop.de/kategorie/?sort=price
https://shop.de/kategorie/?color=blau&size=m
https://shop.de/kategorie/?sessionid=abc123
https://shop.de/kategorie/?utm_source=newsletter&utm_medium=email

Gerade bei Online-Shops mit vielen Filtermöglichkeiten — etwa bei Brauerei-Shops oder Automotive-Zulieferern mit umfangreichen Produktkatalogen — kann dies zu tausenden Duplikaten führen.

Druckversionen und AMP-Seiten

Wenn Ihre Website separate Druckversionen oder AMP-Seiten generiert, entstehen automatisch Duplikate:

https://beispiel.de/artikel/
https://beispiel.de/artikel/print/
https://beispiel.de/amp/artikel/

Ohne korrekte Canonical Tags indexiert Google möglicherweise die falsche Version.

Syndizierte Inhalte

Wenn Sie Inhalte auf Partnerseiten veröffentlichen oder Gastbeiträge auf fremden Domains erscheinen, entsteht externer Duplicate Content. Ohne Canonical-Verweis auf die Originalquelle kann Google die kopierte Version bevorzugen. In Bayern betrifft das häufig Unternehmen, die Fachbeiträge in Branchenportalen oder IHK-Publikationen zweitverwerten.

CMS-generierte Duplikate

Content-Management-Systeme erzeugen häufig automatische Duplikate durch:

Tag- und Kategorie-Seiten, die ähnliche Inhalte aggregieren
Archivseiten mit identischen Auszügen
Paginierung, bei der Einleitungstexte wiederholt werden
Medien-Attachment-Seiten in WordPress

Duplicate Content erkennen

Google Search Console nutzen

Der Abdeckungsbericht in der Google Search Console ist Ihre wichtigste Anlaufstelle. Unter "Seiten" finden Sie den Status "Duplikat" in verschiedenen Varianten:

Duplikat ohne von Nutzer ausgewählte kanonische URL: Google hat selbst eine Canonical-Version gewählt
Duplikat, eingereichte URL nicht als kanonisch ausgewählt: Ihre Canonical-Angabe wurde ignoriert
Alternative Seite mit eigenem Canonical Tag: Korrekt erkannte Duplikate

site:-Operator in Google

Mit einer einfachen Suche identifizieren Sie Duplikate direkt in den Suchergebnissen:

site:beispiel.de "exakter Textauszug Ihrer Seite"

Erscheinen mehrere Ergebnisse für denselben Text, haben Sie ein Duplikat-Problem.

Screaming Frog Crawl

Ein vollständiger Crawl mit Screaming Frog zeigt Ihnen auf einen Blick:

Seiten mit identischen Seitentiteln
Seiten mit identischen Meta-Descriptions
Seiten mit identischem Body-Content (Hash-basiert)
Fehlende oder fehlerhafte Canonical Tags

Duplikate per Code prüfen

Prüfen Sie den Canonical Tag einer beliebigen Seite direkt per curl:

# Canonical Tag prüfen
curl -s https://beispiel.de/seite/ | grep -i canonical

# HTTP-Header auf Canonical prüfen
curl -sI https://beispiel.de/seite/ | grep -i "link.*canonical"

# Redirect-Ketten aufdecken
curl -sIL https://beispiel.de/seite/ | grep -i "location\|HTTP/"

Lösungen für Duplicate Content

Canonical Tags setzen

Der Canonical Tag ist die flexibelste Lösung. Er teilt Google mit, welche URL als Originalversion gelten soll, ohne die Duplikat-Seite zu entfernen:

<!-- Auf der Duplikat-Seite -->
<head>
  <link rel="canonical" href="https://www.beispiel.de/original-seite/">
</head>

Setzen Sie auf jeder Seite einen self-referencing Canonical — auch wenn kein offensichtliches Duplikat existiert:

<!-- Auf jeder Seite: Canonical auf sich selbst -->
<link rel="canonical" href="https://www.beispiel.de/aktuelle-seite/">

Wichtig: Verwenden Sie immer absolute URLs und stellen Sie sicher, dass die Canonical-URL erreichbar ist und keinen noindex-Tag enthält.

301-Redirects einrichten

Für permanente Duplikate ist ein 301-Redirect die stärkste Lösung. Er leitet sowohl Nutzer als auch Suchmaschinen zur korrekten URL weiter:

# .htaccess - HTTP auf HTTPS umleiten
RewriteEngine On
RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

# WWW auf Non-WWW umleiten
RewriteCond %{HTTP_HOST} ^www\.(.*)$ [NC]
RewriteRule ^(.*)$ https://%1/$1 [L,R=301]

# Trailing Slash erzwingen
RewriteCond %{REQUEST_URI} !/$
RewriteCond %{REQUEST_URI} !\.[a-zA-Z0-9]{1,5}$
RewriteRule ^(.*)$ $1/ [L,R=301]

Nginx-Konfiguration:

# HTTP auf HTTPS + Non-WWW
server {
    listen 80;
    server_name beispiel.de www.beispiel.de;
    return 301 https://beispiel.de$request_uri;
}

server {
    listen 443 ssl;
    server_name www.beispiel.de;
    return 301 https://beispiel.de$request_uri;
}

URL-Parameter in der Search Console

In der Google Search Console können Sie Google mitteilen, wie bestimmte URL-Parameter behandelt werden sollen. Markieren Sie reine Tracking- und Session-Parameter als "nicht relevant für den Seiteninhalt", damit Google diese Varianten zusammenfasst.

Hreflang für mehrsprachige Seiten

Bei internationalen Websites mit ähnlichen Inhalten in verschiedenen Sprachen verwenden Sie hreflang in Kombination mit Canonical Tags:

<head>
  <link rel="canonical" href="https://beispiel.de/seite/">
  <link rel="alternate" hreflang="de" href="https://beispiel.de/seite/">
  <link rel="alternate" hreflang="en" href="https://beispiel.com/page/">
  <link rel="alternate" hreflang="x-default" href="https://beispiel.com/page/">
</head>

So versteht Google, dass es sich um Sprachvarianten handelt — nicht um Duplikate. Für international agierende Unternehmen in Bayern — etwa Maschinenbauer mit englischsprachigen Produktseiten oder Tourismusbetriebe mit mehrsprachigen Buchungsportalen — ist korrektes hreflang unverzichtbar.

Meta Robots noindex

Wenn eine Seite existieren soll, aber nicht im Index erscheinen darf, setzen Sie ein noindex-Tag:

<meta name="robots" content="noindex, follow">

Dies eignet sich besonders für:

Interne Suchergebnisseiten
Tag- und Archivseiten mit wenig Mehrwert
Druckversionen oder PDF-Vorschauen
Paginierte Seiten ab Seite 2 (situationsabhängig)

Achtung: Kombinieren Sie noindex niemals mit einem Canonical Tag auf eine andere Seite — das sendet widersprüchliche Signale an Google.

Methode	Einsatzbereich	Stärke	Seiteninhalt bleibt
Canonical Tag	Parameter-URLs, Syndizierung, ähnliche Varianten	Hinweis an Google (kann ignoriert werden)	Ja
301-Redirect	Permanente URL-Änderungen, Protokoll-/Domain-Wechsel	Stärkstes Signal, leitet Nutzer + Bots weiter	Nein (Weiterleitung)
Meta noindex	Seiten ohne SEO-Wert, Archive, interne Suche	Entfernt Seite aus dem Index	Ja
Hreflang	Mehrsprachige/regionale Varianten	Sprach-/Regionszuordnung	Ja
URL-Parameter (GSC)	Tracking-, Filter-, Session-Parameter	Google ignoriert Parameter-Varianten	Ja

Checkliste: Duplicate Content verhindern

Gehen Sie diese Punkte systematisch durch, um Duplicate Content auf Ihrer Website zu vermeiden:

[ ] URL-Normalisierung: Einheitliches Schema (HTTPS, mit/ohne www, Trailing Slash)
[ ] 301-Redirects: Alle URL-Varianten leiten auf die bevorzugte Version weiter
[ ] Self-referencing Canonicals: Jede Seite hat einen Canonical Tag auf sich selbst
[ ] Parameter-Handling: Tracking- und Session-Parameter werden korrekt behandelt
[ ] Sitemap: Enthält ausschließlich Canonical-URLs
[ ] Robots.txt / Meta Robots: Irrelevante Seiten sind von der Indexierung ausgeschlossen
[ ] CMS-Einstellungen: Tag-, Kategorie- und Archivseiten auf noindex prüfen
[ ] Interne Verlinkung: Links zeigen immer auf die Canonical-URL
[ ] Hreflang: Mehrsprachige Seiten korrekt ausgezeichnet
[ ] Monitoring: Google Search Console regelmäßig auf neue Duplikat-Meldungen prüfen

Fazit: Saubere Architektur ist günstiger als Reparatur

Duplicate Content ist kein einzelnes Problem, sondern ein Symptom — meist verursacht durch unsauber abgestimmte Systeme zwischen PIM, CMS und Shop. Selbst wenn Google keine manuelle Abstrafung verhängt, verwässern Duplikate Ihre Link-Signale, verschwenden Crawl-Budget und führen zu unvorhersehbaren Rankings. Mit Canonical Tags, 301-Redirects, URL-Normalisierung und einer klaren Hoheit über Datenflüsse zwischen den Systemen bringen Sie Ordnung in die Seitenstruktur.

Wenn Sie Ihre Website strukturell durchleuchten lassen möchten, ist unser technisches SEO-Audit der direkte Einstieg. Regional begleiten wir Sie über die Standortseiten SEO Würzburg, SEO Augsburg und SEO München oder Sie nehmen direkt Kontakt auf.

Vertiefende Lektüre

Canonical URLs richtig setzen
XML Sitemap erstellen und optimieren
Crawl Budget Optimierung
Süddeutscher Vergleich: SEO-Beratung Stuttgart
Externer Tiefenartikel zur Onpage-Optimierung

FAQ

Bestraft Google Duplicate Content?

Google verhängt in der Regel keine manuelle Abstrafung für Duplicate Content. Allerdings kann Google die betroffenen Seiten herausfiltern, sodass nur eine Version im Index erscheint. Das eigentliche Problem ist die Verwässerung von Link-Signalen und die unvorhersehbare Auswahl der indexierten Version — was sich indirekt negativ auf Ihre Rankings auswirkt.

Ist Duplicate Content zwischen eigenen Seiten ein Problem?

Ja, interner Duplicate Content ist sogar das häufigste Problem. Wenn mehrere URLs Ihrer Website denselben Inhalt zeigen, konkurrieren sie miteinander um Rankings. Google muss selbst entscheiden, welche Version relevant ist, und verteilt die Link-Autorität auf alle Varianten. Setzen Sie Canonical Tags und 301-Redirects ein, um dies zu verhindern.

Was ist der Unterschied zwischen internem und externem Duplicate Content?

Interner Duplicate Content entsteht innerhalb Ihrer eigenen Domain — etwa durch URL-Variationen, Parameter oder CMS-Duplikate. Externer Duplicate Content liegt vor, wenn identische Inhalte auf verschiedenen Domains existieren, etwa durch Content-Syndizierung oder Scraping. Interner Duplicate Content lässt sich vollständig selbst beheben, während externer Duplicate Content zusätzliche Maßnahmen wie Cross-Domain Canonicals erfordert.

Wie funktioniert der Canonical Tag?

Der Canonical Tag ist ein HTML-Element im Head-Bereich einer Seite, das Google die bevorzugte URL mitteilt. Wenn Sie auf einer Duplikat-Seite <link rel="canonical" href="https://beispiel.de/original/"> setzen, signalisieren Sie Google, dass die angegebene URL die Originalversion ist. Google bündelt dann Ranking-Signale auf diese URL. Der Canonical ist allerdings ein Hinweis, keine Anweisung — in seltenen Fällen kann Google ihn ignorieren. Mehr Details finden Sie in unserem Canonical-Tags-Guide.

Kann Duplicate Content von alleine entstehen?

Ja, und das passiert häufiger als gedacht. Content-Management-Systeme erzeugen automatisch Duplikate durch Tag-Seiten, Kategorie-Archive oder Medien-Attachment-Seiten. Webserver liefern denselben Inhalt unter HTTP und HTTPS oder mit und ohne www aus. Auch Tracking-Tools fügen automatisch Parameter an URLs an. Deshalb ist eine regelmäßige Überprüfung mit der Google Search Console und Crawling-Tools unverzichtbar.

Schlagworte

#Duplicate Content #Canonical Tags #URL-Normalisierung #Technisches SEO #Indexierung

Arnold Wender

SEO-Experte & Geschäftsinhaber

Arnold Wender ist Gründer und Geschäftsinhaber von Wender Media. Mit über 19 Jahren SEO-Erfahrung betreut er Unternehmen in Bayern und ganz Deutschland.

Profil anzeigen

Technisches SEO

Cookie	Zweck	Dauer	Anbieter
cookieConsent	Speichert Ihre Cookie-Einstellungen	1 Jahr	Eigene Website
theme	Speichert Ihre Farbschema-Praeferenz	1 Jahr	Eigene Website
session	Sitzungsmanagement für Formulare	Sitzung	Eigene Website

Cookie	Zweck	Dauer	Anbieter
_ga	Unterscheidet Benutzer für Statistiken	2 Jahre	Google Analytics
_gid	Unterscheidet Benutzer (24h)	24 Stunden	Google Analytics
_gat	Begrenzt Anfragen	1 Minute	Google Analytics

Cookie	Zweck	Dauer	Anbieter
_fbp	Facebook Pixel für Werbezwecke	3 Monate	Facebook
_gcl_au	Google Ads Conversion-Tracking	3 Monate	Google Ads

Cookie	Zweck	Dauer	Anbieter
language	Speichert Ihre Spracheinstellung	1 Jahr	Eigene Website
region	Speichert Ihre Regionseinstellung	1 Jahr	Eigene Website

Duplicate Content vermeiden: Ursachen, Erkennung und Lösungen