Der Begriff Duplicate Content (= Doppelter Inhalt) wird im SEO Bereich verwendet, wenn der gleiche Inhalt über verschiedene URLs (Webadressen) erreichbar ist. Bei der Indexierung im Web ist Duplicate Content eines der Hauptprobleme und Ursache dafür, dass Webseiten schlecht ranken und kaum hoch kommen - selbst bei gutem Inhalt. Es empfiehlt sich bei regelmäßigen Site-Abfragen immer die Anzahl der indexierten Seiten im Auge zu behalten um im Notfall schnell reagieren zu können.

Duplicate Content Gefahrstellen

In diesem Artikel liste ich fünf Duplicate Content Gefahrstellen auf, die bei einer Drupal-Installation oft für Probleme sorgen und noch immer nicht jedem Webmaster bewusst sind.

URL Aliases

Mittels URL Aliases erzeugt man wunderbar sprechende URLs. Nur leider sind die original URLs ebenfalls noch erreichbar und man kann auf den gleichen Inhalt ein weiteres Mal zugreifen, wenn man zum Beispiel keine entsprechende Anpassung in der robots.txt vorgenommen hat. Ein robots.txt Eintrag, der solche Seiten ausnimmt könnte zum Beispiel wie folgt aussehen: User-agent: * Disallow: /node/

Seitentitel (Page Titles)

Angeblich werden Seiten, die sich im HEAD-Bereich nicht unterscheiden von Google abgewertet. Davon betroffen ist vor allem der Seitentitel, die Meta-Description und die Meta-Keywords. Hier empfiehlt es sich mehr Wert auf kreative Gestaltung des Seitentitels zu legen. Mit Hilfe der verfügbaren Tokens lässt sich der Seitentitel individuell im Adminbereich von Drupal 7 unter Verwaltung / Konfiguration / Suche und Metadaten entsprechend anpassen.

Druckansicht (Printer friendly pages)

Auch die Druckansicht liefert Gefahrenpotential für doppelten Inhalt, weil durch den Klick auf den Link der Inhalt noch einmal nur in anderer Darstellung ausgegeben wird. Auch diese URLs müssen unbedingt über die robots.txt gesperrt werden. Man sollte auch überprüfen ob man folgenden Parameter im HEAD-Bereich der Druckseiten unterbringen kann um das Indexieren dieser Seiten zu vermeiden: <meta name=”robots” content=”noindex”>

Sortierbare View Listen

Das tolle an Drupal CMS ist die unterschiedliche Darstellung der Inhalte mittels Views. Vorsicht ist geboten bei sortierbaren Ansichten, weil sich durch die Änderung der Sortierreihenfolge nichts am dargestellten Inhalt ändert. Sobald die sortierten Listen per Link erreichbar sind und über unterschiedliche URLs aufgerufen werden können, entsteht Duplicate Content. Sinn macht es hier sich vorher Gedanken über die URL-Struktur zu machen und mit dem Canonical-Tag zu arbeiten. Man kann auch mit dem URL-Parameter Werkzeug der Google Webmaster Tools arbeiten, um die entsprechenden Sortierungsparameter auszuschließen.

Multiple Kategorien (Multiple node terms)

Ähnlich wie bei den sortierbaren Listen gibt es Probleme, wenn man mit mehreren Kategoriebegriffen für ein und denselben Node arbeitet. Vor allem dann, wenn in der entsprechenden Kategorie nur ein einziger Eintrag vorhanden ist, weil der gleiche Teaser auf unterschiedlichen Kategorieseiten erscheint. Hier ist es wichtig, dass man versucht mit so wenig Kategorien pro Node wie möglich klar zu kommen und in jeder Kategorie wenigstens 2 Einträge hat.

Glücklicherweise können die hier genannten Probleme mit ein paar zusätzlichen Modulen (Modulanpassungen) und Einträgen in der robots.txt und der .htaccess einfach gelöst werden. Mehr Infos zu diesem Thema gibt es über die Suche. Bei Fragen stehen unsere Drupal SEO Experten aus München ebenfalls gerne zur Verfügung.

Aktualisiert: