Um eine mehrsprachige Webseite mit Drupal SEO tauglich zu machen, sind einige Arbeitsschritte notwendig. Ich zeige hier auf, wie man diese meistert und wie man Fallstricke bei der Mehrsprachigkeit umgeht.

Überlegungen zur Abbildung mehrsprachiger Drupal Seiten

Es gibt drei Möglichkeiten eine Seite multilingual anzubieten:

  • jede Sprache auf eine eigene Top Level Domain (TLD)
  • jede Sprache in eine Subdomain
  • jede Sprache in ein Unterverzeichnis (bei einer Domain-Abstrafung triff es dabei alle Sprachen)

Bezüglich des Linkmarketings sind die Aufwände bei einer TLD anfangs höher, da diese noch über keine Verlinkung oder Trust verfügen. Im Laufe der Zeit ändert sich dies durch bessere Positionierung und bessere Conversion-Rate. Die letzte Variante würde ich schon alleine aus dem Grund ausschließen, da dadurch kein eigener Server für die jeweilige Sprache verwendet werden kann (Anmerkung: aus Skalierungsgründen ist es über Reverse Proxies möglich, was aber keine Lösung für den Server-Standard aus Suchmaschinen-Sicht darstellt - danke für den Hinweis Kristoffer). Der Server-Standort spielt unter anderem eine wichtige Rolle für das Ranking der Webseite.

Alle drei Varianten können mit Drupal ohne Anpassungen eingesetzt werden. Die Einstellungen dazu sind unter Verwaltung » Konfiguration » Lokalisierung und Sprache » Sprachen zu finden:

Einstellungen zum Mapping Sprache / Domain in Drupal

Wichtig: Es ist darauf zu achten, dass jede Sprachvariante vollständig übersetzt ist. Darunter zählen neben dem eigentlichen Seiteninhalt folgende Bereiche:

  • Seitentitel (z.B. mit Hilfe des Sandbox Modules Page Titles per Language
  • Ankertexte von internen und externen Links
  • Meta Description (z.B. mit Hilfe von Meta tags quick
  • Alt-Texte von Bildern
  • Menüpunkte / Menüstruktur und Navigation. Hinweis: oft werden Flaggen für bestimmte Sprachen eingesetzt. Dabei wird oft vergessen, dass Flaggen nicht für Sprachen, sondern für Länder stehen.
  • URL Benennungen (mit Pathauto und Transliteration)
  • XML Sitemap
  • Fehlerseiten (403 und 404 Fehler) - kann man mit Hilfe des i18n Moduls und der Kennzeichnung von multilingualer Variablen zu den Fehlerseiten gelöst werden.

Google Webmaster Tools

In den Google Webmaster Tools kann man das geografische Ziel zur Domain angeben. Diese Einstellung steht nur zur Verfügung, wenn man eine neutralen Top-Level-Domain verwendet wie eine .COM oder .ORG Domain. Setzt man z.B. eine com-Domain ein und will damit den deutschen Markt ansprechen, kann man dies mit dieser Einstellung erzwingen. Normalerweise ist es nicht notwendig diese Einstellung zu setzen, sofern der HTML Code entsprechende Länder Kennzeichnungen enthält. In Ausnahmesituationen kann diese Einstellung aber sehr hilfreich sein.

Ansicht Google Webmaster Tools bei einer DE Domain

Ansicht Google Webmaster Tools bei einer COM Domain

Bing Webmaster Tools

Innerhalb der Bing Webmaster Tools kann keine Zuweisung für das geografische Ziel wie innerhalb der Google Webmaster Tools vorgenommen werden. Bing richtet sich also ausnahmslos an den Inhalt der Seite (HTML, HTTP).

Andere Länder - gleiche Sprachen

Bisher gab es für Länder, in denen die gleichen Sprachen gesprochen werden, keinen Königsweg, um doppelten Content zu vermeiden. Das Problem trat genau dann auf, wenn man jedes Land z.B. mit einer TLD, einer Subdomain oder einem Unterverzeichnis konkret ansprechen wollte.

Hier ein Beispiel dazu:

  • Deutschland
  • Österreich
  • Schweiz (damit das Beispiel überschaubar bleibt, nur die deutschsprachige Schweiz)

Für alle drei Länder soll eine TLD zum Einsatz kommen: meindomain.ch, meinedomain.de und meinedomain.at Die Texte der drei Domains decken sich fast. Nur geringe Anpassungen bezüglich der Wortwahl und der Anrede wurden gemacht. Durch die Einführung der Auszeichnung hreflang hat Google es nun ermöglicht, dass man damit der aktuellen Seite mitgeben kann, welche Übersetzungen zu dieser Seite existieren. In unserem Beispiel würde man also in der deutschen Seite auf meinedomain.de folgende Zeilen im HTML Header einfügen:

  <link rel="alternate" hreflang="de-CH" href="http://www.meinedomain.ch/" />
  <link rel="alternate" hreflang="de-AT" href="http://www.meinedomain.at/" />

Um nun duplicate content auszuschließen, muss eine der 3 vorliegenden Seiten mit einem Indexierungssignale kombiniert werden, indem mit rel=”canonical” die kanonische Version festgelegt wird. Ich wähle für unser Beispiel die Seite auf “meinedomain.de” aus. Aus diesem Grund wird in allen 3 Webseiten folgendes eingefügt:

  <link rel="canonical" href="http://www.meinedomain.de/" />

Festgehalten hat diese Vorgehensweise Google in folgender Hilfeseite:

und im Webmaster Central Blog gibt es viele interessante Kommentare zum Thema: New markup for multilingual content

Die Frage die offen bleibt ist, wie die anderen Suchmaschinen damit klar kommen, da diese offiziell nicht hreflang unterstützen (bis zum aktuellen Zeitpunkt). Im schlechtesten Fall würde das bedeuten, dass diese Suchmaschinen duplicate content erkennen - und dies eventuell abstrafen.

Zum aktuellen Zeitpunkt gibt es noch keine offizielle hreflang Unterstützung mit Drupal. Es lässt sich aber leicht eine Integration über einige Hooks durchführen.

Stolpersteine SEO tauglicher Webseiten

robots.txt

Für die unterschiedlichen Sprachen ist es sehr wahrscheinlich auch erforderlich, dass sprachbezogene Anpassungen in der robots.txt gemacht werden müssen. Um dies zu erreichen kann man das Drupal Modul robotstxt einsetzen.

Inhalte nur sprachbezogen ausgeben

Ein Inhalt (z.B. Node) sollte nur unter dem Pfad zur Sprache ausgegeben werden für den er vorgesehen ist. Beispiel: node/1 ist in deutsch geschrieben für die Domain meinedomain.de. node/1 sollte also nicht unter einer anderen Sprache mit der Domain meinedomain.com erreichbar sein. Abhilfe schafft hier das Modul globalredirect mit der Option “Prüfen der Sprache für einen Pfad” oder ein Redirect auf Webserver Ebene mit Hilfe von modrewrite Regeln.

Duplicate Content

Jeder Inhalt sollte nur über eine einzige URL bereitgestellt werden, oder mit Hilfe eines Indexierungssignale gekennzeichnet sein. Hierbei ist auch zu beachten, dass die robots.txt mit den Meta Angaben und der XML Sitemap übereinstimmen muss. Damit ist gemeint, dass man keine Seite in die XML Sitemap aufnehmen sollte, die z.B. über die robots.txt wieder ausgeschlossen wird.

Aktualisiert: