Um eine XML Sitemap mit Drupal zu erzeugen, verwendet man das XML sitemap Modul, welches auf drupal.org zum Download bereit steht. Der Vorteil für den Einsatz einer XML Sitemap ist, dass man Suchmaschinen schnell auf einen neuen oder geänderten Inhalt aufmerksam machen kann. Ein weiterer Vorteil besteht darin, dass dadurch auch verhindert wird, dass die Suchmaschine etwas “vergisst” zu indizieren.
Der Einsatz einer XML Sitemap ersetzt nicht das Crawlen der Seite durch die Suchmaschine. Allerdings geht die Suchmaschine schon davon aus, dass der Inhalt der XML Sitemap richtig ist. Damit ist folgendes gemeint: ist in der Sitemap eine URL zu einem Inhalt aufgeführt, dann sollte diese auch öffentlich zugänglich sein (und z.B. keine Zugriffsbeschränkung existieren). Die URLs müssen im richtigen Format vorliegen - setzt man URL Aliases ein, müssen diese auch in der XML Sitemap gesetzt werden. Bei der Einhaltung dieser Dinge hilft das XML Sitemap Drupal Modul weiter. Das Modul sorgt dafür, dass der Standard bei der Erzeugung der XML Datei eingehalten wird, welcher auf sitemaps.org beschrieben ist.
Installation
- Man lädt das Modul XML sitemap herunter und entpackt es in das von Drupal vorgesehene Verzeichnis
sites/default/modules
oder
sites/all/modules
- Man aktiviert die benötigten Module. XML Sitemap kommt mit mehreren Contrib Modulen. Die kann man nach den benötigten Anforderungen aktivieren:
Liste der verfügbaren Module:
- XML sitemap - Basismodul, wird immer benötigt.
- XML sitemap custom - Damit kann man benutzerdefinierte URLs in die Sitemap aufnehmen (z.B. für Seiten oder Dateien, die nicht über Drupal gepflegt werden)
- XML sitemap engines - zur Übermittlung an den Suchmaschinen, falls ein neuer Inhalt vorhanden ist oder ein bestehender geändert wurde
- XML sitemap internationalization - macht es möglich für jede Sprache eine eigene Sitemap zu erstellen - unbedingt erforderlich für mehrsprachige Webseiten, da sonst alle Sprachvarianten der Webseite die gleiche Sitemap benutzen und dies zu schwerwiegenden Problemen bzgl. doppelten Content, falsche Inhaltszuordnung, u.s.w. führt.
- XML sitemap menu - falls die Menüpunkte in der Sitemap aufgeführt werden sollen
- XML sitemap node - das wichtigste Modul, welches den Inhalt (eine Node) der Sitemap hinzufügt
- XML sitemap taxonomy - falls Taxonomie Terms hinzugefügt werden sollen
- XML sitemap user - falls die URLs zu den Benutzerprofilen aufgenommen werden soll (Vorsicht, die Zugriffsrechte müssen dazu auch richtig gesetzt werden!)
Die Konfiguration
Die Konfiguration und die XML Sitemap selbst legt man unter der folgenden URL (Konfiguration/Suchen und Metadaten/XML sitemap) an.
/admin/config/search/xmlsitemap
Zuerst wird der Punkt “Neue XML-Sitemap hinzufügen” ausgewählt. Im zweiten Schritt wählt man die gewünschte Sprache aus. Fertig.
Sitemap Anmeldung bei Bing
Um die Sitemap bei Bing anzumelden, benötigt man einen Account zu den Bing Webmaster Tools unter
http://www.bing.com/toolbox/webmaster/
Dort legt man die Domain an, um die es geht und lädt die Authentifizierungsdatei herunter (die wird dann im nächsten Abschnitt benötigt). Im Menü unter dem Punkt “Crawl” findet man den Eintrag Sitemaps (XML, Atom, RSS). Dort wählt man “Add Feed” aus und gibt den Name der Sitemap an.
Sitemap Anmeldung bei Google
Auch für die Sitemap Anmeldung bei Google ist ein Account notwendig. Und zwar für die Google Webmaster Tools unter:
https://www.google.com/webmasters/tools/home?hl=de
Auch hier legt man die gewünschte Domain an, für die man die XML Sitemap anmelden will. Im Menü “Website-Konfiguration” findet man den Menüpunkt “XML-Sitemaps”. Dort klickt man auf den Button “SITEMAP HINZUFÜGEN/TESTEN” und gibt den vorher in Drupal vergebenen Namen der Sitemap an.
Authentifizierung
Um eine XML Sitemap bei Google oder Bing einreichen zu können, muss die Seite erst authentifiziert werden. Dazu lädt man entweder die Authentifizierungsdateien ins Hauptverzeichnis von Drupal. Oder man verwendet das Modul site_verify. Kommt ein Multi-Site Projekt zum Einsatz oder ein mehrsprachiges Projekt über mehrere Domains, führt kein Weg um das site_verify Modul herum. Da für die unterschiedlichen Projekte / Domains teilweise gleichnamige Dateien abgelegt werden müssten (was ja nicht funktionieren kann).
Fallstricke
Setzt man eine XML Sitemap ein, teilt man dadurch der Suchmaschine mit, welche Inhalte man gerne indiziert bekommen möchte. Deshalb ist darauf zu achten, dass URLs die in der XML Sitemap gelistet sind, nicht durch die robots.txt oder durch ein noindex TAG gesperrt sind. Ist dies der Fall, wird man in den Google Webmaster Tools darauf hingewiesen, dass genau diese Inhalte durch die robots.txt gesperrt sind. Eine Abstimmung zwischen XML Sitemap Konfiguration, robots.txt und Metatags Robots Konfiguration ist auf jeden Fall notwendig. Auch wenn dies ein umfangreiches Unterfangen werden kann.
Besondere Vorsicht ist auch geboten, wenn es sich um ein mehrsprachiges Projekt handelt. Für jede Sprache muss in diesem Fall unbedingt eine eigene Sitemap erstellt werden. Das xml_sitemap Modul unterstützt standardmässig Mehrsprachigkeit. Dazu weist man einfach die gewünschte Sprache der jeweiligen Sitemap zu (beim Anlegen oder bei der Bearbeitung).