Den HTTP-Statuscode 404 für Seite nicht gefunden hat mit Sicherheit schon jeder von uns mindestens einmal bei einem Ausflug ins WWW erleben dürfen. Der 404 Fehler erscheint bei der Verwendung von veralteten Links, wenn eine Seite oder ein Dokument entfernt, verschoben oder umbenannt wurden. Dieses Phänomen tritt häufig nach einem Relaunch der Webseite auf, wenn Seiten gelöscht wurden, URL anders erzeugt werden als vorher oder sich die Seitenstruktur geändert hat. In diesem Artikel erkläre ich warum man 404 Fehlerseiten vermeiden soll, wo man Hinweise dazu in Drupal findet und wie man zur Fehlerbehebung eine 301 Weiterleitung auf die neue URL erstellt.
Augen auf bei 404 Fehlern
Für viele Webseitenbetreiber ist so eine Fehlerseite einfach ein lästiges Übel, welches ohne eine Handlung akzeptiert wird. Wer seine Zeit in die Suchmaschinenoptimierung seiner Webseite steckt, sollte gerade den 404 Fehlermeldungen seine Aufmerksamkeit widmen. Es gibt zwei gute Gründe, warum man 404 Error Messages vermeiden sollte:
- aus Usability-Sicht sind nicht mehr existierende Linkverweise sehr ärgerlich und deuten auf vernachlässigten Inhalt hin. Erst steckt man viel Arbeit in seine Webseite, damit sie möglichst gut rankt und Besucher anzieht. Hat man das erreicht, enttäuscht man die Besucher indem man die interessanten Inhalte gelöscht, verschoben oder falsch verlinkt hat - und sich nicht mal die Mühe macht einen 301 Redirect dafür zu erstellen.
- aus SEO Sicht ist man der Meinung, dass zu viele 404 Fehlermeldungen das Ranking einer Seite negativ beeinflussen können. Google schreibt zwar selbst in einem Blogpost auf Googlewebmastercentral, dass es normal ist, dass im Laufe der Zeit URLs im Netz nicht mehr funktionieren, dennoch geben Sie deutliche Hinweise, dass man überprüfen soll, warum ein 404 Fehler ausgegeben wird und ob man nicht lieber einen 301 Redirect hierzu einrichtet. Zudem sollte man sicher stellen, dass 404-Seiten nicht den Statuscode 200 (OK) ausgeben und Google damit vortäuschen der Link sei korrekt. Solche Seiten werden nämlich weiterhin im Suchindex gelistet. Um dies zu überprüfen kann man kostenlose Tools aus dem Internet verwenden, wie zum Beispiel den 404Checker.
404 Fehler in Drupal aufspüren und beheben
Wenn man wissen möchte, wie viele 404 Fehlermeldungen in seinem Drupalsystem existieren kann man sich die Liste der häufigsten 404 Fehlermeldungen im Administrationsbereich des CMS unter Berichte ausgeben lassen. Hierzu einfach auf Häufigste ‚Nicht gefunden‘-Fehler klicken. Dann erhält man folgende Ansicht:
Die im Drupal System gelisteten 404 Fehlerberichte enthalten nur solche Meldungen von fehlerhaften Links, die durch einen Besucher bereits angeklickt wurden. Der Vorteil des eben genannten Berichts liegt darin, dass die Liste nach Häufigkeit der auftretenden Fehler sortiert ist. Möchte man zusätzlich den Referrer untersuchen, von welchem der Linkverweis kam, ruft man im Administrationsbereich des Drupal CMS über Berichte den Punkt Aktuelle Protokollnachrichten auf. Dort filtert man die Liste nach Fehler und bekommt dadurch eine zeitliche Auflistung der Fehlermeldungen inklusive des Referrers angezeigt. Hierzu filtert man das Ergebnis nach page not found Einträgen und klickt auf den Link in der Spalte Nachricht. Hier kann man dann überprüfen von welcher Seite der falsche Link kam. Eventuell ist es ja möglich dort durch Korrigieren der URL den Fehler zu beheben, bevor man einen 301-Redirect einrichtet.
Redirect einrichten
Im Bereich Häufigste ‚Nicht gefunden‘-Fehler besteht die Möglichkeit gleich einen Redirect zur neuen URL einzurichten, um den Fehler zu beheben. Hierzu auf den Link “Fix 404 pages with URL redirects” klicken. Aus der Liste der Einträge den Eintrag auswählen, der gefixt werden soll. Hierzu einfach den Link Umleitung hinzufügen auswählen. Wie in der folgenden Eingabemaske ersichtlich kann man hier den neuen Linkverweis eintragen und eine 301 Weiterleitung einrichten. Der 301-Redirect ist bereits standardmäßig ausgewählt. Zu beachten ist hier auch die Auswahl der Sprache (Deutsch, Englisch), wenn man die Webseite mit mehr als einer Sprache betreibt. Mehr zum 301-Redirect erfährt man im Artikel HTTP Statuscode 301 Weiterleitung.
404 Fehler vorbeugend suchen
Die hier erwähnten Berichte listen nur 404 Fehlerseiten auf, die von einem User durch anklicken erzeugt wurden. Es können noch sehr viel mehr nicht mehr funktionierende Links existieren. Will man diese vorbeugend identifizieren kann man spezielle Webdienste verwenden. Wie den w3C Linkchecker oder man setzt das Drupal Modul LinkChecker ein. Der Vorteil vom w3C Dienst ist, dass es die Webseite komplett crawled und nach Fehler durchsucht, im Gegensatz zum Modul, welches sich nur auf die Seiten aus dem Drupalsystem bezieht. Dafür hat das Drupal Modul den Vorzug, dass es automatisch das System nach fehlerhaften Links überprüft und hierzu regelmäßig einen Bericht erstellt, den man dann abarbeiten kann (bzw. sollte).
404 Fehlerseiten gestalten
Die vom Server standardmäßig ausgegebene 404 Fehlermeldung ist zum einen hässlich und zum anderen nicht nutzerfreundlich. Ziel ist es immer, einen Besucher so lange wie möglich auf der Webseite zu halten und ihm die nötigen Informationen zu liefern. Klappt das nicht und er landet wegen falscher oder veralteter Verlinkung auf einer 404 Fehlerseite, dann soll die dem User nützliche Informationen liefern, wie es weiter geht. Laut Google wären das unter anderem folgende Inhalte:
- dem Besucher deutlich aber freundlich erklären, dass der Inhalt nicht (mehr) unter der URL existiert
- die 404 Seite so gestalten, wie das Design der restlichen Seite. Ist das nicht möglich oder gewünscht, sollte wenigstens eine Navigation existieren die auf die Webseite verweist.
- es wird empfohlen Links zu den meist gelesenen Beiträgen, sowie zur Startseite der Webpräsenz zu integrieren.
- es soll überlegt werden, ob Besucher die Möglichkeit erhalten einen defekten Link zu melden.
- man soll sicher stellen, dass der Webserver bei nicht mehr existierenden Seiten auch tatsächlich einen 404-HTTP-Statuscode ausgibt, damit Google etwa diese Fehlerseite nicht indiziert und in den Suchergebnissen ausgibt.
Es gab kürzlich einen TED-Talk, der das Theme 404 Fehlerseiten von einer witzigen Seite beleuchtet hat. Hier das Video dazu. [Video auf youtube](https://www.youtube.com/watch?v=eHrcRqu_Es4
Für Drupal gibt es verschiedene Module hierzu, wie beispielsweise das Fast 404. Möchte man jedoch aus Performance-Gründen die Anzahl der Modul möglichst gering halten, verzichtet man auf ein spezielles Drupal Modul und erstellt sich statt dessen eine manuelle 404-Fehlerseite die man dann ins System einbindet, indem man in der .htaccess-Datei einen entsprechenden Eintrag setzt, welcher die fehlerhaften Seitenaufrufe auf die manuell erstellte 404-Seite weiterleitet.
Zusammenfassung
404-Fehler sollte man so gering wie möglich halten. Die Ausgabeseiten der 404 Fehlermeldungen dürfen vor allem aus Gründen der Benutzerfreundlichkeit mit eindeutigen und nützlichen Informationen bestückt und ansprechend gestaltet sein. Es gibt Berichte im Adminbereich von Drupal, die alle page not found Fehler auflisten und gegebenenfalls auch den Referrer anzeigen. Diese Berichte regelmäßig kontrollieren und die Fehler möglichst frühzeitig beheben. Wenn nötig auf Drupalmodule wie zum Beispiel Fast 404 und LinkChecker zurück greifen. Alternativ kann man auch mit Webdiensten arbeiten oder manuell eine 404-Fehlerseite erstellen und auf diese verweisen.
Hinweis: Die hier genannten Drupalmodule gehören übrigends zu den sogenannten Must-Have Drupal SEO Modulen, die man zur Suchmaschinenoptimierung seines Projekts einsetzen sollte.