HTTP Codes des eigenen Webservers analysieren und Probleme beim Webseitenzugriff beseitigen

Eine kontinuierliche Optimierung, ein Update oder ein Ausbau von Internetpräsenzen ist das A und O eines jeden Unternehmers und Webseitenbetreibers. Durch interne und externe Links kommt auch die eigene Präsenz in Bewegung und muss kontinuierlich geprüft werden. Nicht nur wg. der sich ständig weiterentwickelnden SEO Anforderungen, sondern auch wegen der Veränderung Dritter, können Probleme auf dem eigenen Internetauftritt entstehen. Diese resultieren oftmals in HTTP Fehlern, welche schnell und einfach nachverfolgt und gelöst werden können. In diesem Artikel beschreibe ich die grundsätzlichen Fehlercodes, die möglichen Ursachen und Lösungen.

Einleitung

Einige Webseitenbetreiber sind sich der Thematik bewusst, andere eher weniger. Oft passiert es bei Recherchen über Suchmaschinen, das Ergebnisse ausgegeben werden, welche beim Webseitenbetreiber nicht mehr unter der bekannten URL zugreifbar sind. Es entstehen so 404 Fehlermeldungen für den Benutzer. Ob dies durch die Neugestaltung von URLs oder einem Umbau der Webseite passiert, führt zum gleichen Ergebnis – Wichtiger Inhalt nicht mehr zugreifbar.

Beim Webseitenbetreiber führt dies oftmals zu einem massiven Verlust an Besucherzahlen oder sogar zu Ärgernissen bei Kunden. Aus Sicht der Suchmaschinenoptimierung (engl. search engine optimisation; kurz: SEO) wird dies ggf. sogar negativ bewertet, sodass die Fehlercodes des Webservers ausgewertet und passende Gegenmaßnahmen gefunden werden müssen, um das eigene Ranking nicht zu gefährden.

Thematische Abgrenzung

In diesem Artikel geht es ausschließlich um Fehlercodes des eigenen Webservers, der eigenen Webseite, wenn eine URL aufgerufen wird. Diese können je nach Art und Umfang der Webpräsenz und deren Gestaltung behandelt werden. Alternativen hierzu werden in diesem Artikel nur am Rande behandelt. So kann oftmals auch ein HTTP Fehlercode an der Firewall vor dem Webserver, aber auch durch den Einsatz eines Reverse Proxy abgefangen werden. Dies soll aber nicht der Schlüssel für eine in sich funktionierende und als Produkt in sich geschlossene Webseite auf einem Webserver sein.

Was sind HTTP Fehlercodes?

Ohne zu tief in den Aufbau des Internets, der dort verwendeten Protokolle und Zugriffe zu gehen, kann man sagen – HTTP Fehlercodes sind Antworten des Webservers, welche einen technischen Status des Webseitenaufrufes wiedergeben. Diese können vom Webserver selbst, aber auch vom gegenüberliegenden Webbrowser interpretiert werden, um eine Fehlerbehandlung zu ermöglichen. Oftmals werden die Fehlercodes von technischen Details (also technischen Inhalten) begleitet die ein Webseitenentwickler interpretieren kann, um diese beheben zu können.

Bedeutung von HTTP Statuscodes für Suchmaschinen und Ihre Besucher

Die Inhalte von Fehlercodes sind für die Webseitenentwickler zwingend notwendig, um Rückschlüsse auf mögliche Ursachen zu finden. Technisch versierte Anwender können in der Regel eher selten mit dem technischen Code, als auch mit den Details der Fehlermeldung eine Lösung herbeiführen.

Oftmals können die Besucher einer Webseite nur wenige Statuscodes sehen. Ganz im Gegensatz zu Suchmaschinen und Ihren Crawlern. Diese interpretieren nicht nur die Fehlercodes, sondern Sie folgen auch den Details der Meldung und bewerten diese.

Das Internet lebt und verändert sich kontinuierlich. So verändern auch Webseitenbetreiber von Zeit zu Zeit Ihren Internetauftritt. Damit geht meist einher, das Inhalte verändert, entfernt oder umgezogen werden. Dies hat natürlich Auswirkungen auf die eigene Webseite. Erst recht, wenn dort Links zu fremden Artikeln der gegenüberliegenden Seite hinterlegt sind. Funktioniert ein Link, so wird dieser auch von Google als Suchmaschine beim Crawlen berücksichtigt. Häufen sich die “404 not found” Fehlermeldungen, so kann davon ausgegangen werden, dass die Webseite nur schlecht gepflegt wird. Dies resultiert nicht nur in einer möglichen schlechten Bewertung, sondern erhöht auch unnötig die Absprungrate der Benutzer.

Wie können Webseitenbetreiber auf Fehlercodes Ihrer eigenen Webseite zugreifen?

Bei vielen Hostern wie IONOS, United Domains oder KONTENT werden die Protokolle der eigenen Webpräsenz, in einem separaten Verzeichnis gespeichert. Sie sind oftmals an Dateien mit dem Namen access.log und/oder error.log erkennbar. Auf diese kann entweder über die Verwaltungs-Webseite des Betreibers, oder über ein FTP Programm wie FileZilla zugegriffen werden. Bei einigen One-Click-Hostern kann auf diese Dateien teilweise nur über den Kontakt mit dem Support zugegriffen werden.

In den Dateien werden sowohl die Webseitenaufrufe, als auch die Antworten des Webservers mit Datum und Uhrzeit gespeichert. Neben der Auswertungsmöglichkeit der Zugriffe, können die Fehlercodes des Webservers eingesehen und ausgewertet werden. Für die Analyse der in der Webseite genutzten Hyperlinks auf dritte Webseitenbetreiber, können zudem interne CMS Tools als auch externe Webdienste wie Screaming Frog (https://www.screamingfrog.co.uk/seo-spider/) verwendet werden.

HTTP Statuscodes und Ihre Kategorien

Generell können Fehlercodes in Kategorien eingeteilt werden, welche einen groben Rückschluss auf den Fehler ermöglichen. Die Protokolldefinition nach RFC2616 (https://tools.ietf.org/html/rfc2616) sieht folgende Kategorien vor:

  • 1xx – Informationen
  • 2xx – Erfolgreiche Abfrage
  • 3xx – Umleitungen
  • 4xx – Zugriffsfehler
  • 5xx – Serverfehler

Abweichend von den definierten HTTP Statuscodes, können noch weitere softwarespezifische Fehlercodes verwendet werden. Diese werden durch den Softwarehersteller selbst implementiert und sollten nur im Bereich 600 bis 999 zu finden sein.

Die häufigsten HTTP Statuscodes

  • 200 Erfolgreiche Abfrage
    • Innerhalb dieses Statuscodes werden je nach Webserver und Konfiguration auch die an den Client zurückgelieferte Datenmenge mit angegeben. Dadurch ist eine Messung des Traffic-Volumens der Webpräsenz möglich.
  • 204 Kein Inhalt
    • Dieser Statuscode wird häufig von Webdiensten verwendet, wenn z. B. eine IoT oder M2M Kommunikation stattfindet. Dabei achtet der sendende Client bewusst auf den HTTP Statuscode um sich zu vergewissern, dass alle gesendeten Daten beim Webserver angekommen sind.

Die häufigsten HTTP Fehlercodes

  • 301 Permanent Verschoben (Umleitung)
    • Mit dieser Meldung wird der anfragende Browser informiert, dass die aufgerufene Webseite nicht mehr gültig ist und der unter einer neuen Adresse den Inhalt abrufen muss.
  • 302 Temporär Verschoben (Umleitung)
    • Diese stellt wie die 301 Umleitung eine neue URL zur Verfügung. Hier wird jedoch dem gegenüberliegenden Browser dies als temporäre Lösung angegeben.
  • 403 Verboten
    • Der Client besitzt zum aufrufenden Zeitpunkt nicht die Rechte, auf diese URL aufzugreifen. Es kann sich dabei auch nur um Teile der URL handeln, welche verboten sind.
  • 404 Kein Inhalt / Page not Found
    • Die häufigste aller Fehlermeldungen, welche zudem eine Benutzermeldung auslöst. Der Webserver konnte keine Webseite zu dieser URL zurückgeben.
  • 500 Allgemeiner interner Server Fehler
    • Der Webserver konnte die Anfrage des Browsers nicht verarbeiten. Gründe hierzu sind oftmals nicht in den Logdateien der Webseite, sondern im Protokoll der Webseiten-Anwendung zu finden.
  • 503 Dienstfehler
    • Der Webserver hat die Anfrage erhalten, kann die Rückantwort aufgrund eines zusätzlich notwendigen Dienstes, wie z. B. einer Datenbankanbindung, nicht bearbeiten.

Die häufigsten Ursachen für HTTP Status 404

Je nach Art der Fehlerursache können unterschiedliche Mittel zur Lösung eingesetzt werden. Nachfolgend werden die häufigsten Probleme und deren Lösungen beschrieben.

Umzug von HTTP auf HTTP/S

Viele Webseitenbetreiber haben in den letzten Jahren einen Umzug Ihrer Webseiten vom unverschlüsselten HTTP Protokoll, auf das mittels Zertifikat verschlüsselte HTTP/S Protokoll durchgeführt. Dabei werden oftmals die Hauptseiten umgezogen, jedoch Unterseiten nicht mit einer Weiterleitung versehen. So entstehen Fehlercodes beim Aufruf einer HTTP URL, welche durch einfaches Anpassen auf HTTP/S gelöst werden können.

Dies kann für den eigenen Webauftritt in der Regel über eine generelle Webserverregel in der “.htaccess” Datei , oder über die Webconsole des Hosters aktiviert werden. Dadurch können bei dritten gespeicherte HTTP Links weiterhin aufgerufen werden. Technisch wird hierbei größtenteils eine HTTP 301 Umleitung zur Problemlösung eingerichtet.

Neuer Name einer Unterseite

Nicht selten verändert sich im Laufe eines Lebens der Webseite das Unternehmen oder die Dienstleistung. So wird initial bei der Unternehmensgründung eine “Über mich” Seite mit allen Details erstellt, welche bei einem Wachstum auf “Über uns” umbenannt wird. Diese Um-Benennung verändert auch die URL der Webseite und kann zu 404 Fehlern bei Kunden führen, welche sich ggf. für Ihre Kontaktdaten einen Link im Browser gespeichert hatten.

Dies kann mittels HTTP 301 Umleitung umgangen werden. Dadurch erhält der Kunde beim Aufruf der “Über mich” Seite zielführend die neue “Über uns” Webseite dargestellt, ohne dass Sie ihn darüber informieren müssen. Die Weiterleitungsregel übernimmt hierbei für Sie die Arbeit, indem Sie den Statuscode 301 inklusive der neuen URL an den Webbrowser weitergibt.

Tippfehler in der Webseiten URL

Es kann vorkommen, das bei komplizierten Namen oder Begriffen, Tippfehler entstehen. Sollte die Analyse der Webserverprotokolle ergeben, dass dies häufiger passiert – so kann auch hierfür die Weiterleitung auf die passende URL, die Lösung sein.

Regelmäßige Webseitenüberprüfung als Wartungsstrategie

Wie zuvor beschrieben können einige Statuscodes effektiv verhindert und im Nachgang sogar korrigiert werden. Zum Auffinden solcher Fehler kann aber nicht nur das eigene Webserverprotokoll herangezogen werden. Alternativ können auch externe Webdienste oder ein im Webauftritt integriertes Addon oder Plugin verwendet werden. Diese Tools können in interne oder externe gegliedert werden.

Tools zur Webseitenprüfung:

Als externe Tools werden nachfolgend nur Webdienste, die autark von der eigenen Webpräsenz funktionsfähig sind. Damit können unabhängig des eigenen Content Management Systemen (kurz: CMS) Fehler identifiziert werden.

Google Webmaster Tools (Google Search Console)

Die Google Suche wird durch die dahinterliegenden Crawler gefüttert. Die zuvor als Webmaster Tools bekannte Sammlung an Tools beinhaltet auch die Search Console (https://search.google.com/search-console). Diese gibt nach entsprechender Anmeldung der Webseiten alle beim Crawling entstehenden Informationen wieder. Hier können eine URL Prüfung, die Leistung der Webseite, aber auch die dabei gefundenen 404 Fehler oder Anomalien als Bericht eingesehen werden.

SEOCheck von SEObility

Der von SEObility angebotene Check (https://www.seobility.net/de/seocheck/) umfasst neben einer vollständigen kostenpflichtigen SEO-Webseitenanalyse auch den kostenlosen Check. Dieser geht auch über die Links der Webseite, listet diese entsprechend auf und kann sie entsprechend auf Fehlercodes überprüfen. 

Matomo Analytics (ehemalig Piwik)

Dieses sowohl im Hosting als auch im Eigenbetrieb mögliche Tool, analysiert automatisch die Webserverzugriffe. Daraus resultierend können alle Webseitenzugriffe mit dem entsprechenden Fehlercode eingesehen werden.

Tools für 301 Umleitungen, wenn 404 Fehler auftreten

Als interne Tools werden die im CMS installierten Addon’s oder Plugin’s bezeichnet. Der Vorteil der zuvor genannten 301/302 Weiterleitungen besteht darin, dass Suchmaschinen diese interpretieren können. Dadurch können über die Zeit hinweg, alle fehlerhaften oder früher Falsch gespeicherten Links zum Teil korrigiert werden.

WordPress – Redirection (https://redirection.me/)

Redirection ist ein Tool, welches sich vollständig in das WordPress CMS integriert und die eigenen 404 Fehlercodes protokoliert. Diese können im Weiterleitungsmanager durch eine entsprechende 301 Umleitung auf eine selbst gewählte Webseiten URL umgelenkt werden.

Contao – Interne Weiterleitung

In der Version 2.x gab es ein Addin, welches sehr schön innerhalb einer eigenen Seite, die möglichen Weiterleitungen verwalten ließ. Seit der Version 3.0 gibt es einen speziellen Seitentyp “interne Weiterleitung”. Dadurch können 301 Weiterleitungen gesetzt werden. Leider macht dieser Seitentyp die zuvor sehr schön dargestellte Baumstruktur der Internetpräsenz zunichte.

Joomla – jRedirects / ReDJ

Mithilfe der beiden Tools können innerhalb von Joomla Weiterleitungen verwaltet werden. ReDJ geht hierbei den klassischen Weg der Erstellung einer 301 Weiterleitung. Die Erweiterung jRedirects hingegen geht einen Schritt weiter und kann den manuellen Prozess automatisiert durchführen. 

.HTACCESS

Die meisten Webserver und Hoster unterstützen die Verwaltung der Weiterleitungen mittels sogenannter “.htaccess” Dateien. Darin können sowohl Weiterleitungen eingetragen, als auch weitere spannende Einstellungen getätigt werden. Doch dazu mehr in einem anderen Artikel. Hierzu kann ein sehr schönes und elegantes Tool unter https://www.htaccessredirect.net/ verwendet werden. Damit können sehr leicht die notwendigen Textzeilen generiert und anschließend in die eigene Datei auf dem Webserver eingefügt werden.

Tools für 403 Fehler bei Login-Versuchen

In vielen Fällen sind es Hacker, Cracker und Autonome Bots. In anderen Fällen einfach nur Benutzer, welche auf geschützte Webseiteninhalte oder auf eine Anmeldezugreifen wollen. Sollten diese Fehler überhand nehmen, so ist es ratsam hier eine Abhilfe zu schaffen. Diese können mit bedingten Umleitungen, den Zugriff auf das Admin Backend oder eine geschützte Webseite, dynamisch über ein Plugin realisiert werden.

WordPress – WP-Security

Durch das Plug-In “WP-Sicherheit” können die zuvor genannten Abhilfen eingestellt werden. Im Bereich der Einstellungen können die Benutzeranmeldungen kontrolliert, die Anzahl der Login-Versuche limitiert, als auch Landessperren gesetzt werden. Dadurch werden häufige Anmeldeversuche, wie sie bei Brute Force Angriffen zum Raten von Benutzernamen und Kennwörtern verwendet werden, unterbunden werden.

Tools zur Linküberprüfung

Auf einigen – zum Teil bezahlten Webseitendiensten – sind Links zu Artikeln gewollt und erwünscht. Teilweise werden diese aber nur für eine bestimmte Zeit vollständig freigeschaltet. Externe Aufrufe auf diese Webseiten resultieren dann zum Teil in 403 Fehlermeldungen, welche einen vorherigen Login zur Berechtigung erfordern. Damit solche Fehler nicht in Ihren externen Verknüpfungen auftreten, ist es ratsam regelmäßig die Gültigkeit der Links zu überprüfen. Hierzu gibt es externe und teilweise auch interne automatische Tools.

Dieses Plug-In prüft je nach Einstellung alle X Stunden alle Verlinkungen der Webseite (Link Typ “href”) auf entsprechende Fehlercodes. Sollten interne oder externe Links nicht aufrufbar sein oder einen Fehlercode aufweisen, so wird dies via E-Mail berichtet.

Screaming Frog

Der Dienst (https://www.screamingfrog.co.uk/seo-spider/) überprüft nach Eingabe der Webseite nicht nur Ihre SEO Einstellungen. Er prüft auch ihre internen und externen Verlinkungen auf Gültigkeit. Im Abo-Modell kann zudem eine regelmäßige Überprüfung der Webseite mit Statusbericht erfolgen, sodass Sie kontinuierlich Verbesserungen in Ihrem Internetauftritt realisieren können.

Zusammenfassung

Zusammengefasst können bereits mit geringen Aufwänden die größten Problemstellen effektiv bearbeitet werden. Dies spiegelt sich bei größeren Webauftritten mit vielen Seiten, in einer geringeren Absprungrate und verbesserten SEO Ergebnissen wieder. Langfristig zahlt der Aufwand in eine erhöhte Benutzeraktivität und gesteigerter Webseitennutzung ein. Es muss aber wie so oft, “nur noch” gemacht werden.

Sollten Sie eines der genannten Probleme innerhalb Ihrer Webseite feststellen oder konkrete Fragen zur Ausführung oder Umsetzung haben, scheuen Sie sich nicht, mir einen Kommentar zu schreiben oder mit mir in direkten Kontakt zu treten. Ich helfe Ihnen gerne.


Mehr zu diesem Beitrag

Quellen / Einzelnachweise

tbd.

tbd.

Änderungshistorie

Erstellt: 2020-02-26Geändert: 2020-05-28
Änderungshistorie: –
2020-05-28: Basis – Layout + Text

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

vier × 5 =