Wayback Machine – Alte und gelöschte Websites finden

Web Developer & DesignerKategorie
13 min lesen
Wolf-Dieter Fiege

Wie findet man alte oder gelöschte Websites im Internet wieder?

Die Wayback Machine im Internet Archive ist das Werkzeug für den Zugang zum Internet Archive, sie spiegelt die Historie der Online-Welt. Das gemeinnützige Projekt speichert als Internet Archive mehr als 391 Milliarden Webseiten und zusätzlich Medien.

Abbildung 1: Im Internet Archive sind Schnappschüsse von mehr als 391 Milliarden Webseiten gespeichert – und es wächst weiter.
Im Internet Archive sind Schnappschüsse von mehr als 391 Milliarden Webseiten gespeichert – und es wächst weiter.

Die Bibliothek enthält Momentaufnahmen der entsprechenden Websites. Diese Aufnahmen zeigen die HTML-Version einer Website, einzelne Elemente sind sogar anklickbar. Dabei ist die Wayback Machine im Internet Archive nur ein Teil des Internet Archive.

Hintergrund zum Internet Archive

Das Internet Archive, worin sich die Wayback Machine befindet, wurde 1996 als gemeinnütziges Projekt gegründet. Das Ziel: Digitale Daten möglichst barrierefrei und langfristig zu archivieren. Die Bibliothek der Wayback Machine des Internet Archive enthält neben den Momentaufnahmen von Websites zusätzlich Millionen kostenloser Bücher, Filme, Software, Musik und mehr. Der Datenbestand wächst jeden Monat um rund 20 Terabyte - das ist auch für SEO-Zwecke interessant.

Ja, denn dem Internet Archive stehen fast ausschließlich lizenzfreie Inhalte zur Verfügung. Die Inhalte werden von dem Internet Archive ohne Urheberrechtsanspruch gespeichert.

Die Suche nach alten und gelöschten Websites

Die Bibliothek der Wayback Machine durchsuchst du einfach mithilfe des Suchfelds. Hier trägst du die Domain ein, zum Beispiel: de.godaddy.com.

Abbildung 2: So sieht das Suchergebnis für https://www.godaddy.com/de-de aus
So sieht das Suchergebnis in der Wayback Machine im Internet Archive für https://www.godaddy.com/de-de
aus.

Das Ergebnis: Zwischen dem 27. Mai 2011 und dem 11. November 2019 (der Tag, an dem wir diesen Artikel erstellt haben) wurde die Website 1.117 Mal gecrawlt. Die Zahl aus dem Internet Archive der Wayback Machine entspricht nicht der Anzahl tatsächlicher Aktualisierungen. Klicke jetzt auf ein markiertes Datum, um den Stand der Website zu diesem Zeitpunkt anzuschauen. Als Beispiel zeigen die folgenden Abbildungen 3 und 4 unsere Startseite am 26. April 2014 und am 16. März 2016.

Abbildung 3: Startseite von GoDaddy im April 2014
Startseite von GoDaddy im April 2014.
Abbildung 4: Startseite GoDaddy im März 2016
Startseite GoDaddy im März 2016.

Wayback Machine: Die Historie des Internets mit Suchbegriffen durchstöbern

Statt einer URL kannst du wie bei den Suchmaschinen einen Suchbegriff eingeben. In der Folge wird eine Liste passender Websites angezeigt.

Welche Einschränkungen gibt es?

Teilweise fehlen Webseiten, auch sind die Seiten nicht immer vollständig. Wenn JavaScript verwendet wurde, ist die Darstellung nicht immer optimal. Größere Bilder fehlen häufig.

Den vorherigen Inhalt von 404-Fehlerseiten anzeigen

Wenn du im Internet nach Informationen suchst, landest du manchmal auf einer 404-Fehler-Seite. Dies passiert, wenn der Website-Betreiber den Inhalt der Seite gelöscht hat, du jedoch noch auf den Link zur URL klicken konntest. Es gab also in der Regel unter dieser URL zuvor einen Inhalt. Falls du wissen möchtest, welche Informationen hier zu finden waren, trägst du die URL in der Wayback Machine ein und startest die Suche.

Eine praktische Alternative ist die Installation der Wayback Machine Extension für die Browser Chrome, Firefox oder Safari. Wenn du jetzt bei der Recherche im Internet auf eine 404-Seite stößt, wird automatisch in der Wayback Machine nach einer archivierten Kopie gesucht und diese angezeigt. Die Wayback Machine erkennt zahlreiche Fehlercodes wie 404, 410, 500, 502 und 520.

Wayback Machine: Kann ich verlorene Websites wiederherstellen?

Ja, die Chancen sind gut. Deine Website wurde Opfer eines Hackerangriffs oder du hast aus Versehen eine oder mehrere Seiten gelöscht? Mit der Wayback Machine des Internet Archive kannst du wahrscheinlich auf ältere Versionen deiner Website zugreifen und die Informationen für die Wiederherstellung nutzen – ganz ohne eigenes Backup.

Wusstest du, dass du bei einem Managed WordPress-Hosting-Produkt von GoDaddy eine kostenlose Staging-Umgebungen erhältst (ab Managed WordPress Deluxe). Mit der Staging-Umgebung kannst du alle Website-Änderungen in Ruhe teste, bevor sie live gehen. Erfahre mehr über Managed WordPress-Hosting.

Die Wayback Machine des Internet Archive zeigt, wer einen Inhalt zuerst veröffentlicht hat

Das Netz ist voller Duplicated Content, dabei übernehmen Website-Betreiber einfach Inhalte anderer Websites. Die Frage ist dann: Wer hat von wem abgeschrieben, wer ist der wahre Urheber des Texts? Mit der Wayback Machine lässt sich unter Umständen nachweisen, wann der eigene Text erstmals veröffentlicht wurde – und wann der eines Konkurrenten. Bei Urheberstreitigkeiten akzeptieren Gerichte meist die Schnappschüsse der Wayback Maschine des Internet Archive.

Probiere jetzt die Wayback Machine aus und stöbere im Internet Archive.

Du möchtest schnell und einfach eine eigene Webseite, eine Landingpage oder einen Online-Shop erstellen?

Dann schau dir einfach mal die Produkte Website + Marketing von GoDaddy an. In weniger als einer Stunde kannst du damit online sein und deine Seite mit den integrierten Marketing-Funktionen professionell promoten. Hier findest zu mehr Informationen zu Website + Marketing.

FAQ zum Thema Wayback Machine

Was ist die Wayback Machine?

Die Wayback Machine ist ein Dienst, der Zugriff auf ein öffentlich und kostenfrei zugängliches Webseiten-Archiv erlaubt.

„Way back“ heißt auf Englisch umgangssprachlich „vor langer Zeit“, steckt aber auch in „the way back“ – dem Weg zurück. Der Name ist Programm: Über die Wayback Machine kannst du nämlich alte Versionen von Webseiten abrufen. Diese werden vom Internet Archive gespeichert. Die ältesten sind dabei von 1996, dem Geburtsjahr des Projekts. Fun Fact: „Wayback Machine“ hieß auch eine fiktionale Zeitmaschine aus einer populären 1960er Cartoon-Serie, mit der die Helden historische Ereignisse besuchten.

Wer betreibt die Wayback Machine?

Die Wayback Machine wird vom Internet Archive betrieben, einer in den USA ansässigen gemeinnützigen Organisation. Die Archivierung alter Internetseiten (das, was heute die Wayback Machine ist), war die allererste Mission des Internet Archive. Mittlerweile ist das Internet Archive aber in den USA als richtige Bibliothek anerkannt, darf auch digitale Bücher und andere Medien verleihen und hat es sich zum Ziel gesetzt, alle möglichen digitalen Medien und Formate zu archivieren. Dazu gehören neben Webseiten und digitalen Büchern auch Audiodateien, Videos – sogar von Fernsehsendungen – und Software.

Diese Medien sollen so davor gerettet werden, dass sie eines Tages verloren gehen könnten, weil ihre Formate veraltet sind. Außerdem soll es möglichst vielen Menschen ermöglicht werden, auf Wissen zuzugreifen, getreu dem Ziel des Internet Archive: „Universal Access to All Knowledge“ (Universeller Zugang zu sämtlichem Wissen).

Wie funktioniert die Wayback Machine?

Das Webseiten-Archiv des Internet Archive speist sich aus den Daten von verschiedenen Crawlern. Dies sind kleine Programme, die das Internet durchsuchen, ähnlich, wie sie auch bei Suchmaschinen zum Einsatz kommen. Dort, wo sie das dürfen, archivieren und indexieren sie Website-Inhalte, erzeugen also einen Website-Schnappschuss. Von welchem Crawler ein bestimmter Schnappschuss einer Webseite stammt, kannst du dir anzeigen lassen – siehe nächste Frage.

Der zugehörige Index, der alle diese historischen Versionen von Webseiten auffindbar macht, ist ein sogenannter dreidimensionaler Index. Das bedeutet, dass sowohl die Inhalte verschiedener URLs indexiert werden als auch die Zeiten, zu denen die Schnappschüsse dieser Inhalte angefertigt wurden. Der dreidimensionale Index der Wayback Machine wurde gemeinsam mit Alexa Internet entwickelt, einer Suchmaschine, die später von Amazon aufgekauft und mittlerweile eingestellt wurde.

Wie kann ich die Wayback Machine nutzen, um ältere Versionen von Websites anzusehen?

Besuche einfach die Startseite der Wayback Machine und gib im Suchfeld die URL der Seite ein, deren historische Versionen du betrachten möchtest – z. B. https://www.godaddy.de.

Nun erscheint, wie im Screenshot sichtbar, zunächst eine Zeitleiste. Auf dieser kannst du sehen, zu welchen Jahren es Inhalte gibt. Wenn du auf ein Jahr klickst, wird auf dem Kalender im Detail angezeigt, an welchen Tagen in diesem Jahr ein Schnappschuss (Snapshot) der Webseite abgespeichert wurde. Fährst du nun mit der Maus über eines der markierten Kalenderdaten, wird ein Kasten mit Datum und Uhrzeit(en) angezeigt. Klickst du auf eine Uhrzeit, dann wirst du auf die Seite weitergeleitet, die dir den Inhalt der URL genau zu diesem Zeitpunkt zeigt.

Außerdem erscheint über dem Kalender das Datum des Schnappschusses und in Klammern „why:“. Dahinter werden die Crawler aufgelistet, die den Schnappschuss erstellt haben.

Abbildung: Snapshot Wayback Machine
Gibt es eine Möglichkeit, die gesamte Historie einer Website mit der Wayback Machine einzusehen?

Wie du in der Kalenderansicht sehen kannst, ist die Archivierung nicht lückenlos. Je nach Webseite sind mehr oder weniger Schnappschüsse gespeichert. Oft gibt es auch Jahre, für die von einer bestimmten Webseite gar nichts abgespeichert ist. Du kannst also im Prinzip die ganze Historie einer Webseite seit 1996 abrufen (beziehungsweise seit dem Datum, als sie online gegangen ist), aber nicht lückenlos.

Welche Arten von Inhalten werden von der Wayback Machine archiviert?

Über die Wayback Machine sind die Inhalte von Webseiten zugänglich. Dies funktioniert am besten mit statischen Seiten oder mit dynamischen Seiten, die normales HTML generieren. Dynamische Seiten, deren Darstellung hauptsächlich von JavaScript oder anderen Plugins abhängt, werden zwar auch archiviert, können aber oft nicht korrekt angezeigt werden.

Das Internet Archive archiviert auch andere digitale Medien wie Bücher, Videos, Audiodateien und Software. Diese gehören nicht zur Wayback Machine im engeren Sinne.

Kann ich Websites, die nicht mehr online sind, mithilfe der Wayback Machine wiederherstellen?

Die Wayback Machine archiviert natürlich nicht nur alte Versionen von noch existierenden Webseiten, sondern auch Webseiten, die mittlerweile schon gelöscht sind. Diese können in der Wayback Machine angeschaut werden, aber es gibt keine automatisierte Funktion in der Wayback Machine, mit der der Inhaber einer mittlerweile gelöschten Webseite diese aus der Wayback Machine wiederherstellen könnte.

Du kannst dir aber die gelöschte Seite in der Wayback Machine ansehen und die Inhalte von Hand übernehmen, beispielsweise die Texte mit Copy und Paste in dein neues Content-Management-System einfügen.

Wer sich mit der Kommandozeile und der Programmiersprache Ruby auskennt und Lust und Zeit hat, ein wenig zu basteln, kann auch ein kostenloses Tool von Github herunterladen. Dieser sogenannte Wayback Machine Downloader automatisiert, wie der Name schon sagt, den Download einer ganzen Webseite aus der Wayback Machine (Benutzung ohne Gewähr). Deine neue Webseite mit den alten Inhalten musst du aber trotzdem noch selber erstellen.

Wie oft wird die Wayback Machine aktualisiert und wie aktuell sind die gespeicherten Daten?

Das ist ganz unterschiedlich und hängt von der Webseite ab und davon, wie oft diese von verschiedenen Crawlern besucht wird. Wie aktuell die Daten sind, kannst du bei jedem Schnappschuss ganz genau sehen, weil der Zeitpunkt des Schnappschusses auf die Sekunde genau mit angegeben wird.

Welche Tools und Funktionen bietet die Wayback Machine für Recherchezwecke?

Neben der bereits erwähnten Kalenderfunktion, bei der man Schnappschüsse nach Datum aufrufen kann, gibt es noch andere Funktionen, die du unterhalb des Suchfeldes findest:

  • In Collections findest du die Schnappschüsse nach Quelle sortiert – also aus welchem Crawler oder welcher anderen Quelle sie stammen.
  • Mit Changes kannst du zwei Schnappschüsse vergleichen und dir die Unterschiede anzeigen lassen.
  • Unter Summary kannst du dir Statistiken für die gewählte Webseite anzeigen lassen, beispielsweise, wie viele Schnappschüsse in bestimmten Zeiträumen erstellt wurden, welche Arten von Inhalten archiviert wurden und welches die allerneuesten Schnappschüsse sind.
  • Unter Site Map erstellt die Wayback Machine dir sogar grafisch aufbereitete Sitemaps für die archivierten Webseiten.
  • Und unter URLs schließlich wird dir detailliert aufgelistet, welche URLs für die Webseite archiviert wurden.
Gibt es Datenschutzbedenken im Zusammenhang mit der Verwendung der Wayback Machine?

Das ist nicht ganz einfach zu beantworten, weil das Internet Archive in den USA ansässig ist und in den USA und in Europa bzw. Deutschland unterschiedliche Datenschutzgesetze gelten.

Auf jeden Fall werden Inhalte der Wayback Machine und des Internet Archive nicht dadurch öffentlicher Besitz, dass sie dort archiviert sind. Datenschutz und Urheberrecht gelten weiter. Wenn du in der Wayback Machine etwas findest, das personenbezogene Daten von anderen enthält oder Inhalte, für die andere Menschen das Urheberrecht besitzen, darfst du es nicht auf deiner Webseite veröffentlichen.

Wenn du andererseits deine eigenen Rechte im Datenschutz oder dein Urheberrecht durch Inhalte in der Wayback Machine verletzt siehst, kannst du dich per Post oder E-Mail an den sogenannten Internet Archive Copyright Agent wenden. Dieser wird die Anfrage prüfen und die Inhalte gegebenenfalls aus dem Archiv entfernen.

Kann ich Websites aus der Wayback Machine herunterladen oder extrahieren?

Wenn du die alte Version einer Webseite in der Wayback Machine anzeigst, kannst du in deinem Browser den Quelltext anzeigen, Textinhalte herauskopieren, Bilder abspeichern und alles machen, was du mit deinem Browser auch auf einer aktuellen Webseite tun kannst, um die Inhalte zu extrahieren.

Außerdem gibt es auf Github ein kostenloses Tool, den Wayback Machine Downloader, der allerdings nur etwas für fortgeschrittene Nutzer ist, die mit der Kommandozeile und der Programmiersprache Ruby arbeiten können.

Welche Einschränkungen oder Begrenzungen gibt es bei der Nutzung der Wayback Machine?

Wie bei der vorletzten Frage erläutert, befreit die Wayback Machine dich nicht von der Verantwortung, Datenschutz und Urheberrecht zu beachten. Nur, weil du einen Inhalt in der Wayback Machine findest, heißt es nicht, dass er frei verwendbar ist.

Die Geschäftsbedingungen des Internet Archive besagen außerdem, dass du es nur zu Forschungs- und Recherchezwecken nutzen darfst.

Gibt es eine Möglichkeit, meinen eigenen Webinhalt in der Wayback Machine zu archivieren?

Ja, denn direkt auf der Startseite der Wayback Machine gibt es unter der Überschrift „Save Page Now“ die Möglichkeit, eine URL direkt hinzuzufügen. Du wirst dann auf die Seite weitergeleitet, auf der du deine Anfrage bestätigen und auswählen kannst, ob auch Fehlerseiten (z.B. 404) mitgespeichert werden sollen. Du musst dafür keinen eigenen Account bei der Wayback Machine haben und die URL, die du anmeldest, muss auch nicht unbedingt deine eigene sein.

Wie kann ich sicherstellen, dass meine Website in der Wayback Machine archiviert wird?

Ob eine auf der Save Page Now-Seite gemeldete URL tatsächlich archiviert wird, bleibt letzten Endes die Entscheidung des Internet Archive. Aber in der Regel werden dort gemeldete Seiten auch archiviert. Das gilt allerdings nur, wenn deine Seite Crawler zulässt.

Welche anderen ähnlichen Dienste zur Webarchivierung gibt es neben der Wayback Machine?

Es gibt den alternativen Dienst archive.today. Dieser hat nicht die überwältigende Menge an Daten wie die Wayback Machine, aber einen kleinen, feinen Unterschied: Während in der Wayback Machine keine Seiten archiviert werden, die keine Crawler zulassen, sind solche Seiten in archive.today trotzdem vertreten, und zwar mit einem Screenshot.

Wie kann ich die Wayback Machine verwenden, um historische Informationen und Entwicklungen im Web nachzuvollziehen?

Fazit: Die Wayback Machine ist ein praktisches, hilfreiches und sehr informatives Werkzeug, um – wie oben beschrieben – die Entwicklung von Webseiten nachzuvollziehen. Und weil Webseiten Wissen oder Meinungen repräsentieren, die zu einer bestimmten Zeit wichtig waren, gewinnst du auf diese Weise nicht nur Einblicke in die Historie des Webs, sondern auch in gesellschaftliche Entwicklungen.

Dieser Artikel ist am 11.11.2019 erschienen und wurde am 19.02.2024 aktualisiert.

Bildnachweis: Unsplash

Products Used