archive.today: Webseiten-Archivierungsdienst im Internet

Kategorien: Web

Archive.today ist ein leistungsstarker Webarchivierungsdienst, der es Nutzern ermöglicht, Momentaufnahmen von Webseiten zu erstellen und zu speichern. Dieser Dienst hat sich als wertvolles Werkzeug für Forscher, Journalisten und alle, die an der Bewahrung digitaler Inhalte interessiert sind, erwiesen[1][2].

Geschichte und Entwicklung

Archive.today wurde 2012 gegründet und hat sich seitdem zu einer wichtigen Plattform für die Archivierung von Webinhalten entwickelt[1]. Ursprünglich unter der Domain archive.today gestartet, wechselte der Dienst im Mai 2015 zur Domain archive.is. Im Januar 2019 begann die schrittweise Abkehr von archive.is zugunsten anderer Domains[1].

Die Identität des Betreibers von Archive.today ist nicht öffentlich bekannt, was dem Dienst eine gewisse Mystik verleiht[1]. Trotz dieser Anonymität hat sich Archive.today als zuverlässiger und effektiver Dienst etabliert, der bis 2021 bereits etwa 500 Millionen Seiten archiviert hatte[1].

Funktionsweise und Besonderheiten

Archive.today zeichnet sich durch mehrere einzigartige Funktionen aus, die es von anderen Webarchivierungsdiensten unterscheiden:

Erfassung von Snapshots

Der Dienst erstellt zwei Arten von Snapshots einer Webseite[1]:

  • Eine Kopie, die die ursprüngliche Webseite einschließlich funktionierender Live-Links repliziert
  • Ein Screenshot der Seite

Diese doppelte Erfassung gewährleistet, dass sowohl die Funktionalität als auch das visuelle Erscheinungsbild der Seite erhalten bleiben.

Unterstützung für JavaScript-lastige Seiten

Eine besondere Stärke von Archive.today ist die Fähigkeit, JavaScript-intensive Websites wie Google Maps und Twitter/X zu archivieren[1]. Dies ist besonders wertvoll, da viele moderne Websites stark auf JavaScript angewiesen sind und von herkömmlichen Archivierungsmethoden oft nicht korrekt erfasst werden können.

Selektive Inhaltserfassung

Archive.today speichert Text und Bilder, schließt aber bestimmte Dateitypen wie XML, RTF und Tabellenkalkulationen aus[1]. Videos von bestimmten Plattformen, wie X (ehemals Twitter), werden jedoch gespeichert. Diese selektive Erfassung hilft, den Speicherplatz effizient zu nutzen und gleichzeitig die wichtigsten Inhalte zu bewahren.

Anpassung des Layouts

Die Seiten werden mit einer Browserbreite von 1.024 Pixeln erfasst[1]. CSS wird in Inline-CSS umgewandelt, wodurch responsives Webdesign und bestimmte CSS-Selektoren entfernt werden. Dies gewährleistet eine konsistente Darstellung der archivierten Seiten, unabhängig von zukünftigen Änderungen in Webtechnologien.

Texthervorhebung

Eine nützliche Funktion ist die Möglichkeit, bestimmte Textpassagen zu markieren. Wenn Text ausgewählt wird, generiert ein JavaScript-Applet ein URL-Fragment, das bei erneutem Besuch automatisch diesen Textabschnitt hervorhebt[1].

Nutzung und Anwendungsbereiche

Archive.today hat sich als vielseitiges Werkzeug für verschiedene Anwendungsbereiche erwiesen:

Forschung und Dokumentation

Für Wissenschaftler und Forscher bietet Archive.today die Möglichkeit, Webinhalte für spätere Analysen zu konservieren. Dies ist besonders wertvoll bei der Untersuchung von Online-Phänomenen oder der Dokumentation von sich schnell ändernden Webinhalten.

Journalismus

Journalisten nutzen den Dienst, um Quellen zu sichern und Änderungen an Webseiten nachzuverfolgen. Dies ist besonders nützlich bei investigativen Recherchen oder wenn es darum geht, die Entwicklung von Online-Nachrichten über die Zeit zu dokumentieren.

Rechtliche Zwecke

In rechtlichen Kontexten kann Archive.today dazu dienen, den Zustand einer Webseite zu einem bestimmten Zeitpunkt zu belegen. Dies kann in Fällen von Urheberrechtsverletzungen, Verleumdungen oder anderen internetbezogenen Rechtsstreitigkeiten von Bedeutung sein.

Persönliche Archivierung

Privatpersonen nutzen den Dienst, um wichtige Informationen oder persönlich bedeutsame Webseiten zu archivieren, die in Zukunft möglicherweise nicht mehr verfügbar sein könnten.

Technische Aspekte

API und Integration

Archive.today unterstützt seit Juli 2013 die API des Memento-Projekts[1]. Dies ermöglicht eine bessere Integration mit anderen Archivierungsdiensten und Anwendungen, die auf zeitbasierte Webinhalte zugreifen möchten.

Suchfunktionen

Die Suchfunktion von Archive.today wird von Google CustomSearch unterstützt. Falls diese keine Ergebnisse liefert, greift der Dienst auf Yandex Search zurück[1]. Dies ermöglicht eine effiziente Durchsuchung der archivierten Inhalte.

Downloadmöglichkeiten

Nutzer können archivierte Seiten als ZIP-Datei herunterladen, allerdings gilt dies nur für Seiten, die vor dem 29. November 2019 archiviert wurden. An diesem Datum wechselte Archive.today von PhantomJS zu Chromium als Browser-Engine[1].

Vergleich mit anderen Archivierungsdiensten

Wayback Machine

Im Vergleich zur bekannten Wayback Machine des Internet Archive hat Archive.today einige Besonderheiten:

  • Archive.today ignoriert robots.txt-Dateien, während die Wayback Machine diese bis 2019 beachtete[1]
  • Archive.today bietet eine bessere Unterstützung für dynamische Webseiten und JavaScript-lastige Inhalte[10]
  • Die Wayback Machine archiviert ein breiteres Spektrum an Inhalten, einschließlich Videos und PDFs, die von Archive.today nicht erfasst werden[10]

WebCite

Archive.today wird oft als Alternative zu WebCite betrachtet, insbesondere seit WebCite keine neuen Archivierungen mehr akzeptiert[2].

Datenschutz und ethische Überlegungen

Die Nutzung von Archive.today wirft auch Fragen zum Datenschutz und zur Ethik der Webarchivierung auf:

Umgehung von Paywalls

Archive.today wird manchmal genutzt, um Paywalls zu umgehen, was rechtliche und ethische Fragen aufwirft[5]. Dies stellt eine Herausforderung für Verlage und Content-Anbieter dar, die auf Bezahlmodelle angewiesen sind.

Datenschutzbedenken

Da Archive.today Inhalte ohne explizite Zustimmung der Website-Betreiber speichert, können Datenschutzbedenken aufkommen. Dies ist besonders relevant bei persönlichen oder sensiblen Informationen, die möglicherweise nicht für eine dauerhafte Archivierung vorgesehen waren.

Urheberrechtliche Aspekte

Die Archivierung von Webinhalten ohne ausdrückliche Erlaubnis der Rechteinhaber kann urheberrechtliche Fragen aufwerfen. Archive.today argumentiert, dass es als „direkter Agent des menschlichen Nutzers“ handelt und daher bestimmte Einschränkungen nicht beachten muss[1].

Zukunftsperspektiven

Die Zukunft von Archive.today und ähnlichen Diensten hängt von verschiedenen Faktoren ab:

Technologische Entwicklungen

Mit der ständigen Weiterentwicklung von Webtechnologien muss sich Archive.today kontinuierlich anpassen, um relevante und akkurate Archivierungen zu gewährleisten.

Rechtliche Rahmenbedingungen

Zukünftige Gesetzgebungen im Bereich Datenschutz und Urheberrecht könnten die Arbeitsweise von Webarchivierungsdiensten beeinflussen.

Gesellschaftliche Bedeutung

Die wachsende Bedeutung digitaler Inhalte und die Notwendigkeit ihrer Bewahrung könnten die Rolle von Diensten wie Archive.today in Zukunft noch wichtiger machen.

Fazit

Archive.today hat sich als wertvolles Werkzeug für die Bewahrung digitaler Inhalte etabliert. Seine Fähigkeit, komplexe und dynamische Webseiten zu archivieren, macht es zu einer unverzichtbaren Ressource für Forscher, Journalisten und alle, die an der langfristigen Erhaltung von Webinhalten interessiert sind. Trotz der Herausforderungen in Bezug auf Datenschutz und Urheberrecht bleibt Archive.today ein wichtiger Akteur in der digitalen Landschaft, der einen bedeutenden Beitrag zur Dokumentation und Erhaltung unserer Online-Geschichte leistet.

Zitierungen

  1. https://en.wikipedia.org/wiki/Archive.ph
  2. https://wiki.archiveteam.org/index.php/Archive.today
  3. https://www.youtube.com/watch?v=Jo1eOk5w5EA
  4. https://veight.de/archive-today-revolutioniert-digitale-informationsbewahrung-jetzt/
  5. https://nydus.org/news/130060-archive-is-verbessert-die-umgehung-von-paywalls.html
  6. https://jlupub.ub.uni-giessen.de/server/api/core/bitstreams/42503ffb-ac79-4235-b530-b1b07f7fef16/content
  7. https://de.wikipedia.org/wiki/Archive.today
  8. https://www.test.de/Wayback-Machine-So-funktioniert-das-Internetarchiv-4957202-0/
  9. https://www.researchgate.net/profile/Oliver-Wieczorek/publication/362015124_Qualitative_und_quantitative_Inhaltsanalyse_digital_und_automatisiert_Eine_anwendungsorientierte_Einfuhrung_mit_empirischen_Beispielen_und_Softwareanwendungen/links/62d6c8b8593dae2f6a28bb5d/Qualitative-und-quantitative-Inhaltsanalyse-digital-und-automatisiert-Eine-anwendungsorientierte-Einfuehrung-mit-empirischen-Beispielen-und-Softwareanwendungen.pdf
  10. https://www.drehscheibe.org/internetwerkstatt-detail/der-bessere-screenshot.html

archive.today

«
»

    Schreibe einen Kommentar

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert