Entwickler in den USA haben eine Suchmaschine entwickelt, die es Nutzern ermöglicht, archivierte Webinhalte zu durchsuchen. Die gefundenen Informationen können aufbereitet werden - Bildfolgen etwa als Animation oder Zahlenreihen als Diagramm. Das System könnte der Öffentlichkeit kommendes Jahr zur Verfügung stehen.
Ein Team von Entwicklern der Universität von Washington in Seattle und dem Softwareunternehmen Adobe haben ein Programm entwickelt, mit dem Nutzer ein Archiv nach alten und verschwundenen Inhalten durchsuchen können.
Zoetrope zeige dem Nutzer alte Versionen einer Website und wie sie sich über die Zeit verändert hat, erklären die Entwickler. So könne ein Nutzer beispielsweise verfolgen, wie sich der Preis für eine Ware oder die Bewertung eines Kinofilms veränderte.
Dazu markiert der Nutzer eine Website und lässt sich dann, indem er einen Regler auf einem Zeitstrahl bewegt, anzeigen, wie sich die Site verändert hat. Innerhalb dieser Markierung, von den Forschern Linse genannt, kann der Nutzer auch nach Stichwörtern suchen. Die Linse muss dabei nicht eine ganze Seite umfassen. Es ist auch möglich, nur bestimmte Teile eines Dokumentes auszuwählen, etwa die Topnachrichten auf einem Nachrichtenangebot oder die Preistabelle auf einer Seite über Benzinpreise. Auch der Vergleich von mehreren Seiten ist möglich, um Daten zu korrelieren, etwa die Auswirkungen von politischen Ereignissen auf Börenkurse.
Zudem kann Zoetrope Daten auf verschiedene Weise darstellen, etwa Tabellen mit Preisen in ein Diagramm wandeln oder aus einer Reihe von Bildern einen Film generieren. Aus einzelnen Karten über seismische Aktivitäten wird so eine Animation über Erdbeben in einer bestimmten Region. Das System eröffnet Nutzern interessante Möglichkeiten: So könne ein Nutzer aus PDF-Dateien über das Verkehrsaufkommen eine Animation über Staus auf den Highways um Seattle generieren, erklärt Projektleiter Eytan Adan von der Universität von Washington. Kombiniere er diese mit anderen Daten wie Wetter oder Großveranstaltungen, ließen sich Verkehrsmuster erkennen, die dem Nutzer nahelegten, welche Straßen er zu bestimmten Zeiten besser meidet.
Die Datenbasis, die die Nutzer durchsuchen können, legen die Forscher derzeit an: Zoetrope archiviert stündlich ausgewählte Websites. Dieses Intervall reiche bei manchen Seiten jedoch nicht aus, hat Adar festgestellt. So müssten beispielsweise Börsenkurse deutlich öfter als stündlich gespeichert werden. Andere Seiten hingegen sind weniger dynamisch, so dass sie seltener gespeichert werden könnten. Die Idee der Forscher ist deshalb, Zoetrope dazu zu bringen, selbst herauszufinden, wie oft sich eine Seite ändert und wie oft sie gespeichert werden muss.
Sehr umfangreich ist das Archiv jedoch nicht, gibt Adar zu: Das System arbeitet erst seit Juli 2008 und erfasst nur etwa 1.000 Websites. Er würde deshalb gern mit einem umfangreicheren, weiter zurückreichenden Archiv zusammenarbeiten: dem von Brewster Kahle gegründeten Internetarchiv Archive.org, das seit 1996 das Web archiviert. Von einer solchen Kooperation könnte auch das Internetarchiv profitieren, glaubt Informatiker Dan Weld, der auch an Zoetrope mitgearbeitet hat. Dessen Daten seien nämlich nicht immer konsistent, und es sei schwer, das Archiv zu durchsuchen.
Wie Kahle will auch das Team um Adar der Flüchtigkeit von Websites entgegenwirken, indem sie sie archivieren. "Der Browser ist nur ein Fenster ins Internet, wie es heute ist", erklärt Adan. "Wenn man etwas sucht, bekommt man nur Resultate von heute." Mit Hilfe von Zoetrope wollen sie vergangene Daten retten und Nutzern einfach zugänglich machen.
Ein Konzept, das nicht jeder gutheißt: Viktor Mayer-Schönberger, Politologe an der Harvard-Universität, setzt sich vehement gegen eine dauerhafte Speicherung von Daten ein. Er fordert, digitale Daten standardmäßig mit einem Verfallsdatum zu versehen, so dass sie nach einer bestimmten Zeit automatisch gelöscht werden. Nur im Ausnahmefall sollten Daten dauerhaft gespeichert werden, so Mayer-Schönberger.
Bis die Nutzer in den Genuss des Systems kommen, müssen sie sich noch gedulden. Die Forscher schätzen, dass sie es im Sommer 2009 der Öffentlichkeit zur Verfügung stellen werden, wahrscheinlich als Erweiterung für den Browser und wenn möglich kostenlos.
Keine Kommentare:
Kommentar veröffentlichen