Archivierung von Netzinhalten

Multimedia pur!
Benutzeravatar
Persisteus
Hobby-Archäologe
Hobby-Archäologe
Beiträge: 177
Registriert: 20.06.2002, 16:43
Wohnort: Vluyn
Kontaktdaten:

Beitrag von Persisteus »

Unsere Artikel befinden sich alle in einer Datenbank, und das ist nicht nur bei uns so. Ich bin sicher, dass viele lieber ihre Datenbank dumpen, als ihre eigene Seite zu spidern.
Ja, das kann ich wirklich gut verstehen. Nur finde ich, dass gerade Datenbanksysteme dazu beitragen sollten, Informationen möglichst einfach in unterschiedliche Ausgabeformate zu übertragen.

Der Nachteil vieler CMS ist aber leider, dass sie in dieser Hinsicht ziemlich unflexibel sind.
Viele Webmaster haben irgendwie keinerlei Zugriff auf elementarste Verhaltensweisen ihrer Seite, weil diese in dutzenden von Scripts mit vielen Codezeilen versteckt sind (ist irgendwie wie das Fahren mit Automatikgetriebe... :wink: ). Sie haben wohl nicht mehr so ohne weiteres die Möglichkeit, ihre Seite als HTML-Version (möglichst nur mit relevanten und nicht mit redundanten Inhalten) ohne Datenbanksystem im Hintergrund auszuliefern. Das automatisierte "Spidern" von Webseiten würde wohl zu viel Datenmüll produzieren.

Es müssten also die CMS möglichst schnell Erweiterungen anbieten, die dies ermöglichen... oder der Webmaster muss selber Programme schreiben, wozu er sich aber erstmal in die fremde Datenbankstruktur einarbeiten muss (abgesehen davon, dass noch lange nicht jeder Webmaster überhaupt programmieren kann).

PS: Diese CMS-Erweiterungen würden auch für viele Leute eine Erleichterung darstellen, die sich bei der überbordenden Informationsvielfalt vieler Seite überfordert fühlen. Nehmen wir als Beispiel mal die Seiten bekannter Spielezeitschriften: Allein die Startseiten bieten Unmengen an Informationen. Aber wieviel wird davon wirklich gelesen? Allein der HTML-Code bei GameStar ist schon 90KB groß! :shock: Wie soll man da noch die Übersicht behalten?
Benutzeravatar
DasJan
Adventure-Treff
Adventure-Treff
Beiträge: 14683
Registriert: 17.02.2002, 17:34
Wohnort: London
Kontaktdaten:

Beitrag von DasJan »

Du findest es also sinnvoll, Website-Betreiber gesetzlich dazu zu zwingen, ihre CMS um Funktionen zu erweitern, die sie nicht brauchen, nur weil die zu doof sind, einen ordentlichen Spider zu entwickeln? Ich behaupte, eine Lösung wie web.archive.org wäre für alle Seiten die weitaus weniger aufwändige Lösung.

Das Jan
"If you are the smartest person in the room, you are in the wrong room."
Benutzeravatar
Persisteus
Hobby-Archäologe
Hobby-Archäologe
Beiträge: 177
Registriert: 20.06.2002, 16:43
Wohnort: Vluyn
Kontaktdaten:

Beitrag von Persisteus »

Du findest es also sinnvoll, Website-Betreiber gesetzlich dazu zu zwingen, ihre CMS um Funktionen zu erweitern, die sie nicht brauchen, nur weil die zu doof sind, einen ordentlichen Spider zu entwickeln?
Spiders sind doof, sie würden endlosen Datenmüll mit unendlich vielen, nutzlosen Navigationsseiten und veralteten Inhalten ergeben. Man kann nicht die Struktur sämtlicher Internetseiten mit Spiders erfassen, dafür sind die Strukturen zu unterschiedlich. Wie soll ein Spider z.B. zwischen euren Reviews und den Leserkommentaren unterscheiden können?
Benutzeravatar
DasJan
Adventure-Treff
Adventure-Treff
Beiträge: 14683
Registriert: 17.02.2002, 17:34
Wohnort: London
Kontaktdaten:

Beitrag von DasJan »

Gar nicht, aber sind die weniger archivierenswert als unsere Reviews? Bei Büchern archiviert man ja auch Inhaltsverzeichnis, Anhang, Umschlag und so weiter mit. Wenn ich Adventure-Treff.de da einschicke, werde ich sicher nicht die ganzen Kommentare, Navigationen etc. vorher rauslöschen, das wäre viel zu viel Arbeit.

Das Jan
"If you are the smartest person in the room, you are in the wrong room."
Benutzeravatar
Persisteus
Hobby-Archäologe
Hobby-Archäologe
Beiträge: 177
Registriert: 20.06.2002, 16:43
Wohnort: Vluyn
Kontaktdaten:

Beitrag von Persisteus »

Gar nicht, aber sind die weniger archivierenswert als unsere Reviews?
Eine gute Frage. Ich weiss es nicht. Ich denke nur, dass es vielen Leuten wohl unangenehm wäre, wenn alles derart an die Öffentlichkeit gezerrt wird. Und man hat als Webmaster da schliesslich nur eingeschränkte Kontrollmöglichkeiten... da können durchaus Dinge in die Publikation rutschen, die man so nie veröffentlichen würde. Ein unpassender Beitrag ist mal schnell gelöscht, aber wenn das ganze schon an die Bibliothek geschickt wurde...
Benutzeravatar
DasJan
Adventure-Treff
Adventure-Treff
Beiträge: 14683
Registriert: 17.02.2002, 17:34
Wohnort: London
Kontaktdaten:

Beitrag von DasJan »

Wobei die Gerichte auch in einem Webforum ein "journalistisch-redaktionell gestaltetes Angebot im Sinne des neu geschaffenen Paragrafen 54 des Rundfunkstaatsvertrages" (http://www.heise.de/newsticker/meldung/89348) sehen. Es dürfte also schwer zu begründen sein, warum das nicht archiviert werden muss, während wir unsere Reviews abgeben müssen.

Das Jan
"If you are the smartest person in the room, you are in the wrong room."
Benutzeravatar
axelkothe
Adventure-Treff
Adventure-Treff
Beiträge: 8952
Registriert: 04.06.2004, 15:22
Kontaktdaten:

Beitrag von axelkothe »

Gerade öffentliche Foren sollen doch auch mit archiviert werden. Also eben jene Userbeiträge, die Persiteus rauslassen wollte...
Benutzeravatar
Hexenjohanna
Navigatorin
Navigatorin
Beiträge: 9586
Registriert: 25.10.2003, 00:17
Wohnort: Metropole in Ostwestfalen

Beitrag von Hexenjohanna »

Ihr blöden Männchen wollt euch immerzu irgendwo verewigen...

komisch!

Bild
Laß mich den Aberglauben eines Volkes schaffen, und mir ist es gleich, wer ihm seine Gesetze oder seine Lieder gibt.

Mark Twain

Nostalgische Serien Quiz-Liste:
https://www.adventure-treff.de/forum/to ... 69#p772069
Benutzeravatar
john_doe
Logik-Lord
Logik-Lord
Beiträge: 1302
Registriert: 06.05.2001, 20:58

Beitrag von john_doe »

Ich seh das Problem nicht, warum keine Spiders eingesetzt werden sollten. Die Webung usw. kann doch per Filter á la AdBlock ausgeschlossen werden und/oder durch Dummy-Daten ersetzt werden, damit evtl. das Seitenlayout nicht verändert wird.
Save the Cheerleader, save the World!
Antworten