Wikipedia auf CD/2. Bericht

Am 5. August 2004 trafen sich Henriette und Jakob mit Ralf Szymanski und Erwin Jurschitza von Directmedia Publishing, um den aktuellen Stand der Wikipedia auf CD zu besprechen (siehe den Bericht vom ersten Treffen). Gegen Ende des Monats solle ein weiteres Treffen stattfinden.

Abstract:

Henriette and Jakob met Ralf Szymanski in a second meeting in August 5 2004. Next meeting is planned for the end of August.

Organizational and technical questions were discussed -- in the end of September, a snapshot of the German Wikipedia will be saved and converted to Directmedia Publishing's Digital Library format.

The Wikipedia CD will be sent out to all Digital Library customers, supporting Win and Mac platforms, and hopefully Linux.

Review of the articles will be done in an internal wiki. Articles will be included unless they fall into specific categories (vfd-tagged, lists etc). Images will be included as thumbnails for space reasons, and only be included if license information is in place.

Author data, meta data etc should all be available in the final interface via menus.

Ablauf

edit

Neben allgemeinen Fragen und dem Austausch von Anekdoten ging es vor allem um Organisatorische, inhaltliche und technische Details. Anfang September soll ein Snapshot der deutschen Wikipedia gemacht werden und in das Format der Digitalen Bibliothek transformiert werden. Die Transformation findet automatisch statt - dazu sind bereits einige Entwickler in Rumänien beschäftigt. Zuvor sollen in einem internen Wiki alle kritischen Bestandteile entfernt werden. Ansonsten sollte die CD ein Spiegelbild der gesamten Wikipedia sein; eine qualitative Auswahl kann allein des Aufwands wegen nicht stattfinden.

Die CD wird zusammen mit der neuen Version der Software der Digitalen Bibliothek an alle registrierten Kunden geschickt. Bis dahin ist hoffentlich auch die Linux-Version fertig. Tip: Schnell ein Werk aus der Reihe der Digitalen Bibliothek kaufen und sich registrieren. Die CD gibt es aber auch umsonst und der Verein bekommt Exemplare zum verteilen.

Endreview-Prozess

edit

Für den Endreview-Prozess durch einen geschlossenen Benutzerkreis wäre es nett, wenn jemand oder die Foundation einen Server bereitstellt, da es in Rumänien manchmal zu Ausfällen des Internets kommen kann. Außerdem hat so der Verein bis zuletzt die Kontrolle über die Inhalte. Im Endreview-Prozess sollte nur abgesegnet oder gelöscht werden!

Dazu müssen im Laufe des August Listen von kritischen Artikeln gesammelt werden und SQL-Abfragen oder andere Skripte bereit gestellt werden, um Artikel, die begutachtet werden müssen, ausfindig zu machen. Kandidaten sind:

  • Alle Artikel anderer Namensräume => raus
  • Artikel, die auf Artikel anderer Namensräume verweisen => ggf. Inhalt anpassen
  • Listenartikel => raus
  • Baustellenartikel => raus?
  • Artikel mit Löschwarnung => raus
  • Artikel mit URV-Warnung => raus
  • Artikel mit NPOV-Warnung => raus
  • ...

Verwaiste Artikel machen keine Probleme, da die Software über ein Register und eine gute Suchfunktion verfügt.

Während des Endreview-Prozesses sollten möglichst automatisch alle Links auf nicht-existierende Artikel, Bilder ohne Lizenzangaben, Interwikilinks, Diskussionsbeiträge auf Artikelseiten, Kategorien etc. entfernt werden. Einiges kann davon kann auch während der Konvertierung rausgeschmissen werden.

Bilder und Tabellen

edit

Während bei den Artikel eine negativ-Auswahl stattfindet (alles, was nicht besser raus muss bleibt drin), sollten die Bilder in einer positiv-Auswahl aufgenommen werden. Alle Bilder ohne (passende) Lizenzangabe fliegen raus. Ggf. müssen einzelne Artikel angepasst werden, wenn dadurch das ganze Layout durcheinander gerät.

Die Bilder können aus Platzgründen nicht in ihrer Orginalgröße, sondern nur so, wie sie im Artikel erscheinen, mit auf die CD. Durch Auswahl mit der Rechten Maustaste kann die entsprechende Bilderseite angezeigt werden.

Tabellen bereiten bei der Konvertierung einige Probleme. Sie werden wahrscheinlich in eigenen Popup-Fenstern dargestellt werden. Bei den Navigationsleisten müssen wir überlegen, ob sie nicht gleich ganz rausfliegen.

Metadaten und Verlinkung

edit

Ein ganzer, sich ständig wiederholender Satz zur Lizenz hinter jedem Artikel ist nicht so schön. Stattdessen sollen einige Informationen über Menüs z.B. mit der Rechten Maustaste und ggf. Statusleiste sichtbar sein und nicht direkt im Artikeltext.

Autoren

edit

Zu jedem Artikel müssen nach GFDL die Autoren genannt werden. Ich habe vorgeschlagen, per Script zu jedem Artikel eine Liste aller angemeldeten Autoren zu erstellen, die zu jedem Artikel aufgerufen werden kann. Ebenso soll mit der Rechten Maustaste zur Online-Version und auf die dortige Bearbeitungsgeschichte gesprungen werden können.


Einleitung

edit

Die CD wird kein Booklet, sondern eine Einleitung nach unseren Vorstellungen enthalten, die noch von uns geschrieben werden muss. Auch der Artikel Wikipedia sollte überarbeitet werden.

Falls die Erstellung der CD gut funktioniert, soll anschließend eine DVD erstellt werden, auf der auch mehr Bilder Platz haben. Diese soll für 5€ über den Buchhandel vertrieben werden (womit im Besten Fall Kostendeckung erfolgt).