Bald neu: Wikidata

1970 hat sich ein 15-jähriger einen Computer als überdimensionalen Supertaschenrechner vorgestellt. Der Fortran-Kurs im ersten Semester an der Uni bestätigt dem 19-jährigen dieses Bild. Die Begriffe „Datenverarbeitung“ und „Informationsverarbeitung“ gab es damals zwar schon, aber was sollte das sein? Wir haben Nullstellen oder Integrale berechnet.  Die Welt hat sich mittlerweile verändert und der über 50-jährige hat seine Naivität verloren. Wie nimmt er Daten- und Informationsverarbeitung heute wahr? Als eine globale Baustelle!

Ich hole an einer Support-Theke ein Gerät ab, das ich zur Reparatur abgegeben hatte. Das Gerät hat der agile Servicemitarbeiter schnell hervorgeholt. Jetzt müssen nur noch ein paar Formalitäten abgewickelt werden. Dazu versteckt er sich hinter einem großen Computermonitor und er fängt an zu Tippen, zu Klicken, wieder Tippen u.s.w. Was er schreibt muss er im Kopf haben, oder vom Bildschirm ablesen. Ich vermute Letzteres. D.h., was der „Computer“ eigentlich schon weiss, muss abgeschrieben und nochmal neu eingeben werden.

Ist das wirklich so absurd? Das ist doch IT-Alltag. Seid mal ehrlich!

Am 2. April 2012 startete die Wikimedia-Foundation ein neues Projekt, das Wikidata heißt. Worum geht es? Schauen wir mal, wie man heute in Wikipedia mit Daten umgeht. Vordergründig organisiert Wikipedia eine Sammlung von Erläuterungstexten. In den Texten sind Microbestandteile enthalten, die man im weitesten Sinne als Daten bezeichnen könnte. Z.B. Einwohnerzahlen von Städten. Wie hoch ist ein Berg? Wer ist Bürgermeister einer Stadt? Die einzelnen Sprachvarianten der Wikipedia sind eigentlich eigenständige Enzyklopedien. Es gibt zwar die Querverlinkungen, doch jede Sprachversion wird von einer eigenen Community mit eigenen Regeln und eigener Hackordnung gestaltet. Die lokale Differenzierung hat sich im Grunde bewährt, doch ein Nachteil ist, dass Daten, die sich regelmäßig verändern,  in allen Sprachen eigenständig aktuell gehalten werden müssen.. Nehmt mal die Wikipedia-Seite der Uni Duisburg-Essen und wechselt zwischen den verschiedenen Sprachen. Wieviele Studenten hat denn unsere Uni? Und wer ist der Rektor? ( Die Uni hat so viele chinesische Studenten. Kann nicht mal einer von Euch im chinesischen Wikipedia den aktuellen Rektor eintragen?) Die Idee von Wikidata ist nun die, solche Informationen sprachunabhängig in einem einzigen System zu verwalten und von den Texten abzukoppeln.

Hier ein paar Links zum Thema:

In dem Wikidata-Projekt stecken mehrere Herausforderungen:

  • Wie wird die Semantik der Daten abgelegt?
  • Wie werden die Daten in die Wikipedia-Seiten eingebunden?
  • Wie wird die Eingabe und Pflege der Daten multinational organisiert?
  • Wie können die Daten außerhalb von Wikipedia genutzt werden?

Wenn bei diesem Projekt etwas praktikables herauskommt, wird es das Internet verändern. Vielleicht haben wir hier den Startschuß für eine „semantische Revolution“ die auf der Web 3.0-Vision basiert? Siehe Semantisches Web. Das Wikidata-Projekt formuliert diesen universellen Anspruch aber nicht, sondern orientiert sich daran, innerhalb eines Jahres zu einsetzbaren Verfahren zu kommen.


Beitrag veröffentlicht

in

,

von

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert