Software

Wikimedia-Software: Für mehr Gemeinwohl im Netz

Zarah Ziadi

Im Bestreben, allen Menschen weltweit freien Zugang zu Wissen zu ermöglichen, konzentriert sich Wikimedia Deutschland auch auf die Entwicklung, Verbesserung und Erweiterung nachhaltiger Open-Source-Software. Sie bildet eine Infrastruktur, die es allen Menschen ermöglicht, Wissen zu teilen, zu nutzen und zu erweitern. Im Fokus stand auch im Jahr 2023 die Weiterentwicklung der freien Wissensdatenbank Wikidata und der freien Software Wikibase. Beide leisten einen bedeutenden Beitrag zur Stärkung dieser Infrastruktur. Auch mit dem Projekt »Technische Wünsche« verfolgen wir diesen Anspruch. Hier gab es 2023 viel Grund zum Feiern.

10 Jahre Technische Wünsche und ein langer Reparatursommer

Damit die Ehrenamtlichen der Wikimedia-Projekte ihrer Arbeit bestmöglich nachgehen können, müssen auch die technischen Voraussetzungen stimmen, vor allem die Benutzungsfreundlichkeit der Wikipedia. Seit 2013 existiert das Projekt »Technische Wünsche«, ins Leben gerufen auf Initiative eines Wikipedianers, der eine Umfrage in der Community zu Verbesserungsvorschlägen startete. Wikimedia Deutschland stieg kurz darauf in das Projekt ein, das die Community-Befragung verstetigt hat, und auf deren Grundlage regelmäßig Verbesserungen vorangetrieben werden.

»Wir laden überjährig dazu ein, uns mitzuteilen, welche Probleme gesehen werden – dazu gibt es die Wiki-Seite »Wunschparkplatz«, erzählt Johanna Strodt, die zuständig für die Community-Kommunikation Technische Wünsche bei Wikimedia ist. Jeweils vor einer Umfrage werden die gesammelten Anliegen geclustert und nach Themenbereichen aufgeteilt. Bei der Abstimmung wird dann ein Schwerpunkt gesetzt, dem sich das Produktentwicklungsteam von Wikimedia zwei Jahre lang widmet. »Damit dienen wir nicht nur der deutschsprachigen Community, sondern wir verbessern die Software MediaWiki, die allen Wikis weltweit unterliegt«, erklärt Strodt. Bei der jüngsten Umfrage, an der sich rund 1.000 Ehrenamtliche beteiligten, gewann der Themenkomplex »Wiederverwendung von Einzelnachweisen vereinfachen«. Bis dato müssen ehrenamtlich Schreibende der Wikipedia, die für ihren Text beispielsweise unterschiedliche Stellen aus demselben Buch als Quelle angeben wollten, den Nachweis jedes Mal wieder händisch neu eingeben.

Im Jahr 2023 hat Wikimedia Deutschland im Rahmen der »Technischen Wünsche« erstmals ein zusätzliches Angebot gemacht: den Reparatursommer. Strodt führt dazu aus: »Uns haben immer wieder Anfragen aus der Community erreicht, ob wir nicht helfen könnten, bestimmte Tools oder Helferlein zu reparieren, die von Ehrenamtlichen entwickelt wurden und nicht mehr funktionieren – wobei die Community aus diversen Gründen selbst keinen Rat weiß.« Weil kurzfristig Kapazitäten vorhanden waren, wurde der Reparatursommer als Versuchsballon gestartet: 30 Wünsche gingen ein, 19 konnten erfüllt werden, teils als »Hilfe zur Selbsthilfe« für ehrenamtliche Entwickler*innen, teils durch Fehlerbehebungen durch Wikimedia Deutschland. Die gute Nachricht ist, dass das Format über den vorgesehenen Zeitraum hinaus verstetigt wurde. In Zukunft heißt es »Technische-Wünsche-Reparaturhilfe«.

»Uns haben immer wieder Anfragen aus der Community erreicht, ob wir nicht helfen könnten, bestimmte Tools oder Helferlein zu reparieren«
Johanna Strodt

Leichter mit Wikidata verbinden – die Einführung der REST API

Ein Schwerpunkt der Arbeit im Technologiebereich ist die Weiterentwicklung der offenen und freien Wissensdatenbank Wikidata. Mit mittlerweile rund 110 Millionen Datensätzen ist sie eine zentrale Ressource, die von zahlreichen Wikimedia-Projekten, allen voran der Wikipedia, sowie immer mehr externen Anwender*innen genutzt wird.

Um Menschen weltweit den Zugang zu den strukturierten Daten und Anwendungen zu erleichtern, hat Wikidata, wie die meisten digitalen Produkte, eine Programmierschnittstelle, kurz API. Diese wurde 2023 mit einem zweiten, benutzerfreundlicheren Modell ergänzt: der REST API. Sie entspricht modernsten Industriestandards und ist daher einfacher zu verwenden als die bereits bestehende Action API. Davon profitieren insbesondere Entwickler*innen, die bisher keine Erfahrung mit Wikidata hatten. Obwohl noch nicht alle API-Funktionen in die REST API überführt wurden, zeigen sich bereits jetzt positive Auswirkungen auf die Benutzerfreundlichkeit, wie sie beispielsweise aus dem Feedback zur REST API im Jahr 2023 hervorgehen.

Wikidata & KI – der Kampf gegen Desinformationen

Seit der Veröffentlichung von ChatGPT im Jahr 2022 schreitet der Aufstieg von KI-Modellen rasant voran. Viele der großen Sprachmodelle (Large-Language Models, kurz LLM) werden mit freiem Wissen aus Wikidata und Wikipedia trainiert. Dabei sind gerade die strukturierten, belegten Daten aus dem Wikidata-Wissensgraphen ein Vorteil: Sie verbessern die Qualität und Genauigkeit von LLM-Ergebnissen signifikant, sogenannte Halluzinationen können deutlich reduziert werden. Wikimedia Deutschland hat im Jahr 2023 auch nach Wegen gesucht, die Daten von Wikidata effektiver in große Sprachmodelle einzubringen, um die Zuverlässigkeit der Ergebnisse weiter zu verbessern. Dazu wurde die Idee für einen Prototypen eines generativen KI-Systems mithilfe einer RAG-Pipeline (Retrieval Augmented Generation) entwickelt und auf dem AI.Dev/Cassandra Summit in den USA vorgestellt. Grundsätzlich soll unsere weitere Arbeit daran vor allem Open-Source- und Open-Data-Organisationen sowie Start-ups zugutekommen, die große Sprachmodelle für gemeinnützige offene Projekte nutzen und deren Werte mit denen von Wikimedia Deutschland übereinstimmen.

Wikimedia Deutschland arbeitet außerdem weiter mit der AI & Data Generative AI Commons der Linux Foundation zusammen. Sie wurde gegründet, um das offene Technologie-Ökosystem für generative KI zu definieren und zu unterstützen. Dies geschieht durch den Aufbau einer Gemeinschaft von Organisationen, die offene Daten und Modelle entwickeln, fördern und kuratieren. Die Hauptaufgabe der LF AI & Data Foundation besteht darin, das Bewusstsein für offene generative KI zu schärfen und Gemeinschaftsprojekte in den Bereichen künstliche Intelligenz, maschinelles Lernen, Bildung, Öffentlichkeitsarbeit und datenbezogene ethische und verantwortungsvolle KI-Projekte zu unterstützen.

Wissensgraph – mit vernetzten Informationen Wissen schaffen

Ein Wissensgraph ist wie eine große Karte oder ein Netzwerk von Informationen. Zur Veranschaulichung stellt man sich am besten viele kleine Karten mit Namen für Dinge darauf vor. Diese Karten sind miteinander verbunden, je nachdem, wie die Konzepte auf ihnen miteinander zusammenhängen. Zum Beispiel könnte auf einer Karte »Vesuv« stehen, eine andere Karte könnte das Wort »Vulkan« beinhalten, und sie wären miteinander verbunden, weil der Vesuv ein Vulkan ist. Auf diese Weise zeigt ein Wissensgraph, wie verschiedene Ideen oder Konzepte miteinander in Beziehung stehen. So stellen das Projekt Wikidata oder die Software Wikibase weitaus mehr dar als herkömmliche Datenbanken!

Passt nicht, gibts nicht – mit dem Mismatch Finder zu einer besseren Datenqualität

Gelegentlich kommt es vor, dass aufgrund verschiedener Quellen oder Forschungsergebnisse unterschiedliche Daten zu ein und demselben Gegenstand existieren. Dies kann zu Diskrepanzen zwischen den Daten in Wikidata und externen Datenbanken führen. Um sicherzustellen, dass diese betroffenen Daten rasch überprüft werden können, hat Wikidata im Jahr 2023 den Mismatch Finder eingeführt – ein bedeutendes Werkzeug zur Verbesserung der Datenqualität.

Der Mismatch Finder speichert Diskrepanzen, die von Einzelpersonen oder Institutionen identifiziert werden. Dadurch entsteht ein umfassender Pool an Informationen über potenzielle Nichtübereinstimmungen, der der Wikidata-Community zur Verfügung steht, um die Diskrepanzen zu beseitigen und somit ihre Arbeit erheblich erleichtert. Damit trägt der Mismatch Finder zur Qualitätsverbesserung der vernetzten Daten aus verschiedenen Datenbanken bei, was zu präzisen Ergebnissen in digitalen Anwendungen führt.

Wikibase – das gesamte Wissen der Menschheit vernetzen

Genau wie die Daten in der freien Wissensdatenbank Wikidata steht auch die ihr zugrunde liegende Software Wikibase unter einer freien Lizenz: Sie kann von allen genutzt werden, die mit großen Datenbeständen arbeiten – etwa in Galerien, Bibliotheken, Archiven, Museen oder in Wissenschaft und Forschung. Mit der Software lassen sich wie bei Wikidata strukturierte Daten für unterschiedlichste Wissensbestände speichern, verwalten, abrufen und verknüpfen. Immer mehr Institutionen und Organisationen nutzen Wikibase und ähnliche verknüpfte offene Datentechnologien. Auf diese Weise werden das Wissen der Welt immer stärker vernetzt und Wissenssilos abgebaut. Dies verdanken wir dem Prinzip von Linked Open Data, welches Daten miteinander verknüpft und sie öffentlich zugänglich macht. Das Ergebnis sind vernetzte Informationsökosysteme, die sich gegenseitig erweitern und zu neuen Erkenntnissen führen.

Wikibase Cloud Beta goes open!

Einen wichtigen Meilenstein konnte 2023 die Wikibase Cloud feiern: Sie ist in die offene Beta-Phase übergegangen. Damit haben jetzt alle die Möglichkeit, sich eine freie Wissensdatenbank mit verknüpften Daten, auch Wissensgraph genannt, über die Cloud-Anwendung anzulegen. Das ist ein weiterer wichtiger Schritt, um die Infrastruktur für Freies Wissen zu erweitern. Der Beta-Modus ermöglicht es uns weiterhin, die Plattform zu testen und zu optimieren, bevor sie vollständig ausgereift ist.

Wikibase und Museen – zu Gast bei der ICOM Triennale

Ein bedeutendes Ereignis, um Wikibase bekannter zu machen, war 2023 die ICOM Triennale in Valencia. Wikimedia Deutschland war vor Ort, um teilnehmenden Museen und Kulturinstitutionen die Vorteile der freien Software näherzubringen. Es fanden zahlreiche Gespräche statt, die zu mehr Glaubwürdigkeit, Vertrauen und Akzeptanz in der Museumslandschaft geführt haben. So sind neue Partnerschaften entstanden, zum Beispiel mit Einrichtungen in Indien und Brasilien.

Mitglieder des Wikibase-Teams von Wikimedia Deutschland waren im September zu Gast auf der ICOM-Triennale in Valencia, um Museums-Vertreter*innen die Vorteile der freien Software näher zu bringen und neue Kooperationen zu starten.

Kooperation mit dem Goethe-Institut und Workshops in Nigeria

Neben der stetigen Weiterentwicklung der Software hat Wikimedia Deutschland 2023 auch Projekte und Kooperationen vorangetrieben, um Wikibase bekannter zu machen. Zum Beispiel wurde mit dem Goethe-Institut ein Workshop-Programm entwickelt, das sich an Kulturerbe- und Kultureinrichtungen richtet. Beim Auftaktseminar, das mit dem Goethe-Institut Thessaloniki in Griechenland organisiert wurde, lernten die Teilnehmenden, wie GLAM- (Galleries, Libraries, Archives, Museums) Institutionen mit Wikibase arbeiten können und wie das Prinzip von Linked Open Data funktioniert.

Ein weiteres wirkungsvolles Projekt war die Wikibase-Workshopreihe für Bibliothekar*innen in Nigeria. Dabei hat Wikimedia Deutschland gezielt den Ansatz »Train the Trainer« verfolgt. Einzelne Teilnehmende wurden intensiv in der Wikibase-Anwendung geschult und haben ihr Wissen anschließend an andere Bibliothekar*innen weitergeben. Mit Erfolg: Im Rahmen des Workshops wurden mehrere Wikibase-Instanzen erstellt, die jetzt in Bibliotheken und Einrichtungen zum Einsatz kommen können. Zudem ist Wikimedia Deutschland eine Kooperation mit der Organisation AfLIA (African Library and Information Associations and Institutions) eingegangen, die eine Zusammenarbeit mit Bibliotheken in ganz Afrika ermöglicht.