Software-Entwicklung

Aus Wikimedia Deutschland
Wechseln zu: Navigation, Suche


CatGraph, eine In-Memory-Graph-Datenbank für die Kategoriestruktur bei Wikipedia.


CatGraph ist eine Graph-Datenbank. Es bietet Entwicklerinnen und Entwicklern von Tools schnellen Zugriff auf die Wikipedia-Kategoriestruktur, zum Beispiel:

  • Finden aller Seiten in einer Kategorie mit frei definierter Suchtiefe innerhalb von Unterkategorien.
  • Suche nach "Wurzelknoten", das heißt Kategorien, die in keiner anderen Kategorie enthalten sind; zum Beispiel! Hauptkategorien in dewiki.
  • Suche nach Zyklen in der Kategoriestruktur, d.h. Kategorien, die in einer ohnen übergeordneten Kategorie enthalten sind.
  • Set-Vorgänge auf Suchergebnisse : Schnittmegen ("In A und in B"), Differenz ("In A, aber nicht in B").

Der komplette Kategorie-Graph einer Wikipedia-Sprachversion wird im RAM gehalten.

CatGraph wurde von Johannes Kroll für Wikimedia Deutschland eV entwickelt. Die ursprüngliche Spezifikation wurde von Daniel Kinzler geschrieben.