eine Fußgängerzone in einer Kommune. Auf das Bild ist eine Grafik gelegt aus hellen weißen kleinen Quadraten, Punkten und Verbindungslinien zwischen diesen Punkten.

Der neue Musterdatenkatalog: mehr Kommunen und neue Struktur

Die Version 4.0 des Musterdatenkatalogs der Bertelsmann Stiftung ist da. Über 100 Kommunen sind neu hinzugekommen. Durch eine neue Taxonomie sind enthaltene Datensätze besser auffindbar und der Algorithmus, der Datensätze den neuen Themen zuordnet, klassifiziert diese noch genauer. Außerdem haben alle Musterdatensätze eine Beschreibung und eine englische Übersetzung erhalten. 

Der Musterdatenkatalog schafft einen Überblick über die Daten, die Kommunen der Allgemeinheit zur Verfügung stellen. Bevölkerungsentwicklung, Standorte von Spielplätzen und Kindertagesstätten oder freie Parkplätze - offene Daten aus rund 350 Kommunen lassen sich hierüber finden. 

Über 100 neue Kommunen im Musterdatenkatalog

Im Vergleich zur letzten Version aus April 2022 wurden 112 neue Kommunen mit aufgenommen, darunter größere wie Karlsruhe, Nürnberg oder Frankfurt aber auch kleinere wie Dingelstädt oder Bürgel. In den Musterdatenkatalog finden alle kommunalen Datensätze Eingang, die über govdata.de abrufbar sind. Insgesamt sind dies mit Stand 20.04.23 über 19.800 Datensätze (April 2022: 14.195).

Neue Taxonomie und neuer Algorithmus

Die Taxonomie des Musterdatenkatalogs basiert in großen Teilen auf dem Prototypen, der 2019 veröffentlicht wurde. Einige neue Musterdatensätze haben wir bei früheren Aktualisierungen neu aufgenommen. In den vergangenen Jahren hat sich aber gezeigt, dass manche Musterdatensätze fast keine kommunalen Daten enthalten und einige kommunalen Daten über die bestehenden Musterdatensätze nicht gut abgedeckt sind.  

Der weiterentwickelte Musterdatenkatalog hat nun eine neu erarbeitete Taxonomie, die eine bessere Übersicht schafft, neuere Themen abdeckt (z.B. Corona) und eine genauere Klassifikation durch einen neuen Algorithmus ermöglicht.  

Die neue Taxonomie des Musterdatenkatalogs setzt sich aus 25 Themen und 241 Bezeichnungen zusammen. Die Zahl der Musterdatensätze beläuft sich entsprechend auf 241 Musterdatensätze. Zuvor waren dies 305.

Die Zahl der Themen ist von 60 auf 25 verringert worden. Dies erleichtert eine erste Orientierung, da die Bedeutungsbereiche der Themen nun ähnlich groß sind (z.B. Raumplanung, Flora und Fauna, Bildung). Zuvor gab es umfassende Themen wie z.B. Energiewirtschaft neben speziellen wie z.B. Friedhöfe. Neu hinzugekommen ist bei manchen Musterdatensätzen eine dritte Ebene, falls mehr Detaillierung nötig ist (z.B. Politische Partizipation – Wahl – Kommunalwahl).

Die neue Version 4 des Musterdatenkatalogs haben wir mit dem Dienstleister &effect data solutions in zwei Online-Workshops mit Vertreter:innen aus den Kommunen Moers, Bonn und Münster, dem Land Schleswig-Holstein und GovData erarbeitet. 

Thematische Verteilung der Datensätze – Bebauungspläne weiter an der Spitze

Wie auch schon in früheren Versionen bleibt in der thematischen Verteilung ein Ausschlag hin zu Bebauungsplänen (Musterdatensatz: Raumplan – Bebauungsplan) bestehen. Und auch weitere Musterdatensätze im Themenbereich „Raumplanung“ sind häufig vertreten.

Ein neuer Algorithmus (BERT-Modell) wurde trainiert, um die Genauigkeit der automatisierten Klassifizierung der kommunalen Datensätze im Musterdatenkatalog zu verbessern.

Weitere Neuerungen: Beschreibungen, Übersetzungen und Verlinkungen

Für die neue Version 4 des Musterdatenkatalogs haben wir Beschreibungen erstellt, die eine Zuordnung der Kommunen ihrer Datensätze zu Musterdatensätzen erleichtern sollen. In DCAT-AP.de gibt es das Feld „dct:references“. Dort kann per URI ein Verweis auf den entsprechenden Musterdatensatz eingetragen werden. Die Beschreibungen und die URIs sind auf dieser Seite zu finden.

Für eine mögliche Übertragbarkeit des Musterdatenkatalogs ins Ausland wurden alle Musterdatensätze ins Englische übersetzt. Dies könnte die Grundlage bilden für Musterdatenkataloge in anderen Staaten.

Außerdem wurden im Sinne von Linked Open Data Verlinkungen zu weiteren kontrollierten Vokabularen aufgenommen. Jeder einzelne Musterdatensatz enthält, sofern es im engeren oder weiteren Sinne eine Entsprechung gibt, eine Verlinkung zu Einträgen auf:

  • Wikidata
  • Gemeinsame Normdatei (GND) der Deutschen Nationalbibliothek (DNB)
  • EuroVoc
  • Schema.org

Die Verlinkungen sind auffindbar über die RDF-Datei auf dieser Seite.

Auf der Seite musterdatenkatalog.de ist die neue Version abrufbar. Eine neue Aktualisierung des Musterdatenkatalogs mit kommunalen Datensätzen, die neu auf govdata.de abrufbar sind, erscheint in ca. sechs Monaten. Der Musterdatenkatalog wurde ab 2018 in einem Gemeinschaftsprojekt mit GovData, der Open Knowledge Foundation Deutschland und dem KDZ – Zentrum für Verwaltungsforschung entwickelt. 

Die Bertelsmann Stiftung ist offen für Anregungen, die eine künftige Nutzung des Musterdatenkatalogs in Kommunen betreffen. Treten Sie gerne mit uns in Kontakt.