Glossar
Behördenleistungen
Behördenleistungen werden stets mit öffentlichen Mitteln finanziert. Die entsprechenden Dienstleistungen können zugunsten einer Einzelperson, eines Unternehmens oder einer anderen öffentlichen Stelle erbracht werden. Eine Dienstleistung besteht unabhängig davon, ob sie in Anspruch genommen wird oder nicht.
Data Catalog Vocabulary (DCAT)
Das Data Catalog Vocabulary (DCAT) ist eine normierte Art und Weise, wie Datensammlungen und -dienste beschrieben werden. Durch die vereinheitlichte Terminologie soll der Datenaustausch im Internet vereinfacht werden. Zudem können so beschriebene Datensammlungen einfacher aufgefunden, ausgelesen und archiviert werden. DCAT baut auf dem Resource Description Framework (RDF) auf, das von der Normierungsbehörde World Wide Web Consortium (W3C) gepflegt wird. Weitere Informationen sind bei W3.org zu finden.
Der Standard beinhaltet so genannte Anwendungsprofile. Diese lassen sich an die eigenen Bedürfnisse anpassen. Das Schweizer Anwendungsprofil DCAT-AP CH baut auf dem Profil der Europäischen Union auf, trägt aber gleichzeitig den Eigenheiten der Schweizer Datenräume Rechnung. Entwickelt wird es von der Fachgruppe “Open Gouvernement Data” des Standardisierungsgremiums eCH.
Das DCAT-Vokabular besteht aus Klassen und Eigenschaften. Eine Klasse kann etwa eine Organisation sein, eine Person, ein Datensammlung oder eine Website. Jede Klasse hat Eigenschaften, die sie beschreiben – etwa einen Titel, Stichworte zum Inhalt oder die Internet-Adresse.
Komplexe Eigenschaften können selber Klassen sein. Ob es sich bei einem Element um eine Klasse oder um die Eigenschaft einer Klasse handelt, wird bei DCAT mit der Gross- und Kleinschreibung deutlich gemacht: Ein Klasse beginnt stets mit einem Grossbuchstaben. Die Klasse für den Herausgeber etwa lautet dcat:Publisher
. Soll hingegen in einen Eintrag zu einer Datensammlung beschrieben werden, wer diese publiziert hat, wird die Kleinschreibung verwendet: dcat:publisher
. So wird deutlich gemacht, dass es sich beim entsprechenden Eintrag um eine Eigenschaft handelt.
DCAT sieht vier Hauptklassen vor: Die Klasse Katalog (dcat:Catalog
) beschreibt eine Sammlung, die Datensammlungen wie auch elektronische Schnittstellen (APIs) enthalten kann. Dataset (dcat:Dataset
) hingegen beinhaltet Informationen zu einer einzelnen Datensammlung. Mit der Klasse Data Service (dcat:Dataservice
) werden elektronische Schnittstellen beschrieben, über die Daten abgerufen werden können. Eine Distribution (dcat:Distribution
) beschreibt eine spezifische Repräsentation der Datensammlung, etwa einen Export in der Form einer CSV-Datei.
Auf der I14Y werden auch elektronische Behördenleistungen beschrieben. Deshalb wurde DCAT um die Klasse Public Service (dcat:Publicservice
) erweitert. Für diese Einträge wird das Core Public Service Vocabulary Application Profile der Europäischen Union verwendet.
Datenelement
Das Datenelement ist die kleinste beschreibende Einheit einer Datensammlung. Oft wird das Datenelement auch als Attribut, (definierte) Variable oder “Spalte” bezeichnet. Das Datenelement enthält die einzelnen Werte, z.B. die AHV-Nummer, die Anzahl leerstehender Wohnungen oder die Messwerte der Wassertemperatur. Jedes Datenelement verweist auf ein Datenelementkonzept. Vergleiche Kapitel Abschnitt zum Datenelement im Kapitel Rollen und Prozesse.
Datenelementkonzept (Konzept)
Das Datenelementkonzept beschreibt die im Datenelement enthaltenen Informationen eindeutig und vollständig. Bei einem Konzept kann es sich um eine Zahl, eine Zeichenkette, ein Datum oder um eine Codeliste mit vordefinierten Werten handeln. Zur Beschreibung der Konzepte wird bei der I14Y der Standard ISO 11179-1:2023 verwendet. Eine Schritt-für-Schritt-Anleitung zur Erfassung eines Konzepts ist im Kapitel im Kapitel Konzepte erfassen beschrieben.
Datentyp
Der Datentyp klasifiziert ein Datenelement. Er gibt an, welche Art von Werten darin enthalten sein dürfen. Mithilfe des Datentypen wird sichergestellt, dass Daten von einem Programm korrekt verarbeitet und interpretiert werden. Beispiele für Datentypen sind: Ganzzahlen (engl. integer), Gleitkommazahlen (floating point), Boolesche Werte (boolean) oder Zeichenketten (string). Auf der I14Y definiert das Konzept den Datentyp (vgl. Abschnitt zum Konzept).
Elektronische Schnittstelle (API)
Eine elektronische Schnittstelle ermöglicht es verschiedenen Systemen und Anwendungen miteinander zu kommunizieren. Und das selbst dann, wenn die Systeme nicht direkt miteinander verhängt sind. Über elektronische Schnittstellen können etwa Informationen aus einem Datensammlung abgefragt werden, ohne dass die gesamte Datensammlung heruntergeladen werden muss. In der Fachsprache werden elektronische Schnittstellen oft als Application Programming Interface (API) bezeichnet, also als elektronische Schnittstellen für Anwendungen. Sie werden in der modernen Software-Entwicklung sehr oft eingesetzt, um einzelne Teilsysteme zu verbinden oder um Daten von einem anderen System zu beziehen.
Datensammlung
Eine Datensammlung ist eine Zusammenstellung von Daten, die von einer Quelle veröffentlicht oder kuratiert wird und durch eine übergreifende Idee verbunden sind. Im Gegensatz zu einer elektronische Schnittstelle wird von einer Datensammlung erwartet, dass sie → Distributionen hat, also in einem oder mehreren Formaten zur Verfügung steht. Viele → elektronischen Schnittstellen greifen auf Datensammlungen zurück. Weitere Details zur Struktur einer Datensammlung auf der I14Y sind in der Beschreibung des Informationsmodell zu finden.
Distribution
Eine Distribution ist ein Auszug aus einer → Datensammlung. Diese Exporte können in unterschiedlichen Formaten vorliegen. Oftmals werden Auszüge etwa sowohl als CSV- als auch als JSON-Datei zur Verfügung gestellt. Eine Distribution muss nicht die gesamte Datensammlung enthalten. Die einzelnen Exporte können sich etwa in Bezug auf die räumliche oder zeitliche Auflösung unterscheiden. So kann etwa eine Datei mit den kantonalen Werten angeboten werden – und zusätzlich eine mit den kommunalen. Oder ein Export bildet das laufende Jahr ab, während der andere auch die Werte der vorhergeheneden Jahre beinhaltet.
eCH
Der gemeinnützige Verein eCH fördert, entwickelt und verabschiedet Standards im Bereich E-Government. In den zahlreichen Arbeitsgruppen von eCH arbeiten sowohl Vertreterinnen und Vertreter des Bundes und der Kantone als auch der der Privatwirtschaft und der Wissenschaft mit. eCH ist das wichtigste Normierungsgremium im Bereich eGovernment in der Schweiz. Weitere Informationen wie auch die Dokumente zu den verabschiedeten Standards sind auf der Website ech.ch zu finden.
Enterprise Identity Managment (EIAM)
Systeme zum Enterprise Identity Management (EIAM) werden verwendet, um Identitäten und Zugriffsrechte innerhalb eines Unternehmens oder einer Organisation zu verwalten und zu schützen. Sie stellen also sicher, dass einzig die vorgesehenen Personen eine bestimmte Internet-Plattform oder Anwendung nutzen können. Dabei regeln sie auch, wer Lese-, Schreib- und wer Administrationsrechte hat. Die I14Y nutzt das EIAM-System der Bundesverwaltung. Weitere Informationen sind unter Kontenverwaltung zusammengestellt.
FAIR-Prinzipien
Die FAIR-Prinzipen postulieren, dass Daten einfach auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable) und mehrfachverwendbar (Reusable) sein sollen. Die Daten sollen sowohl von Menschen als auch von Computersystemen einfach auffindbar sein. Sie sollen über ein offenes, freies und universell implementierbares Standard-Kommunikationsprotokoll zugänglich sein. Dank einer eindeutigen Lizenz ist ersichtlich, wie die Daten genutzt werden dürfen. Die Interoperabilität ist sowohl semantisch als auch syntaktisch gewährleistet. Sie setzt die Verwendung präziser kontextbezogener Metadaten voraus, hält sich in Bezug auf Inhalt und Format an die grossen internationalen Standards und verwendet möglichst standardisierte Vokabulare. Die freie, bedingte oder kostenpflichtige Mehrfachverwendung der Daten wird durch gemeinsame Standards vereinfacht. Grundlegende Informationen zu den FAIR-Prinzipien sind in diesem Nature-Artikel zu finden.
Geodaten
Geodaten sind raumbezogene Daten. Sie beschreiben die Ausdehnung und Eigenschaften bestimmter Räume und Objekte: etwa die Lage, die Beschaffenheit, die Nutzung und die Rechtsverhältnisse. Beispiele für Geodaten, die breit genutzt werden, sind die digitalen Strassenkarten und Routenplaner.
Geobasisdaten
Geobasisdaten sind Geodaten, die auf einem Recht setzenden Erlass des Bundes, eines Kantons oder einer Gemeinde beruhen: z.B. die Amtliche Vermessung, der Bauzonenplan oder das Hochmoor-Inventar.
Geocat
Geocat ist ein Katalog für Metadaten für Geoinformationen in der Schweiz und im Fürstentum Liechtenstein. Darin erfassen Bundesämter, Kantone, Gemeinden, Forschungsinstutute und Unternehmen Informationen zu ihren Geodaten, also von Datensätzen mit starkem geografischem Bezug, von Karten wie auch Luftbildern. Betrieben wird der Dienst vom Bundesamt für Landestopografie swisstopo. Weitere Informationen sind im Abschnitt zu den verschiedenen Plattformen zu finden.
Internationale Organisation für Normung (ISO)
Die Internationale Organisation für Normung (ISO) ist eine Vereinigung von Normierungsorganisationen. Sie erarbeitet internationale Normen in zahlreichen Bereichen – mit Ausnahme der Elektrotechnik und der Kommunikationstechnologie. Bei der ISO handelt es sich um einen Verein nach schweizerischem Recht. Der Sitz ist in Genf. Nationale Standardisierungsvorhaben im Bereich eGovernment treibt meistens der → Verein eCH voran.
Interoperabilität
Interoperabilität ist die Fähigkeit unabhängiger, heterogener Systeme, möglichst nahtlos zusammenzuarbeiten. Sie sollen Informationen auf effiziente Art und Weise auszutauschen, ohne dass dazu im Einzelfall gesonderte Absprachen nötig sind. Das European Interoperability Framework (EIF) unterscheidet vier Ebenen: Die rechtliche Interoperabilität stellt sicher, dass eine ausreichende gesetzliche Grundlage für die Zusammenarbeit besteht. Die organisatorische Interoperabilität beschreibt, wie die Geschäftsprozesse aufeinander abgestimmt sind. Mit der semantischen Interoperabilität wird angestrebt, dass beim Austausch von Informationen die Form der Daten möglichst nicht manuell verändert werden muss. Die technische Interoperabilität beschreibt alle technischen Aspekte des Informationsaustausches, beinhaltet also etwa Schnittstellenspezifikationen und Übermittlungsprotokolle.
Interoperabilitätsstelle (IOS)
Die Interoperabilitätsstelle (IOS) des Bundesamts für Statistik stellt die Instrumente zur Harmonisierung, Standardisierung und Mehrfachverwendung von Daten bereit. Als technisches Werkzeug dazu entwickelt und betreut sie die I14Y. Die Interoperabilitätsstelle koordiniert die Standardisierung und Harmonisierung von Daten innerhalb der einzelnen Themenbereiche (z.B. Energie, Gesundheit, Mobilität, Landwirtschaft). Das BFS nimmt dabei die Aufgaben des Swiss Data Stewards wahr.
Linked Data
Linked Data sind Daten, die dank eines Identifikators (Uniform Resource Identifier) direkt miteinander verknüpft werden können. Sofern die Daten frei verfügbar sind, wird auch von Linked Open Data gesprochen. Die Daten können verteilt sein. Sie lassen sich über normale Web-Transferprotokoll abrufen. Dank dem standardisierten Aufbau lassen sie wie eine einzige grosse Datenbank benutzen. Dazu wird die Abfragesprache Sparql eingesetzt. Linked Open Data ist ein von Tim Berners-Lee, dem Erfinder des World Wide Webs, entwickeltes Konzept. Das Ziel ist der Aufbau eines semantischen Webs, bei dem dank strukturierten und verknüpfbaren Datenangeboten die maschinelle Kommunikation vereinfacht wird. Die Plattform Lindas ist die wichtigste Anbieterin von Linked Data im Bereich der öffentlichen Verwaltung in der Schweiz. Weitere Informationen sind im Abschnitt zu Lindas zu finden.
Metadaten
Metadaten sind Daten, die andere Daten definieren und beschreiben. Sie beinhalten Informationen zur Semantik einer Datensammlung – also zur Bedeutung, zum Inhalt und zur Qualität. Zudem beschreiben sie die Syntax (die Form und die Struktur) der verwendeten Attribute (Variablen). Um sicherzustellen, dass die Daten einheitlich erfasst werden, können → Nomenklaturen hinterlegt und Register angebunden werden, etwa das Gemeindeverzeichnis, die Nomenklatur der Berufe (ISCO) oder der Wirtschaftszweige (NOGA). Damit werden diese Daten zu Metadaten. Auf der I14Y lassen sich solche Metadaten verwalten, publizieren und austauschen.
Nationale Datenbewirtschaftung (NaDB)
Das Programm Nationale Datenbewirtschaftung hat es zum Ziel, die Datenbewirtschaftung der öffentlichen Hand durch die Mehrfachnutzung von Daten einfacher und effizienter zu gestalten. Es wurde vom Bundesrat initiiert und im Oktober 2019 gestartet. Beteiligt am Programm sind alle Departemente des Bundes, die Bundeskanzlei, alle Bereiche des Statistiksystems Schweiz, Vertreter von Kantonen, die Sozialpartner sowie private Organisationen und Verbände. Die Verantwortung für die Umsetzung des Programms liegt beim Bundesamt für Statistik. Technisches Kernstück ist die I14Y. Weitere Informationen sind auf der Website des Programms zu finden.
Nomenklatur
Eine Nomenklatur ist eine für bestimmte Bereiche verbindliche Sammlung von Benennungen aus einem bestimmten Themen- oder Anwendungsgebiet. Beispiele für Nomenklaturen sind ein Gemeindeverzeichnis oder ein Länderverzeichnis. Eine Nomenklatur erhält Codes und beschreibende Textteile, allenfalls in verschiedenen Sprachen.
Once-Only-Prinzip
Ziel des Once-Only-Prinzips ist es, dass Bürgerinnen und Bürger sowie Unternehmen ihre Daten nur einmal der öffentlichen Verwaltung zur Verfügung stellen müssen. Die einzelnen Amtsstellen der unterschiedlichen Ebenen tauschen dann die Informationen selbstständig aus – sofern dies explizit so vorgesehen und sinnvoll ist. Das Once-Only-Prinzip soll den Aufwand reduzieren – bei den Bürgerinnen und Bürgern, den Unternehmen wie auch innerhalb der Verwaltung. Die Umsetzung des Once-Only-Prinzips ist ein zentrales Ziel des Programms Nationale Datenbewirtschaftung (NaDB).
Ontologie
Eine Ontologie ist eine formal definierte Darstellung von Wissen, in der die Konzepte und Beziehungen in einem bestimmten Bereich beschrieben werden. Sie ist wie ein Vokabular oder ein Regelwerk, das ein gemeinsames Verständnis eines bestimmten Fachgebiets ermöglicht. Ontologien werden verwendet, um den Austausch und die Wiederverwendung von Wissen zu ermöglichen und die Kommunikation und Argumentation zwischen Menschen oder Computersystemen zu erleichtern.
SDMX
Der Statistical Data and Metadata EXchange (SDMX) ist eine Initiative zur Standardisierung des Datenaustauschs zwischen internationalen Organisationen und ihren Mitgliedsländern. Massgeblich entwickelt wurde er von der Weltbank und der Europäischen Union. SDMX definiert sowohl einheitliche Datenformate als auch Metadatenstandards und Methoden zur Datenübertragung. Weitere Informationen: sdmx.org. Auf der I14Y können Codelisten im SDMX-Format eingelesen werden (siehe Erfassen von Konzepten).
Stammdaten
Die Stammdaten sind grundlegende Informationen, die von der öffentlichen Verwaltung zwingend benötigt werden. Sie können Personen, Unternehmen, aber auch diverse Objekte wie etwa Gebäude oder Fahrzeuge beschreiben. Für jedes dieser Objekte muss ein abschliessender Katalog der Merkmale (Attribute) verfügbar sein. Die Stammdaten sind zustandsorientierte Daten. Sie bleiben im Zeitverlauf volumenmässig relativ konstant. Und sie ändern sich eher selten. Eine Sonderform von Stammdaten sind die so genannten Referenzdaten wie etwa die Codes für Flughäfen oder Länder. Diese dienen der Klassifizierung von Stammdaten.
Swagger
Swagger ist eine Kollektion frei verfügbarer Hilfsmittel zur Publikation und Nutzung von elektronischen Schnittstellen (APIs). Auf der I14Y werden insbesondere die Dokumentationsmöglichkeiten genutzt: Dank der Swagger-Weboberfläche ist rasch ersichtlich, was mit der betreffenden API möglich ist. Zudem können die Abfragemöglichkeiten bei sämtlichen Endpunkten direkt ausprobiert werden. Weitere Informationen sind unter Metadaten abrufen zu finden.
URI (Uniform Resource Identifier)
URIs erlauben die Identifizierung von abstrakten oder physischen Ressourcen im Internet. RDF-Ressourcen werden durch eindeutige Bezeichner (URIs) indentifiziert. Die URIs erlauben es, Aussagen aus verschiedenen Quellen zu verbinden.
Verwaltungsdaten
Verwaltungsdaten sind Daten, die im Rahmen eines gesetzlichen Auftrags erhoben, erstellt, verwaltet, verarbeitet und gespeichert werden. Bei diesen kann es sich um strukturierte und unstrukturierte Daten handeln. Auf der I14Y können die einzelnen Verwaltungsstellen Inventare ihrer Daten erstellen. Öffentlich publizieren lassen sich die harmonisierten oder standardisierten Datenangebote.
Validierung
Die Validierung ist ein Prozess. Darin wird geprüft, ob ein bestimmter Inhalt in ein System oder ein Verzeichnis aufgenommen werden soll. Im Fall einer Datensammlung werden auf der I14Y vor der öffentlichen Publikation etwa das Datenformat kontrolliert, die Datenintegrität sowie die Wertebereiche und Nomenklaturen. Die Validierung erfolgt durch die Local Data Stewards oder die Interoperabilitätsstelle.