Konzeptpapier zum aktuellen Stand der Diskussion um "Datenaustausch zwischen agroökologischer Software" aus Sicht von Ecobytes


#1

Dieses Dokument beinhaltet Hinweise auf Möglichkeiten der Schaffung von Interoperabilität im Datenaustausch zwischen verschiedenen technischen Plattformen. Es orientiert sich dabei an den in der Einladung zum :speech_balloon: Bio & regional goes digital Folgeworkshop erwähnten methodischen Perspektive.

Ecobytes e.V.
Jon Richter

CC BY-SA 4.0
05./06.02.2019

Themen

Aus der Einladung und der Arbeit von Ecobytes im Feld der Solidarischen Landwirtschaften kennen wir die Themen

  • Anbauplanung
  • Bieterrunde
  • Buchführung
  • Budgetplanung
  • Mitgliederverwaltung
  • usw.

welche mit Hilfe elektronischer Datenverarbeitung (EDV) bearbeitet werden.

Schnittstellen für Datenaustausch

Es gibt verschiedene Methoden um heterogene Datensätze mit einander zu verbinden. Diese lassen sich grob einteilen in die Ansätze

  1. Datensynchronisierung
  2. Föderation von Daten
  3. Linked Data

Da Interoperabilität erst nachträglich festgestellt werden kann, sind sie in ihrer Wirkweise komplementär. Einzig die mit ihrer Implementierung verbundenen Aufwände unterscheiden sich mitunter drastisch.

verfügbare Standards

Im folgenden besprechen wir verfügbare Standards, welche den Datenaustausch zwischen Onlineplattformen ermöglichen.

1 manuelle Synchronisierung

Eine gängige Art Daten zwischen verschiedenen Orten zu halten, ist die Synchronisierung. Hierbei werden die selben Datensätze an verschiedenen Stellen aktuell gehalten und stets mit einander abgeglichen. Wenn möglich werden Änderungen nicht nur über ihren Zeitstempel, sonder auch explizit im Datenmodell versioniert.

In einem Extract-Transform-Load (ETL) genannten Verfahren werden Daten von Quellplattformen extrahiert (1), in ein gemeinsames Datenschema überführt (2) und an einem zentralen Ort abgeladen (3). Im Zuge dieses Vorgehens ist es vonnöten für jede Datenquelle manuell die Adapter (1) und Transformationen (2) zu programmieren, welche Vergleichbarkeit zwischen den verschiedenen Quellen herstellen.

Beispiele hierfür sind:

2 Föderation à la ActivityPub

In einer Föderation einigen sich unabhängige Datenanbieter auf ein gemeinsames Austauschformat und bestimmen klar über die Lizenzierung der Daten, wie weit diese geteilt werden können. Auf diese Weise können Daten und ihre Herkunft stets eindeutig identifiziert und in domänenübergreifende Kontexte eingebettet werden.

Aus der Social Web Working Group (2014 - 2018) des World Wide Web Consortiums (W3C) enstanden Datenformate und Protokolle, welche den nahtlosen Austausch von Daten zwischen verschiedenen Plattformen ermöglichen. Hierbei wird auf HTTPS aufgesetzt und darüber kleine Nachrichten ausgetauscht, welche bekannt zu gebene Veränderungen beinhalten. Diese Datenaustauschweise ist in Form der Protokolle Activity Streams 2.0 sowie ActivityPub festgehalten.

Beispiele sind:

3 Social Linked Data (SoLiD)

Um freien Datenaustausch im World Wide Web zu gewährleisten, wird seit langer Zeit am sog. Semantic Web gearbeitet. Dieses bildet Daten in einem mathematischen Graphen ab, und macht diesen über einfache URLs zugänglich. Dieses Prinzip hat sich bereits in der Forschung etabliert, um große bestände heterogener Datensätze mit einander zu verknüpfen.

Bislang waren die hierfür verwandten Technologien nicht endanwender:innen:freundlich und auch für die Entwickler:innen eine Qual. Aus der oben bereits erwähnten Social Web WG beim W3C entstand jedoch auch eine leicht in Browsern und anderen verteilten Systemen einsetzbare Variante dieses Systems. Sie nennt sich Social Linked Data (SoLiD) und vereint die Vorteile gemeinsamer Auszeichnung von Daten, mit privater Vorhaltung dieser.

Beispiele:

Vokabularien in Erarbeitung

Alle Technologien welche das Datenformat des Semantic Webs teilen, verwenden das Resource Description Framework 1.1 (RDF), um Daten in weiterverwendbaren Formen wie JSON-LD oder Turtle auszutauschen. In der expliziten Auszeichnung der verwandten Begriffe im Datenmodell liegt auch die Stärke, welche diesen Ansatz für interoperable Anwendungen interessant macht.

Die hiermit gewonnene Semantik lässt es zu, dass Begriffsysteme, sog. Vokabularien oder Ontologien, formuliert werden, welche Daten nicht nur maschinen- sondern auch menschenlesbar machen. Die Open Knowledge Foundation betreibt auf lov.okfn.org eine Seite zu Linked Open Vocabularies und stellt dort dar, wie sich verschiedene dieser Vokabularien auf einander beziehen.

Des weiteren erarbeiten unabhängige Gruppen Vokabularien, welche die Beschreibung von wirtschaftlichen Prozessen oder Nahrungsmitteln ermöglichen. Diese werden im Folgenden kurz vorgestellt.

Data Food Consortium

Während wir den Ablauf der Wertschöpfungskette sehr gut verstehen, sind dafür verwandte Werkzeuge nicht dazu in der Lage diese Aspekte gut untereinander zu kommunizieren. Das Data Food Consortium sucht hierfür nach nützlichen Begriffen, welche sich in einer wiederverwendbaren Ontologie zusammenfassen lassen.

Value Flows

In der Annahme, dass sich wirtschaftliche Prozesse als Aktivität von Akteuren in einem Netzwerk aus Ereignissen beschreiben lassen, entwickelt die Value Flows Gruppe eine Ontologie, welche den Fluss von Resourcen abzubilden gedenkt. Hierfür werden ökonomische Akte klar von einander unterschieden und in Bezug zu anderen gestellt, um die individuelle Beteiligung von verschiedenen Produzent:innen und/oder Zulieferern nachzuzeichnen.

Lizenzierung und Open Data

“If it fits on a hard drive, it’s not big data.”

In einer Welt von vielen kleinen Datenproduzenten sprechen wir gerne von Small Data, d.h. kleinen, spezialisierten Informationsinseln, welche darauf warten mit der Welt in Kontakt gesetzt zu werden. Hierbei erkennen wir, dass nicht alle Daten öffentlich sein können, da im Wirtschaftsprozess auch personenbezogene Daten anfallen und verarbeitet werden.

Jegliche Information, welche nicht die persönlichen Lebensumstände einzelner betrifft, lässt sich ähnlich den oben erwähnten Vokabularien jedoch als Open Data auffassen. Hierfür verzichten wir auf unsere Urheberrechte und veröffentlichen Daten in die sog. “Public Domain” - ein Rechtskonstrukt aus den U.S.A. welches in Europa kein Äquivalent kennt. Bestenfalls können wir die Creative Commons “No Rights Reserved” Lizenz anwenden und somit alle Rechte an einem Datensatz aufgeben. Dieser kann dann als “Open Data” verstanden werden.

Auf globaler Ebene arbeitet das GODAN Konsortium an “Global Open Data for Agriculture and Nutrition” und freut sich stets über weitere Mitglieder:innen.


Quelle: Konzeptpapier zum aktuellen Stand der Diskussion um “Datenaustausch zwischen agroökologischer Software” aus Sicht von Ecobytes


Bio & regional goes digital, Folgeworkshop
Bio & regional goes digital, Folgeworkshop
#2

Antworten und Kommentare zu diesem Text können gerne hier weiter unten beigetragen werden.