Unsere Themen

Gartenbau 4.0 - Daten - Pflanzenschutz - Vernetzung - Digitalisierung

Die Anforderungen an die gartenbauliche Beratung und Praxis hinsichtlich des Pflanzenschutzes sind in den Jahren immer komplexer geworden. Dazu zählen neue Wirkstoffbewertungen und Zulassungsänderungen, eine hohe Anzahl an Sonderregelungen für einzelne gärtnerische Kulturen sowie die Berücksichtigung von Rückstandshöchstmengen.

Aktuelle und verlässliche Informationen sind aber für die fach- und umweltgerechte Ausbringung von Pflanzenschutzmitteln unerlässlich. Praktiker und Berater benötigen daher einen einfachen und schnellen Weg, um an die entscheidenden Informationen zu gelangen. Auch wenn Daten-Up- und Downloads mittlerweile Standards sind, müssen Teile der Daten in der Regel derzeit noch manuell aufbereitet und ausgewertet werden. Das benötigt Zeit und Ressourcen. 

Im innovativen Projekt HortiSem arbeiten die Projektpartner daran, Daten zum Pflanzenschutz mittels semantischer Technologien menschen- als auch maschinenlesbar automatisiert zur Verfügung zu stellen und somit einen direkten Informationsfluss für die Beratung und Produzenten zu schaffen. Die Herausforderung liegt in der Verbindung der "Insellösungen" hin zu einer "intelligenten Datenvernetzung" der Einzelinformationen. Um auch die Inhalte der Warndienstmeldungen zu integrieren muss eine Maschinenlesbarkeit der Texte gewährleistet sein. Damit das gelingen kann, muss eine „gemeinsame Sprache“ entwickelt und erlernt werden. 

 

Semantische Technologien nutzen

Semantische Technologien ermöglichen, Informationen nicht mehr nur miteinander über Verlinkungen zu verknüpfen, sondern auch die Bedeutung der Inhalte und Wörter zu verarbeiten. Das sogenannte "Semantische Web", das auch als Web-of-Data bezeichnet wird, ist eine Weiterentwicklung des World Wide Web, in dem nicht mehr nur Informationen miteinander über Verlinkungen verknüpft werden, sondern auch die Bedeutung der Inhalte und Wörter verarbeitet werden können. So können z.B. über semantische Annotation wie "Natural Language Processing" (NLP)  automatische Zuweisung von Metadaten erfolgen, um die natürliche Sprache maschinenlesbar zu machen. 

Die Verknüpfungen im Semantic Web sind insbesondere für Maschinen lesbar und dienen dem Austausch von maschinenlesbaren verknüpften Daten im Web. Die Technologie soll den Zugang zu den für die Branche relevanten Pflanzenschutz-Informationen erleichtern und beschleunigen. Diese beinhaltet z.B. aktuelle Zulassungsdaten, Rückstandshöchstgehalte, Wirkstoffparameter und Texte aus Warndiensten. Durch semantische Technologien ist es möglich, Dienste aufzusetzen, die selbstständig über Daten „reflektieren“ können und sich selbst aufbauen, ohne dass spezifische Schnittstellen programmiert werden müssen.

 

Die "intelligente Datenvernetzung": Ein Knowledge Graph (dt. "Wissensgraph")

Ein Knowledge Graph („Wissensgraph“) ist ein maschinenlesbares Datenmodell. In einem Knowledge Graph werden Informationen so aufgearbeitet, das aus diesen Informationen Wissen entsteht. Dafür werden sogenannte Enitäten (Identitäten eines konkreten Gegenstandes) beschrieben. Sie sind eindeutig identifizierbar und damit einzigartig. 

Formalisierung des Wissens ("Ontologie")

Um einen "Wissensgraphen" erstellen zu können, müssen die Dateninhalte und ihre Zusammenhänge aus dem Wissensgebiet „Pflanzenschutz im Gartenbau“ formalisiert werden. In der Informatik wird der Prozess auch als „Ontologie“ bezeichnet. Für die Formalisierung des Wissens müssen die Daten strukturiert sein. Jeder Datensatz besteht aus 3 Teilen: Er bildet also ein Tripel aus Subjekt, Prädikat und Objekt. In einer Tabelle würde diese Struktur dem Zeilennamen (Subjekt), dem Spaltennamen (Prädikat) und dem Zelleninhalt (Objekt) entsprechen. In einem Wissensgraph sind die Subjekte die Punkte und die Prädikate die Striche. Die Objekte sind wie die Subjekte ebenfalls Punkte und können in einem "Triple" wieder zu einem Subjekt werden. In Form von Knoten werden sie über Kanten in Beziehung zueinander gestellt, mit Attributen versehen und in einen thematischen Kontext gebracht. 

Mit dieser Technik kann beispielsweise von einer Kulturart ausgehend gleichzeitig auf die Pflanzenfamilie, mögliche Schaderreger und passende Dünge- und Pflanzenschutzmittel zugegriffen werden. Zum Beispiel wurden die Gartenbau-Kulturen dem multilingualen Thesaurus AGROVOC der Welternährungsorganisation (FAO) zugeordnet. Damit sind Übersetzungen der Bezeichner und Verknüpfungen zu wiederum weiteren internationalen Thesauri und Ontologien zugänglich. 

Technisch gesehen liegen die Daten des Knowledge Graph in einem “Ressource Description Framework (RDF)” Format auf speziellen Datenbanken (Triplestores) bereit. Ein "Resource Description Framework (RDF)" ist eine Spezifikation des World Wide Web Consortium (W3C). Verwendung finden außerdem Mapping-Tools wie db2triples und SPARQL, eine standardisierte Abfragesprache für das Semantic Web. Um den Wissensgraph zu erweitern, können neue Daten u. a. unter Verwendung von “Named Entity Recognition (NER)” (Eigennamenerkennung) hinzugefügt werden. 

Natural Language Processing (NLP)

Natural Language Processing (NLP) ist ein Teilgebiet der Computerlinguistik, das sich mit der automatischen Verarbeitung natürlicher Sprache befasst. Ein Teilbereich ist die "Eigennamenerkennung" mittels "Named-Entity-Recognition" (NER). Mit dieser Technik können die für das Projekt relevanten Informationen aus Texten extrahiert werden.

Im HortiSem-Projekt hat das JKI-Team in enger Zusammenarbeit mit dem KTBL-Team die Grundlagen für die semantische Annotation "Named-Entity-Recognition" (NER) erarbeitet. Dazu wurde ein Modell programmiert, das im ersten Schritt den Text aus einem pdf-Dokument extrahiert, anschließend analysiert und zum Schluss die gefundenen Eigennamen kategorisiert. Für das HortiSem-Projekt werden Informationen wie Kultur, Schaderreger, Pflanzenschutzmittel, BBCH-Stadium, Regionen, Zeitpunkt sowie die beschreibenden Bilder mittels Named-Entity-Recognition (NER) aus den Beratungstexten extrahiert. Das NER-Modell “lernt” anhand annotierter Trainingsdaten bestimmte Begriffe in Texten zu finden. Auf diese Weise können auch Begriffe gefunden werden, die nicht Teil der Trainingsdaten waren. Zusätzlich wurde das Modell mit einer Muster-Liste von Begriffen erweitert, die aus kontrollierten Daten aus dem Projektverbund bestehen und damit automatisch vom Modell gefunden werden. Konkret handelt es sich also um einen Prozess, der regelbasierte Methoden mit maschinellem Lernen kombiniert.

Beispiel NLP Verfahren: Ein Kurzvideo (MP4) von Jascha Daniló Jung (KTBL) und Xia He (JKI) finden Sie auf hortigate: https://www.hortigate.de/publikation/93385/ (Länge: 4:43 min)

Linked-Open-Data

Im HortiSem-Projekt soll für die Verknüpfung der Einzelinformationen die Linked-Open-Data Technologie (LOD) zum Einsatz kommen. Sie bietet die Möglichkeit, große heterogene Datenbestände aus verteilten Quellen effizient zu nutzen, zu integrieren und zu erweitern. Einzeldatensätze bleiben auffindbar und können einheitlich abgefragt werden. Dateninhalte werden gemeinsam mit einer maschinenlesbaren Beschreibung ihrer Zusammenhänge in Form von "Ontologien" bereitgestellt. Mittels der Linked-Open-Data Technologie soll ermöglicht werden, die Daten aus unterschiedlichen Datenquellen wie PS Info, BVL, Pesticides Properties Database, EU Pesticides Database oder EPPO einheitlich abzufragen.

 

Welche Ergebnisse gibt es?

Im HortiSem-Projekt wurden die Informationen aus PS Info, der BVL-Datenbank, der EU Pesticide Database und aus den Warndiensten als Knowledge Graph aufbereitet und mit anderen Datenquellen verknüpft. 

API "destreak"

Für eine einfachere Benutzung des Knowledge Graphen hat das KTBL zusätzlich die Programmierschnittstelle (application programming interface, kurz API) “destreak” entwickelt. Über diese API können Abfragen in eigene Webanwendungen eingefügt werden. Bitte beachten Sie: Dieses Tool befindet sich in der Testphase: https://daten.ktbl.de/destreak/docs#/napi.json 

JSON-API: hortigate

Um den Datentransfer von hortigate zum Knowledge Graphen zu vereinfachen, wurde eine JSON-Schnittstelle programmiert, durch die ausgewählte Inhalte gezielt abgerufen und anschließend ausgewertet werden können.

Das gleiche Prinzip wird auch verwendet, um in PS Info passende Warn- und Hinweisdienste der gartenbaulichen Beratung in den Ergebnislisten der Pflanzenschutzmittelsuche anzuzeigen. Siehe auch PS Info Meldung vom 13.02.2023

Diese Technik wird auch im Vernetzungs- und Transfervorhaben "HortiCo 4.0" im Blickpunkt "Gartenbau 4.0" umgesetzt: https://www.hortico40.de/blickpunkt/ 

Wenn Sie Interesse an der API haben, melden Sie sich bitte bei Frau Winter per eMail über Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein! oder telefonisch unter der Nummer +49 (0) 30 200065-202

JSON-API: PS Info

Für den Datentransfer zwischen PS Info und dem Knowledge Graphen hat das DLR Rheinpfalz ebenfalls eine JSON-Schnittstelle programmiert, die intern von den Projektbeteiligten verwendet wird. Eine Öffnung dieses Teilergebnisses ist aktuell noch nicht möglich, da noch rechtliche Fragen zur Datenhoheit geklärt werden müssen. Sobald eine Verwendung außerhalb des Projektes möglich wird, wird auf PS Info und an dieser Stelle darüber informiert.

PS Info-Datenblätter und Suchmasken

Die EU-Rückstandshöchstgehalte (MRLs) können durch die Standardisierung, d.h. die Übernahme der EU-Codes ("Active Substance" + "Food Products"), nicht nur über den Knowledge Graph abgerufen werden, sondern liegen auch in den Indikationsdatenblättern von PS Info bereit. Da diese Information noch von dem HortiSem-Fachausschuss validiert wird (Stimmen die Zuordnungen und Werte?), ist diese Information aktuell nur für die Pflanzenschutzberatung einsehbar (Login notwendig). Zukünftig sollen diese Informationen frei verfügbar werden. 

Die Anzeige der Datenherkunft war ein zusätzliches Thema im Projekt. Dazu wurden in PS Info sogenannte "Backlinks" eingeführt, die einen direkten Zugriff auf die Ursprungsdaten gewähren. Im Zusammenhang mit den MRLs und der Einführung der EU-Codes ist auch eine direkte Verlinkung auf die Wirkstoffdatenblätter ("Active Substance") möglich. Diese Verlinkung steht in den Datenblätter der Pflanzenschutzmittel im Bereich "Wirkstoffe" und in der Tabelle der "Rückstandshöchstgehalte" zur Verfügung. Im Bereich der Pflanzenschutzmittelzulassungen wurden Backlinks für die BVL-Datenbank realisiert. Die Links in den Datenblättern führen direkt auf die ursprüngliche Informationsquelle (Zulassungsdatenbank und Notfallsituationen). Siehe auch PS Info Meldung vom 07.02.2023

Durch die Formalisierung der Kultur- und Schaderregerkataloge können in PS Info nicht nur die Namen sondern auch die BVL- und EPPO-Codes in den Suchmasken verarbeitet werden. Beim Überfahren mit der Mouse werden die Codes im System angezeigt. Im ersten Schritt wurde die Übergabe in den externen Verlinkungen realisiert. Eine Anleitung zur Verwendung der Links und der Codes finden Sie in dem PS Info-Handbuch (pdf). Mit einer internen System-Umstellung sollen diese Codes zukünftig auch in den allgemeinen Suchmasken verwendet werden (voraussichtlich ab November/Dezember 2023). Siehe auch PS Info Meldung vom 24.02.2023

Um den Informationsfluss in andere Datenbanken zu vereinfachen konnten zudem die Formalisierungen der EPPO-Codes und der Codes der Pesticides Properties Database (PPDB & BPDB) genutzt werden. Diese direkten Verlinkungen stehen ebenfalls in den Datenblättern der Pflanzenschutzmittel und der Nützlinge bereit. Als zusätzliche Information für den ökologischen Anbau ist eine Verbindung zwischen der FiBL-Betriebsmittelliste und PS Info installiert worden. Ist ein Pflanzenschutzmittel auch in der Betriebsmittelliste gelistet, führt ein Link aus PS Info direkt zu den FiBL-Informationen. Siehe auch PS Info Meldung vom 07.02.2023

NER-Modell

Mit dem NER-Modell werden die Warndienstmeldungen der Bundesländer ausgewertet und im Knowledge Graphen abgelegt. Von dort können mit einer speziellen Abfragesprache (SPARQL) semantische Daten abgerufen werden. Damit sind auch komplizierte Abfragen möglich, die Pflanzenschutzmittel, Erreger und Kulturen betreffen. Das Julius Kühn-Institut stellt die eigenen Entwicklungen kostenfrei zum Testen zur Verfügung: https://sf.julius-kuehn.de/hortisem/docs#/

Vernetzungs- und Nutzungsmöglichkeiten

Die Vernetzungs- und Nutzungsmöglichkeit der HortiSem-Entwicklungen kann anhand des NER-Modells dargestellt werden. Bei der Beziehungsextraktion mittels NER werden die Daten auf sogenannten Triplestores oder RDF-Stores (z.B. Fuseki) abgespeichert. Hier liegen nicht nur die durchsuchten Texte selbst, sondern die Metainformationen des Textes (u.a. Titel, Veröffentlichungsdatum, Hyperlink ...) sowie die dazu gefundenen Entitäten im RDF-Format. Gefundene Entitäten können automatisch mit vorhandenen Daten im Knowledge Graphen abgeglichen werden und mit entsprechenden Verlinkungen zu diesem hinzugefügt werden. 

Eine Vernetzungsmöglichkeit am Beispiel der Warndienste aus hortigate: Für hortigate-Dokumente (www.hortigate.de) wurde ein "Crawler" programmiert, welcher automatisch Dokumente herunterladen und annotieren kann. Die Ergebnisse der Annotation werden mit dem Knowledge Graphen abgeglichen und mit den entsprechenden Verlinkungen im RDF-Format gespeichert. Anschließend werden sie in einem Triplestore hochgeladen (lokal oder öffentlich). Die Daten in den Triplestores können per SPARQL-Query abgerufen werden. Verschiedene RDF-Stores können miteinander vernetzt werden. Wenn dies nicht gewünscht ist, können die Ergebnisse auch nur auf lokalen Servern gespeichert und verwendet werden. 

Eine Nutzungsmöglichkeit für Content-Management-Systeme: Das NER-Modell kann als Hilfe für Autoren eingesetzt werden, um Vorschläge für Schlagworte aus Texten zu generieren. Eine solche Anwendung wird gerade für ISIP (www.isip.de) implementiert und validiert. Eine weitere denkbare Verwendungsmöglichkeit könnte sein, Texte auf bestimmte Fragestellungen hin zu untersuchen: Beispielsweise das Auftreten von Schaderregern zu einem bestimmten Zeitpunkt im Jahr oder über mehrere Jahre hinweg. Als Beispiel Schaderreger in Winterraps: https://public.flourish.studio/visualisation/5529785/

  

Ist das was für die Praxis?

Durch HortiSem werden Praxis und Beratung künftig einfacher und schneller zu den Informationen gelangen, die für den Pflanzenschutz im Gartenbau notwendig sind. Da insbesondere die Produzenten und die Beratung von den stetig steigenden Anforderungen im Pflanzenschutz betroffen sind, steht der Nutzen der Projektergebnisse für die breite Praxis im Vordergrund.

Mit Projektstart wurde ein Fachausschuss mit Experten und Expertinnen aus der gartenbaulichen Beratung eingesetzt, der beratend und testend alle Entwicklungen begleitet.
Eine Anaylse des Praxisbedarfs zeigte im Ergebnis, dass die Einbindung der Rückstandshöchstgehalte aus der EU Pesticides Database, Informationen zu speziellen Wirkstoffparametern (z.B. Wasserlöslichkeit, Abbauverhalten im Boden und Wasser) aus der Pesticides Properties Database (PPDB) und auch die direkte Verbindung zu Warndienstmeldungen für die Beratung und Praxis von großem Nutzen sind. Erste Schritte für die Datenverknüpfung wurden beispielsweise in PS Info umgesetzt und sind bereits für jeden abrufbar.

Mit dem vom JKI entwickelten NER-Modell können Eigennamen in Texten identifiziert und klassifiziert werden. Dadurch können relevante Informationen aus einer Vielzahl von Texten extrahiert werden. Dieses Modell soll als Webanwendung für die Aufbereitung verschiedenster Texte (z.B. zur automatischen Verschlagwortung) zur Verfügung stehen.

Die Daten aus all den unterschiedlichen Quellen werden vom KTBL in definierte Datensätze strukturiert und in einen Knowledge Graphen eingebunden. Durch die Verknüpfung der Informationen entsteht eine neue Wissensdatenbank. Mit Hilfe eines eigens dafür programmierten Webservices können die Informationen aus verschiedenen Quellen zentral abgefragt werden.

 

Projektförderung

Die Projektförderung von HortiSem unterlag der Förderung von Innovationen für einen Gartenbau 4.0 im Rahmen des Programms zur Innovationsförderung des Bundesministeriums für Ernährung und Landwirtschaft (BMEL). HortiSem wurde als Forschungs- und Entwicklungsvorhaben (FuE) am 15. Dezember 2019 mit einer dreijährigen Laufzeit bis zum 14.12.2022 bewilligt. Es folgte eine kostenneutrale Verlängerung bis zum 31.05.2023. 

Die Fördermaßnahme Gartenbau 4.0 wird durch ein eigenständiges Vernetzungs- und Transfervorhaben (VuT) "HortiCo 4.0" begleitet. HortiCo 4.0 nimmt organisatorische, fachliche und öffentlichkeitswirksame Aufgaben wahr. Eine Übersicht aller geförderten Innovationsprojekte finden Sie auf der Internet-Seite von HortiCo 4.0 (www.hortico40.de).