Data Science ist nicht auf techniklastige Produktionsumgebungen beschränkt: Auch in der Landwirtschaft gibt es diverse Einsatzmöglichkeiten.

Bild: Pixabay, Skitterphoto

Daten in Melksystemen auswerten Was haben Kühe mit Data Science zu tun?

12.11.2018

Bei Automatisierung und Data Science denkt man schnell an hoch technisierte Produktionsumgebungen oder an Maschinenbau. Aber auch in der Landwirtschaft kann die intelligente Analyse und Nutzung von Daten enorme Mehrwerte zutage fördern – beispielsweise bei Milchkühen, wo Algorithmen dabei helfen, Infektionen vorherzusagen und Ansteckungen somit im Voraus zu vermeiden.

„Unser Kunde nutzt vollautomatische Melksysteme, auch Melkroboter genannt“, erzählt Katharina Kober, Data Scientist bei Connyun. „Die Kühe können sich frei im Stall bewegen und bei Bedarf in die Melkbox gehen. Das Ansetzen der Maschine an den Euter erfolgt ohne menschliche Beteiligung.“ Das sei zwar komfortabel für die Kühe und den Landwirt, habe aber einen Haken, so Kober. Denn „mögliche Eutererkrankungen wie die Mastitis werden nicht zeitnah durch den Landwirt erkannt.“

Tiere datenbasiert überwachen

Und das kann teuer werden, denn Eutererkrankungen beeinträchtigen nicht nur das Wohlbefinden der Kühe, sondern auch die Milchmenge und -qualität. Die Milch erkrankter Tiere weist eine erhöhte Zellzahl auf, was zu geringeren Milchpreisen durch die Molkereien führt. Laut Landwirtschaftskammer Oberösterreich beträgt der Verlust pro erkrankter Kuh über 600 Euro.

„Data Science erlaubt uns, die Überwachung der Tiere datenbasiert statt visuell durchzuführen“, schildert die Datenexpertin, „und schützt die Landwirte vor Verlusten.“ Der Auftrag lautete also: Einerseits sollen erkrankte Tiere frühzeitig erkannt werden, um Ansteckungen auf die ganze Herde zu vermeiden. Andererseits sollen möglichst wenige Fehlalarme ausgelöst werden.

Wertvolle Daten direkt aus der Milch

Zur frühzeitigen Erkennung von Euterentzündungen führen Sensoren am Melkroboter Messungen auf der Milch durch. Die Zellzahl – der wichtigste Indikator für eine Entzündung – lässt sich damit leider nicht direkt bestimmen. Messbar sind hingegen Milchtemperatur, Milchmenge oder die Leitfähigkeit der Milch. „Und hier kommt dann Data Science ins Spiel: Wir können mithilfe der gemessenen Daten die Zellzahl vorhersagen.“

Zur Analyse und Auswertung der Daten nutzen die Data-Science-Experten von Connyun das Klassifikationsverfahren Random Forest. Warum Klassifikation, das erläutert Katharina Kober: „Ein bekanntes Klassifikationsproblem ist beispielsweise der Spamfilter unserer E-Mail-Postfächer. Anhand der Wörter in E-Mails mit unbekanntem Absender unterscheiden Algorithmen die Klassen Spam und Nicht-Spam. Auch bei den Kühen haben wir es mit einem Klassifikationsproblem zu tun. Hier ist die Frage, ob die Daten von Milchtemperatur, Milchmenge und Leitfähigkeit auf eine erhöhte Zellzahl und damit auf eine Erkrankung hinweisen.“

Viele Entscheidungsbäume sind klüger als einer

Wie jeder Wald besteht auch ein Random Forest aus Bäumen, in diesem Fall aus Entscheidungsbäumen. „Entscheidungsbäume sind Algorithmen, mit denen wir Datenobjekte automatisch klassifizieren“, erklärt Kober. „Ein Entscheidungsbaum soll uns also sagen: Liegt diese Milchtemperatur vor und kommen diese Milchmenge und diese Leitfähigkeit hinzu, dann liegt die Zellzahl voraussichtlich in diesem Bereich.“

Ein Random Forest steigert die Präzision dieser Klassifikation. Statt nur einem Entscheidungsbaum kommt nämlich ein ganzer Wald zum Einsatz. Die Besonderheit sei, dass hier Machine Learning zum Einsatz komme, so Kober: „Die einzelnen Entscheidungsbäume im Random Forest wachsen. Sie variieren – dank der sogenannten Randomisierung – im Aufbau und sind nicht miteinander verbunden. Somit klassifiziert jeder Baum etwas anders.“ Die endgültige Klassifikation des Random Forests erfolge dann nach dem Prinzip der Schwarmintelligenz. Das bedeutet, dass der Random Forest die Entscheidung trifft, „die von den Bäumen am häufigsten geschätzt wurde.“

Schärfer als das menschliche Auge

Zurück zu den Kühen und zur Praxis. Im ersten Schritt bereinigt Connyun die gemessenen Daten. Mittels Outlier Detection werden verfälschte Werte, etwa durch Melkunterbrechungen oder falsch angesetzte Melkbecher, korrigiert oder entfernt. Danach wird auf diese Daten ein Random Forest Classifier angewendet, der den jeweiligen Melkungen eine Zellklasse zuordnet: je niedriger die Zellzahl, desto niedriger die Zellklasse.

Die Ergebnisse sind sehr aufschlussreich: „Mit Sensormessungen und Machine-Learning-Algorithmen erkennen wir Eutererkrankungen, bevor sie optisch sichtbar sind“, verdeutlicht Kober. „Ein Anstecken der kompletten Herde kann somit eher verhindert werden als bei der rein visuellen Überprüfung durch den Landwirt.“

Weitere Einsatzmöglichkeiten

Solche Verbesserungen und Automatisierungen ließen sich laut Kober in vielen Produktionsbereichen erzielen. Dazu müsse die Digitalisierung weiter vorangetrieben und die Data Science mit ihren Machine-Learning-Algorithmen vermehrt in der Praxis eingesetzt werden.

„Es ist wichtig, dass sich produzierende Unternehmen und Maschinenbauer verstärkt mit den Möglichkeiten von Data Science auseinandersetzen, denn das hier erwähnte Beispiel ist nur ein kleiner Ausschnitt von dem, was sich mit Daten erreichen lässt“, sagt Kober. „Wir können uns zum Beispiel sehr gut vorstellen, dass das hier vorgestellte Prinzip auch für die Vorhersage und die Überwachung bei der Qualitätskontrolle zum Einsatz kommen kann.“

Firmen zu diesem Artikel
Verwandte Artikel