Unter Computer Vision wird die Verarbeitung und Analyse von Bildern verstanden, um Aufgaben wie die Lokalisierung oder Klassifizierung von Objekten in Bildern zu bewältigen. Ein Bereich, in dem KI bereits in zahlreichen Studien und Vergleichstests die menschliche Leistungsfähigkeit übertreffen konnte. Die Abteilung Waldnutzung an der Forstlichen Versuchs- und Forschungsanstalt Baden-Württemberg (FVA) nutzt die Technologie unter anderem in der angewandten Holzforschung und dabei insbesondere für die Analyse innerer Holzstrukturen mit Hilfe computertomografischer Aufnahmen zur Qualitäts- und Festigkeitsvorhersage.
KI trifft CT
Traditionelle Bildverarbeitungsalgorithmen sind für gewisse Baumarten bereits in der Lage, beispielsweise die Markröhre oder Äste in Aufnahmen eines Computertomografen (CT) mit einer hohen Genauigkeit zu detektieren. Schwierigkeiten treten in Bereichen auf, in denen die Dichteunterschiede der Holzstrukturen und damit die Kontraste in den CT-Aufnahmen gering sind oder die Merkmalsausprägung stark variiert. Beispiele hierfür sind die Asterkennung im Splintholz von Nadelholz oder die Asterkennung in Laubholzarten wie Buche oder Eiche.
In diesen Fällen stoßen traditionelle, regelbasierte Algorithmen an ihre Grenzen. KI-basierte Modelle sind dagegen oft in der Lage, auch hier Muster zu erkennen. So können sie die gewünschten Merkmale korrekt lokalisieren oder segmentieren. Um dies zu erreichen, verwendet die Abteilung Waldnutzung sogenannte Convolutional Neural Networks (siehe Infobox), die über überwachtes maschinelles Lernen trainiert werden.
Convolutional Neural Networks (CNN) bestehen aus mehreren Schichten, die spezielle Funktionen erfüllen. Der Name der CNN lässt sich auf die sogenannten Convolutional-Layer zurückführen. In jedem Convolutional-Layer werden Filter in Form von Faltungen (Convolutions) auf die Bilder angewendet, die verschiedene Strukturen und Muster erkennen können. In den ersten Schichten können dies zum Beispiel Linien und Kanten sein, in tieferen Schichten dann immer komplexere Formen und Strukturen. Um die gewünschten Merkmale erkennen zu können, wird das Netzwerk mit Hilfe eines großen Datensatzes an Aufnahmen trainiert. In vielen Fällen sind dies Aufnahmen, in denen die entsprechenden Merkmale von Wissenschaftlerinnen und Wissenschaftlern markiert worden sind, so dass das Netzwerk nach und nach lernt, die Filter in den verschiedenen Schichten so anzupassen, dass die gewünschten Merkmale erkannt werden können.
Anlernen mit großen Datensätzen
Eine große Schwierigkeit beim maschinellen Lernen besteht darin, geeignete Datensätze für das Training der Netzwerke zu erstellen, da die Datensätze je nach Komplexität der Aufgabe sehr groß sein müssen. Um beispielsweise den Datensatz für das Training des Netzwerks für die Asterkennung bei der Buche zu erstellen, wurden über 100 Stammabschnitte mit dem CT gescannt und tausende von Ästen manuell am Computer in den CT-Aufnahmen markiert.
Bei der Eiche gestaltet sich die Erstellung des Referenzdatensatzes noch aufwändiger: Bisher wurden in Scans von acht Stammabschnitten über 2.000 Merkmale manuell erfasst. Die bisherigen Ergebnisse zeigen jedoch, dass sowohl für die Asterkennung bei der Buche als auch bei der Eiche eine deutliche Vergrößerung der Datensätze notwendig ist, um die gewünschte Genauigkeit zu erreichen. Gleichzeitig sind die bereits erzielten Ergebnisse sehr vielversprechend und zeigen, was für ein riesiges Potenzial in der Verwendung von KI liegt
Rückverfolgung: Fotos statt Markierung
Auch in anderen Arbeitsbereichen kommt zunehmend KI und insbesondere Computer Vision zum Einsatz. Das 2023 abgeschlossene Verbundprojekt Digitaler Fingerabdruck: Markierungsfreie Rückverfolgung vom gefällten Baumstamm bis ins Sägewerk an der FVA hatte zum Ziel, ein Rückverfolgungssystem für Rundholz entlang der Wertschöpfungskette von der Holzernte bis zur holzverarbeitenden Industrie zu entwickeln. Dieses soll eine nachhaltigere und gleichzeitig effizientere Holznutzung ermöglichen. Das Besondere: Der Prozess sollte markierungsfrei möglich sein. Dafür wurden mit in den Produktionsablauf integrierten Kamerasystemen am Vollernter, am Polter und im Sägewerk jeweils Fotoaufnahmen derselben Stirnfläche der Stammabschnitte aufgenommen.
Die Identifikation eines Stammabschnitts erfolgte durch eine automatisierte Analyse eines Ausschnitts der Stirnfläche um die Markröhre. Hierzu wurde in zwei Schritten maschinelles Lernen eingesetzt: Im ersten Schritt wurde die Markröhre über ein CNN detektiert, um einen Referenzpunkt zur Ausrichtung und zur korrekten Wahl des Stirnflächenausschnitts zu erhalten. Dazu wurde das Netzwerk mit etwa 2.000 Fotos von Stammquerschnitten aus dem Sägewerk sowie mit etwa 5.000 Fotos, die am Vollernterkopf und an Poltern aufgenommen wurden, trainiert. Für die Aufnahmen am Vollernter und Polter waren die Ergebnisse der Markröhrendetektion bereits sehr gut, für die Aufnahmen aus dem Sägewerk konnte die gewünschte Genauigkeit noch nicht zuverlässig erreicht werden.
Nach der korrekten Wahl des Bildausschnitts wurde im zweiten Schritt vom Fraunhofer-Institut für Physikalische Messtechnik (IPM) in Freiburg unter Mitarbeit der FVA ein weiteres CNN trainiert, das die zehn am wahrscheinlichsten passenden Stirnflächen auswählt. Aus diesen zehn Stirnflächen wiederum wird mit Hilfe eines vom IPM entwickelten traditionellen Bildverarbeitungsalgorithmus die gesuchte Stirnfläche identifiziert.
Bei einem Test des Systems konnten bis auf eine Stirnfläche alle korrekt zugeordnet werden. Eine Falschzuordnung fand nicht statt. Aufgrund des hohen Aufwands bei der Datengewinnung konnten für das Training des CNN im Rahmen des Projekts nur ca. 500 Stirnflächen genutzt und der Algorithmus nur an 65 Stirnflächen getestet werden. Trotz des kleinen Trainingsdatensatzes identifizierte allein das CNN bereits etwa 88 Prozent der korrekten Stirnflächen als die wahrscheinlichste Stirnfläche. Aufgrund dieser sehr guten und vielversprechenden Ergebnisse ist geplant, den Datensatz in einem Folgeprojekt bedeutend zu erweitern, um das CNN zu verbessern und die Technologie an einem größeren Datensatz zu testen.
Ausblick
Neben den erwähnten Anwendungen zeichnet sich auch in der Vermessung und Sortierung ab, dass KI-gestützte Computer Vision eine immer größere Rolle spielen wird: zum Beispiel zur Poltervermessung, zur automatischen Erkennung von einzelnen Stämmen in Fotoaufnahmen von Poltern oder zur Ermittlung der Rindenstärke mit Hilfe von CT-Aufnahmen. Darüber hinaus werden KI-Methoden auch vermehrt für die Datenanalyse und Modellierung verwendet. Je weiter die Digitalisierung der Forst- und Holzbranche voranschreitet und je mehr Daten zur Verfügung stehen, desto mehr Anwendungsmöglichkeiten wird es in Zukunft für KI geben, was zu ganz neuen Möglichkeiten und herausfordernden Forschungsprojekten führen wird.