Aleatorische Funktionsabsicherung Wenn Autosysteme sich gegenseitig stören

Bei der Rückwärtsfahrt kann es zu unerwünschten Querwirkungen, wie einem Hinweis auf niedrigen Akkustand, kommen.

Bild: ASAP
08.06.2020

Für komplexe Systemfunktionen auf Basis des Reinforcement Learning müssen neue Absicherungsmethoden entwickelt werden. Dazu zählt etwa die aleatorische Funktionsabsicherung. Sie begegnet der überproportionalen Zunahme der Vielfältigkeit und Komplexität von Fahrzeugfunktionen und den daraus resultierenden Herausforderungen bei ihrer Validierung.

Durch den Einsatz Künstlicher Intelligenz lassen sich auch komplexe Wirkketten mit Querwirkungen diverser Steuergeräte umfassend und zeitsparend validieren. Dabei suchen selbstlernende Algorithmen gezielt nach kritischen Stimulationen, die zu Fehlern in der Wirkkette führen.

Auf diese Weise ermöglicht die aleatorische Funktionsabsicherung eine Absicherung über eine Vielzahl von Parameter- und Stimulationsräumen – unter anderem ein wichtiger Schritt in Richtung autonomes Fahren. Die Effizienz- und Qualitätssteigerung in der Funktionsabsicherung durch die neue selbstlernende Methode wird im Folgenden am Beispiel der Absicherung von Rückfahrsystemen deutlich.

Anforderungen an künftige Rückfahrkameras

Das US-Gesetz FMVSS111 beschäftigt aktuell Automobilhersteller und deren Entwicklungspartner. Es schreibt eine Rückfahrkamera bei allen ab Mai 2018 in den USA verkauften Pkw vor. Wesentlich dabei: Das Bild der Rückfahrkamera muss spätestens zwei Sekunden nach Einlegen des Rückwärtsgangs angezeigt und zu keinem Zeitpunkt durch andere Anzeigen überlagert werden.

Die Absicherung von Rückfahrsystemen im Hinblick auf die neuen Vorgaben birgt viele Herausforderungen, da es sich bei dem Assistenzsystem um eine komplexe Wirkkette mit zahlreichen Querwirkungen handelt. Um sicherzustellen, dass das Bild der Rückfahrkamera immer gesetzeskonform angezeigt wird, müssen unzählige Signale und deren Auswirkungen auf das Gesamtsystem überprüft werden. Beispiele für unerwünschte Querwirkungen sind die Anzeige einer Unwetterwarnung während der Rückwärtsfahrt oder eines Hinweises, dass der Akkustand des verbundenen Handys gering ist.

Mit der Entwicklung einer neuen Absicherungsmethode auf Basis des Reinforcement Learning, der aleatorischen Funktionsabsicherung, bietet ASAP stets eine passende Lösung. Durch die Methode lassen sich Funktionen in weitaus höherer Vielfalt und gleichzeitig gezielter absichern als mit herkömmlichen Verfahren.

Aleatorische Methode verringert Testaufwand

Der kontinuierlich steigenden Vielfalt und Komplexität von Funktionen wird in der Absicherung bisher mit manuellen Tests sowie dem Einsatz von Testautomatisierungen begegnet. Bei Testfahrten etwa werden in zufälliger Reihenfolge Kundenfunktionen ausgeführt und Fehler aufgezeichnet. Gerade bei komplexen Wirkketten mit mehreren Steuergeräten im Verbund sind manuelle Erprobungen oder die Validierung mit Testautomatisierungen alleine nicht ausreichend, da sie zu zeitaufwendig und entsprechend kostspielig sind und die nötige Testtiefe fehlt.

ASAP hat deshalb die Methode der aleatorischen Funktionsabsicherung entwickelt, die bereits vor der Erprobung im Fahrzeug ansetzt und eine Lösung für die Herausforderungen der Absicherung bietet. Durch den Einsatz Künstlicher Intelligenz und das Testen an Closed-Loop-Prüfstanden lassen sich komplexe Wirkketten mit Querwirkungen diverser Steuergeräte umfassend und zeitsparend validieren. Nicht nur ermöglicht die aleatorische Funktionsabsicherung demnach die Integration von Funktionen im Fahrzeug, die von vornherein besser abgesichert sind – gleichzeitig wird so der Bedarf an Testfahrten und -szenarien mit Prototypen auf diese Weise erheblich minimiert.

Die Vorteile der selbstlernenden Methode sind vielfältig. Im Gegensatz zum anforderungsbasierten Testen müssen bei der aleatorischen Funktionsabsicherung vor Validierungsbeginn keine Testspezifikationen festgelegt werden; der Entwicklungsprozess wird somit beschleunigt. Außerdem ist die aleatorische Funktionsabsicherung nicht auf manuelle Eingaben angewiesen und kann folglich rund um die Uhr kostengünstig eingesetzt werden.

Ein weiterer wichtiger Punkt ist, dass die gelernten Zusammenhänge und Fehlerquellen für alle zukünftigen Absicherungen zur Verfügung stehen. Dieser Punkt unterscheidet sich grundsätzlich vom manuellen Testen, bei dem jeder Tester nur auf seinen persönlichen Erfahrungsschatz zugreifen kann.

Ein weiterer Vorteil ist die automatische Generierung einer Datenbank, in der alle Ergebnisse dokumentiert werden. Besonders hervorzuheben ist zudem, dass Entscheidungen auf Basis von objektiven Kriterien getroffen werden – dadurch erhöht sich die Testtiefe und somit der Validierungsgrad der getesteten Software.

Absicherung komplexer Wirkketten

Angefangen vom Gangwahlschalter über Motorsteuergeräte und Head Unit bis hin zum Kamerasystem sind eine Vielzahl von Steuergeräten Teil einer Wirkkette. Aus diesem Steuergeräteverbund ergeben sich zahlreiche Querwirkungen. So können beispielsweise Pop-ups zu Einstellungen oder Sicherheitsmeldungen das Bild der Rückfahrkamera überlagern. Im schlimmsten Fall könnte das Kamerabild durch Steuergerätefehler sogar ganz ausfallen.

Die Ursachen für Fehler können verschiedenste Eingabe-Kombinationen oder kritische Zustände von Steuergeräten sein. Da es unmöglich ist, alle Eingabe-Kombinationen mit unterschiedlichen Wartezeiten zu testen, setzt die aleatorische Funktionsabsicherung auf das Testen intelligent ausgewählter Stichproben.

Dabei geht sie folgendermaßen vor: Zunächst werden Randbedingungen, Erwartungswerte und Stimulationsräume definiert. Unter Randbedingungen versteht man beispielsweise die gesetzlichen Vorgaben, dass der Fahrer das Bild auf eigenen Wunsch deaktivieren kann oder dass bei geöffnetem Kofferraum kein Bild der Rückfahrkamera angezeigt wird, da sich die Kamera typischerweise in der Kofferraumabdeckung befindet. Der Erwartungswert beschreibt, welcher Zustand nach der Stimulation mit Eingabekombinationen eintreten soll, und die Stimulationsräume legen fest, welche Eingaben zulässig sind.

Anschließend werden mithilfe von Mustererkennungsverfahren gezielt Stichproben aus den verschiedenen Eingabekombinationen bestimmt. Dabei wird ein selbstlernender Algorithmus – das Reinforcement Learning – verwendet. Der Algorithmus funktioniert wie folgt: Kontinuierlich werden Aktionen ausgeführt, die den Zustand der Umwelt, also des Steuergeräteverbunds, verändern. Falls nach einer Aktion nicht der Erwartungswert eintritt, erhält der Algorithmus eine Belohnung für seine durchgeführten Aktionen. Dadurch wird der Algorithmus darauf konditioniert, innerhalb des Stimulationsraums nach Abweichungen vom Erwartungswert zu suchen.

Wirkungsweise des Reinforcement Learning

Das Reinforcement Learning basiert auf der Annahme, dass für den aktuellen Zeitpunkt t die Belohnung rt vom aktuellen Zustand st sowie von der Aktion at abhängt. Dabei sind die Lernrate α und der Diskontierungsfaktor γ frei wählbare Parameter, die je nach Problemstellung und Anforderungen bestimmt werden müssen.

Prinzipiell gibt es einen Zusammenhang zwischen der Lernrate α E [0,1] und der Umgebung. Für deterministische Umgebungen ist die optimale Lernrate α = 1, da jeder gelernte Zusammenhang auch in Zukunft Gültigkeit hat. Je unberechenbarer die Umgebung ist, desto kleiner sollte α gewählt werden, um nur die wichtigsten Zusammenhänge zu lernen und seltenen Ereignissen nicht zu viel Gewicht zu verleihen.

Gleichzeitig sollte der Diskontierungsfaktor γ E [0,1] an die Dauer des Testlaufs angepasst werden. Grundsätzlich gilt: je kürzer der Testlauf, desto kleiner der Parameter γ. Der Grund dafür ist, dass für kleine Werte γ verstärkt an problematischen Stellen gesucht wird, während große Werte für γ dazu führen, dass der Suchraum umfassender durchsucht wird. Zusammenfassend ergibt sich folgende Q-Funktion, die die erwartete Belohnung Q einer Aktion a im Zustand s beschreibt:

Q(st,a t) = (1-α) x Q(st,a t) + α(rt + γ max Q(st+1,a))

Durch die formale Beschreibung des Lernproblems kann gezielt nach Fehlern gesucht werden, selbst wenn der Suchraum sehr groß ist. Dabei ist es möglich, die Parameter α und γ während der Laufzeit des Systems zu verändern, um die Fehlersuche weiter zu optimieren.

Die Testumgebung der aleatorischen Funktionsabsicherung

Die aleatorische Funktionsabsicherung benötigt einen Closed-Loop-Prüfstand an dem alle relevanten Stimuli automatisiert ausgeführt werden können. Unter Closed-Loop-Prüfstand versteht man die Eigenschaft, dass der real verbaute Steuergeräteverbund und die simulierte Umgebung sich gegenseitig beeinflussen. Beschleunigen die beteiligten Steuergeräte den Prüfstand virtuell auf eine bestimmte Geschwindigkeit, muss die simulierte Umgebung sich dementsprechend verändern und Rückmeldung über Steigungswinkel der Straße, Gegenwind und weitere Details an die entsprechenden Steuergeräte und Sensoren geben.

Zudem muss die zu validierende Funktion in dem System ein eindeutiges Ergebnis haben. Insbesondere bei der Auswertung von verschiedenen Kundenfunktionen werden typischerweise Algorithmen aus der technischen Bildverarbeitung und des maschinellen Lernens eingesetzt.

Wegbereiter für autonomes Fahren

Die Absicherung von Fahrfunktionen für autonomes Fahren stellt die Automobilindustrie vor neue Herausforderungen. Als Faustregel gilt: Mindestens eine Million Testkilometer sollten mit autonomen Fahrfunktionen zurückgelegt werden, bevor eine Freigabe erteilt werden kann. Die von ASAP entwickelte Methode der aleatorischen Funktionsabsicherung unterstützt dabei aktiv den Entwicklungsprozess. Mit ihr lassen sich in jeder einzelnen Entwicklungsstufe automatisierte, realitätsnahe Tests ausführen und mögliche Fehler, die oft nicht gleich ersichtlich sind, finden. Durch das gezielte und systematische Suchen nach systemrelevanten Fehlern bekommt der Funktionsentwickler innerhalb kürzester Zeit ein Feedback zum aktuellen Entwicklungsstand des Gesamtsystems.

Ein Beispiel für eine Funktion des autonomen Fahrens ist etwa die Personenerkennung. Eine vollständige Spezifizierung zur Absicherung ist dabei nicht möglich, da es unendlich viele Situationen gibt, in denen Personen erkannt werden müssen. Eine Auswahl an Parametern, die sich ändern können und trotzdem zu einer fehlerfreien Erkennung der Person führen müssen, sind:

  • Größe

  • Bekleidung

  • Gehgeschwindigkeit der Person

  • Winkel zwischen Person und Auto

  • Lichtverhältnisse

  • Wetter

  • Straßenbelag

  • Objekte wie Bäume und Schilder

Alle diese Parameter in sämtlichen Kombinationen zu evaluieren, ist schlicht unmöglich. An dieser Stelle hilft die von ASAP entwickelte Methodik, kritische Konfigurationen – wie beispielsweise schlechte Lichtverhältnisse oder unklare Radarerkennung – zu identifizieren und kann so einen großen Beitrag bei der Realisierung von zuverlässigen Mobilitätslösungen der Zukunft leisten.

Bildergalerie

  • Eine Vielzahl von Steuergeräten sind Teil der Wirkkette des Rückfahrsystems. Daraus ergeben sich zahlreiche Querwirkungen.

    Eine Vielzahl von Steuergeräten sind Teil der Wirkkette des Rückfahrsystems. Daraus ergeben sich zahlreiche Querwirkungen.

    Bild: ASAP

  • Hier dargestellt wird die Annäherung an erhöhtes Fehleraufkommen.

    Hier dargestellt wird die Annäherung an erhöhtes Fehleraufkommen.

    Bild: ASAP

Firmen zu diesem Artikel
Verwandte Artikel