Das Fraunhofer-Institut für Produktionstechnik und Automatisierung IPA hat einen umfassenden Benchmark zur standardisierten Analyse Humanoider Roboter entwickelt. Damit können Hersteller und Endanwender erstmals die tatsächlichen Fähigkeiten, Sicherheit und Einsatztauglichkeit dieser Roboter von neutraler Stelle objektiv bewerten lassen. Der modular aufgebaute Benchmark umfasst sechs anwendungsrelevante Kriterien und basiert auf international anerkannten Industriestandards.
Von der Medienpräsenz zur realistischen Bewertung
Humanoide Roboter sind medial omnipräsent und faszinieren durch ihre menschenähnliche Gestalt. Doch zwischen spektakulärer Inszenierung und tatsächlichen Fähigkeiten klafft eine große Lücke. „Für Endanwender sowie Hersteller ist ein Blick hinter die mitunter von Marketingagenturen aufgebaute Fassade essenziell“, erklärt Simon Schmidt, Geschäftsbereichsleiter Automatisierte Systeme am Fraunhofer IPA. „Der Markt ist zu volatil und intransparent, um Humanoide für eigene Anwendungen fundiert einschätzen und verlässlich bewerten zu können.“
Das ist der Benchmark
Der Benchmark ist eine standardisierte Dienstleistung, bei der Forschungsteams des Fraunhofer IPA Humanoide Roboter durch unterschiedliche Challenges führen und die Ergebnisse wissenschaftlich auswerten. Die Grundlagen hierfür entstanden dank Fördermitteln des Ministeriums für Wirtschaft, Arbeit und Tourismus Baden-Württemberg im Rahmen des KI-Fortschrittszentrums „Lernende Systeme und Kognitive Robotik“.
Die modulare Struktur des Benchmarks ermöglicht es Herstellern, Endanwendern und Softwareanbietern, gezielt die für ihre Anwendung relevanten Bereiche zu testen. Wo möglich, orientiert sich das Benchmarking an etablierten und seit Jahrzehnten international anerkannten Industriestandards – beispielsweise ISO 14644 für Reinraumtauglichkeit oder ISO 10218 und ISO TS 15066 für funktionale Sicherheit.
Der Benchmark gliedert sich in sechs zentrale Bereiche:
1. Technologien und Basisfähigkeiten: Untersuchung der verbauten Sensoren, KI-Modelle, Greifertypen sowie Tests zu Laufgeschwindigkeit, Greifkräften und handhabbaren Lasten. Mittels 3D-Tracking-System und Kraftsensoren werden objektive Messwerte erfasst.
2. Komplexe Fähigkeiten: Bewertung praxisnaher generischer Aufgaben wie Treppenlaufen, Hindernisbewältigung, Bewegungs- und Kraftgenauigkeit sowie Reaktionsgeschwindigkeit. Die Tests sind bewusst anspruchsvoll gestaltet, um auch zukünftige Modellgenerationen vergleichbar zu machen.
3. Reinraumtauglichkeit: Bewertung der Partikelfreisetzung nach ISO 14644-14, des Ausgasungsverhaltens und der Reinigbarkeit – entscheidend für Einsätze in Halbleiter-, Pharma- oder Lebensmittelindustrie.
4. Funktionale Sicherheit (Safety): Zentral für die Mensch-Roboter-Kollaboration. Getestet werden Stabilität auf verschiedenen Untergründen, Kraftbegrenzung bei Kollisionen, Hinderniserkennung und Systemverhalten bei Ausfällen. Kollisionstests erfolgen mit denselben Kraftsensoren wie für kollaborative Industrieroboter.
5. Cybersicherheit (Security): Vier Module prüfen Schwachstellenmanagement, sicheren Lebenszyklus, Netzwerksicherheit und Penetrationsresistenz – angesichts zunehmender gesetzlicher Anforderungen ein kritischer Faktor.
6. Energieeffizienz: Messung der Batterielaufzeit und Leistungsaufnahme in verschiedenen Szenarien (Stehen, Gehen, Gehen mit Steigung und Last). Die Ergebnisse ermöglichen eine realistische Einsatzplanung und Optimierung von Ladezyklen.
Erstes Anwendungsbeispiel: Unitree G1
Am Beispiel des Unitree G1 hat das Fraunhofer IPA den Benchmark erstmals umfassend angewendet. Technische Grundlage war ein im Mai 2025 ausgelieferter Unitree G1 EDU-4 mit Dex3-1 3-Fingerhänden und Firmwareversion 1.04: Während der Roboter eine gute Selbststabilisierung zeigt und für Reinräume der ISO-Klasse 5 geeignet sein könnte, wurden auch deutliche Limitierungen sichtbar. Bei Kollisionen können Kräfte über 500 Newton auftreten – weit über den nach Norm zulässigen Schmerzschwellen.
Zudem identifizierten die Forscher eine kritische Bluetooth-Sicherheitslücke in der zum Testzeitpunkt vorliegenden Software-Version, die eine vollständige Fernsteuerung durch Angreifer ermöglicht. Diese Lücke ist mittlerweile behoben. Hinsichtlich der Energieeffizienz zeigten sich maximale Betriebszeiten mit einer Akkuladung von 2 Stunden und 49 Minuten bei reinem Stehen und 1 Stunde und 49 Minuten bei einem typischen Szenario, das Stehen und Laufen beinhaltet.
Relevanz des Benchmarks für Unternehmen
„Anwender können die Ergebnisse direkt interpretieren und so den richtigen Humanoiden für die richtige Anwendung finden“, betont Werner Kraus, Forschungsbereichsleiter am Fraunhofer IPA. Der Benchmark macht Humanoide nicht nur untereinander, sondern auch mit bewährten Automatisierungskomponenten vergleichbar. Dies ist besonders wichtig, da:
der demografische Wandel den Einsatz von Automatisierung in bisher manuellen Bereichen erzwingt
hohe Investitionsentscheidungen fundierte, objektive Bewertungsgrundlagen erfordern
Sicherheitsnormen für Humanoide erst 2028 (ISO 25785-1) erwartet werden
regulatorische Anforderungen an Cybersicherheit steigen
sensible Produktionsumgebungen verlässliche Daten zur Kontaminationsvermeidung benötigen
Der Benchmark bietet Transparenz in einem intransparenten Markt und ermöglicht es Unternehmen, realistische Erwartungen zu entwickeln und Risiken zu minimieren.
Das Fraunhofer IPA plant, weitere Humanoide zu testen und eine Vergleichsdatenbank aufzubauen. Hersteller und Anwender können einzelne Benchmark-Module bis hin zu vollumfänglichen Untersuchungen ab sofort beauftragen und von der vorhandenen Infrastruktur und Expertise profitieren.