Energie, Masse, Geschwindigkeit. Diese drei Variablen bilden Einsteins berühmte Gleichung E=MC2. Aber woher wusste Einstein überhaupt von diesen Konzepten? Ein erster Schritt zum Verständnis der Physik ist die Identifizierung der relevanten Variablen. Ohne das Konzept von Energie, Masse und Geschwindigkeit hätte nicht einmal Einstein die Relativitätstheorie entdecken können. Aber können solche Variablen automatisch entdeckt werden? Dies könnte die wissenschaftliche Entdeckung erheblich beschleunigen.
KI wird „einfache“ Frage gestellt
Diese Frage haben Forscher von Columbia Engineering einem neuen KI-Programm gestellt. Das Programm wurde so konzipiert, dass es physikalische Phänomene mit einer Videokamera beobachtet und dann versucht, die minimale Menge an grundlegenden Variablen zu finden, welche die beobachtete Dynamik vollständig beschreiben.
Die Forscher fütterten das System zunächst mit unbearbeitetem Videomaterial von Phänomenen, für die sie die Antwort bereits kannten. So gaben sie beispielsweise ein Video eines schwingenden Doppelpendels ein, von dem bekannt war, dass es genau vier „Zustandsvariablen“ hat – den Winkel und die Winkelgeschwindigkeit jedes der beiden Arme. Nach einigen Stunden der Analyse gab die KI die Antwort aus: 4.7.
„Wir dachten, dass diese Antwort nahe genug war“, sagte Hod Lipson, Direktor des Creative Machines Lab in der Fakultät für Maschinenbau, wo die Arbeit hauptsächlich durchgeführt wurde. „Vor allem, weil die KI nur Zugang zu unbearbeitetem Videomaterial hatte, ohne jegliche Kenntnisse über Physik oder Geometrie. Aber wir wollten wissen, was die Variablen tatsächlich sind, nicht nur ihre Anzahl.“
Rätselhafte Variablen
Die Forscher gingen dann dazu über, die tatsächlichen Variablen zu visualisieren, welche das Programm identifizierte. Es war nicht einfach, die Variablen selbst zu extrahieren, da das Programm sie nicht auf eine intuitive, für den Menschen verständliche Weise beschreiben kann. Nach einigem Probieren stellte sich heraus, dass zwei der Variablen, die das Programm auswählte, in etwa mit den Winkeln der Arme übereinstimmten, aber die anderen beiden blieben ein Rätsel.
„Wir haben versucht, die anderen Variablen mit allem Möglichen zu korrelieren: Winkel- und Lineargeschwindigkeiten, kinetische und potenzielle Energie und verschiedene Kombinationen bekannter Größen“, erklärt Boyuan Chen PhD '22, jetzt Assistenzprofessor an der Duke University, der die Arbeit leitete. „Aber nichts schien perfekt zu passen.“ Das Team war zuversichtlich, dass die KI einen gültigen Satz von vier Variablen gefunden hatte, da sie gute Vorhersagen machte, „aber wir verstehen die mathematische Sprache, die sie spricht, noch nicht“, erklärte er.
Nachdem sie eine Reihe anderer physikalischer Systeme mit bekannten Lösungen validiert hatten, gaben die Forscher Videos von Systemen ein, für die sie die eindeutige Antwort nicht kannten. Die ersten Videos zeigten eine „Lufttänzerin“, die sich vor einem örtlichen Gebrauchtwagenmarkt bewegte. Nach einigen Stunden der Analyse lieferte das Programm acht Variablen. Ein Video von einer Lavalampe ergab ebenfalls acht Variablen. Dann wurde ein Videoclip mit Flammen aus einer Kaminschleife eingespeist, und das Programm lieferte 24 Variablen.
Variable Lösungen
Eine besonders interessante Frage war, ob der Satz von Variablen für jedes System eindeutig war oder ob bei jedem Neustart des Programms ein anderer Satz erzeugt wurde. „Ich habe mich immer gefragt, wenn wir jemals einer intelligenten außerirdischen Rasse begegnen würden, ob sie die gleichen physikalischen Gesetze entdeckt haben wie wir, oder ob sie das Universum vielleicht anders beschreiben“, so Lipson. „Vielleicht erscheinen manche Phänomene rätselhaft komplex, weil wir versuchen, sie mit der falschen Anzahl von Variablen zu verstehen.“
In den Experimenten war die Anzahl der Variablen bei jedem Neustart der KI dieselbe, aber die spezifischen Variablen waren jedes Mal anders. Es gibt also durchaus alternative Möglichkeiten, das Universum zu beschreiben, und es ist durchaus möglich, dass unsere Auswahl nicht perfekt ist.
Die Forscher glauben, dass diese Art von KI den Wissenschaftlern helfen kann, komplexe Phänomene aufzudecken, bei denen das theoretische Verständnis nicht mit der Datenflut Schritt halten kann – in Bereichen von der Biologie bis zur Kosmologie. „Wir haben in dieser Arbeit zwar Videodaten verwendet, aber jede Art von Array-Datenquelle könnte genutzt werden – zum Beispiel Radar-Arrays oder DNA-Arrays“, erklärt Huang.
Daten in wissenschaftliche Gesetze umwandeln
Die Arbeit ist Teil des jahrzehntelangen Interesses von Lipson und dem Fu-Stiftungsprofessor für Mathematik, Qiang Du, an der Entwicklung von Algorithmen, die Daten in wissenschaftliche Gesetze umwandeln können. Frühere Softwaresysteme, wie die Eureqa-Software von Lipson und Michael Schmidt, konnten aus experimentellen Daten freie physikalische Gesetze destillieren, allerdings nur, wenn die Variablen im Voraus bekannt waren. Was aber, wenn die Variablen noch unbekannt sind?
Lipson vertritt die Ansicht, dass Wissenschaftler viele Phänomene falsch interpretieren oder nicht verstehen, weil sie keine guten Variablen zur Beschreibung dieser Phänomene haben. „Jahrtausendelang wussten die Menschen, dass sich Objekte schnell oder langsam bewegen, aber erst als der Begriff der Geschwindigkeit und der Beschleunigung formell quantifiziert wurde, konnte Newton sein berühmtes Bewegungsgesetz F=MA entdecken“, so Lipson. Variablen, die Temperatur und Druck beschreiben, mussten identifiziert werden, bevor die Gesetze der Thermodynamik formalisiert werden konnten, und so weiter für jeden Winkel der wissenschaftlichen Welt. Die Variablen sind eine Vorstufe zu jeder Theorie. „Welche anderen Gesetze fehlen uns, nur weil wir die Variablen nicht haben?“, fragte Du, der die Arbeit mit geleitet hat.
An der Arbeit waren auch Sunand Raghupathi und Ishaan Chandratreya beteiligt, die bei der Sammlung der Daten für die Experimente halfen. Seit dem 1. Juli 2022 ist Boyuan Chen Assistenzprofessor an der Duke University. Die Arbeit ist Teil eines gemeinsamen NSF-KI-Instituts für dynamische Systeme der Universitäten Washington, Columbia und Harvard, das wissenschaftliche Entdeckungen mithilfe von KI beschleunigen soll.