- Aktuelle Modelle beeindruckend in digitaler, aber herausgefordert in physischer Welt. Physische Intelligenz benötigt VerstĂ€ndnis grundlegender Naturgesetze. FlĂŒssige Netzwerke ermöglichen kontinuierliches Lernen und Anpassung. Fortschritte in Robotik ermöglichen physische Umsetzung komplexer Befehle. 2025 markiert Beginn der Ăra der physischen Intelligenz.
Aktuelle Modelle zeigen eine erstaunliche FĂ€higkeit, menschenĂ€hnliche Texte, Audios und Videos zu generieren, wenn sie gefragt werden. Bisher blieb dieser algorithmische Zauber jedoch gröĂtenteils auf die digitale Welt beschrĂ€nkt, anstatt unsere greifbare, dreidimensionale RealitĂ€t zu umarmen. TatsĂ€chlich erweisen sich selbst die fortschrittlichsten Modelle als herausgefordert, wenn es darum geht, in der RealitĂ€t adĂ€quat zu agieren â sicherer und zuverlĂ€ssiger autonomer Verkehr sind dafĂŒr ein Beispiel. WĂ€hrend kĂŒnstliche Intelligenz beeindruckend ist, fehlt es diesen Modellen an einem VerstĂ€ndnis fĂŒr Physik. Sie tendieren zu Halluzinationen, was zu unerklĂ€rlichen Fehlentscheidungen fĂŒhrt. Doch dies ist das Jahr, in dem die KI durchstartet.
Von der Digitalwelt zur physischen Welt
Die Ausweitung von KI ĂŒber ihre digitalen Grenzen erfordert eine Neuausrichtung des maschinellen Denkens. Dies bedeutet die Verschmelzung der digitalen Intelligenz der KI mit der mechanischen Kompetenz der Robotik. Eine Erscheinung, die ich als “physische Intelligenz” bezeichne – eine neue Form, in der intelligente Maschinen dynamische Umgebungen verstehen, Unberechenbarkeiten bewĂ€ltigen und in Echtzeit Entscheidungen treffen können. Anders als bei herkömmlichen KI-Modellen ist physische Intelligenz in den Prinzipien der Physik verwurzelt; in einem VerstĂ€ndnis grundlegender Naturgesetze, wie etwa von Ursache und Wirkung.
In meiner Forschungsgruppe am MIT entwickeln wir Modelle physischer Intelligenz, die wir “flĂŒssige Netzwerke” nennen. In einem Experiment haben wir beispielsweise zwei Drohnen trainiert â eine mit einem Standard-KI-Modell und die andere mit einem flĂŒssigen Netzwerk â um Objekte in einem Wald im Sommer zu identifizieren. Beide Drohnen schnitten gleich gut ab, solange sie ihrem Trainingsmuster folgten. Doch als sie ihre Leistung unter geĂ€nderten Bedingungen beweisen mussten, wie im Winter oder in stĂ€dtischen Gebieten, ĂŒberzeugte nur die flĂŒssige Netzwerk-Drohne. Dieses Experiment demonstriert, dass flĂŒssige Netzwerke, im Gegensatz zu traditionellen KI-Systemen, kontinuierlich wie Menschen aus Erfahrungen lernen und sich anpassen.
BrĂŒcken zwischen digitaler Anweisung und RealitĂ€t
Physische Intelligenz kann komplexe Befehle aus Texten oder Bildern nicht nur interpretieren, sondern auch physisch umsetzen. So haben wir in unserem Labor ein System entwickelt, das innerhalb weniger Minuten kleine Roboter entwerfen und 3D-drucken kann, basierend auf Eingaben wie âRoboter, der vorwĂ€rts laufen kannâ oder âRoboter, der Objekte greifen kannâ. Auch andere Labore erzielen beachtliche Fortschritte. Zum Beispiel entwickelt das Robotik-Startup Covariant, gegrĂŒndet von UC-Berkeley-Forscher Pieter Abbeel, Chatbots, die robotische Arme steuern können, Ă€hnlich wie ChatGTP. Sie haben bereits ĂŒber 222 Millionen Dollar gesichert, um weltweit Sortierroboter in LagerhĂ€usern einzusetzen. Ein Team der Carnegie Mellon University konnte kĂŒrzlich zeigen, dass ein Roboter mit nur einer Kamera und ungenauer BetĂ€tigung dynamische und komplexe Parkoursbewegungen ausfĂŒhren kann.
Sollte 2023 das Jahr des textbasierten Bildes und 2024 das des videobasierten KI-Modells gewesen sein, so markiert 2025 die Ăra der physischen Intelligenz. Eine neue GerĂ€tegeneration – nicht nur Roboter, sondern alles von Stromnetzen bis zu intelligenten HĂ€usern – wird in der Lage sein, unsere Anweisungen zu interpretieren und in der realen Welt umzusetzen.