- Nvidia hat die neue Familie von KI-Modellen namens Cosmos vorgestellt, die speziell für die Ausbildung von Industrie-Robotern entwickelt wurden. Die Cosmos-Modelle sind darauf ausgelegt, Bilder und 3D-Modelle der physischen Welt zu erschaffen, im Gegensatz zu herkömmlichen Sprachmodellen. Cosmos wurde mit 20 Millionen Stunden realer Aufnahmen trainiert, um Robotern ein besseres Verständnis der physischen Welt zu vermitteln. Einzigartige Anwendungsmöglichkeiten von Cosmos umfassen die Simulation von Lagerhausaktivitäten, um Roboter für das Erkennen von Unfällen zu trainieren. Neben Cosmos hat Nvidia auch neue Software angekündigt, die Roboter beim effizienteren Erlernen neuer Aufgaben unterstützt.
Nvidia hat bekannt gegeben, dass es eine neue Familie von grundlegenden KI-Modellen namens Cosmos veröffentlicht. Diese Modelle sollen speziell für die Ausbildung von Industrie-Robotern genutzt werden. Im Gegensatz zu traditionellen Sprachmodellen, die durch das Training an einer Vielzahl von Büchern, Artikeln und sozialen Medien lernen, wie man Text generiert, ist Cosmos darauf ausgelegt, Bilder und 3D-Modelle der physischen Welt zu erschaffen. Während einer Keynote-Präsentation auf der jährlichen CES-Konferenz in Las Vegas zeigte der Nvidia-CEO Beispiele, wie Cosmos eingesetzt wird, um Aktivitäten in Lagerhäusern zu simulieren. Cosmos wurde mit 20 Millionen Stunden realer Aufnahmen trainiert, darunter „Menschen, die gehen, Hände, die sich bewegen, Dinge manipulieren“, erklärte Jensen. „Es geht nicht darum, kreative Inhalte zu generieren, sondern die KI zu lehren, die reale Welt zu verstehen.“
Fokus auf körperliche Welt
Forschende und Startups hoffen, dass diese Art von grundlegenden Modellen fortgeschrittenere Fähigkeiten ermöglichen könnten. Cosmos ist beispielsweise in der Lage, realistische Videoaufnahmen von herabfallenden Boxen in einem Lagerhaus zu erzeugen, die verwendet werden können, um einen Roboter darauf zu trainieren, Unfälle zu erkennen. Nutzer können die Modelle zudem mit eigenen Daten feinjustieren. Eine Reihe von Unternehmen nutzt bereits Cosmos, wie humanoide Robotik-Startups Agility und Figure AI sowie selbstfahrende Auto-Unternehmen wie Uber, Waabi und Wayve. Nvidia kündigte ebenfalls Software an, die es Robotern ermöglicht, neue Aufgaben effizienter zu erlernen. Diese neue Funktion ist Teil der bestehenden Isaac-Robotik-Simulationsplattform von Nvidia, die es Entwicklern ermöglicht, eine kleine Anzahl von Beispielen für eine bestimmte Aufgabe zu nehmen, wie das Greifen eines bestimmten Objekts, und daraus eine große Menge an synthetischen Trainingsdaten zu generieren.
Erweiterung der robotischen Fähigkeiten
Nvidia hofft, dass Cosmos und Isaac bei Unternehmen Anklang finden werden, die humanoide Roboter herstellen und nutzen möchten. Jensen wurde auf der CES-Bühne von lebensgroßen Bildern von 14 verschiedenen humanoiden Robotern begleitet, die von Unternehmen wie Tesla, Boston Dynamics, Agility und Figure entwickelt wurden. Neben Cosmos kündigte Nvidia auch an, dass es in der Lage ist, ein großes Sprachmodell mit bis zu 200 Milliarden Parametern laufen zu lassen, ohne dass Cloud-Dienste wie AWS oder Microsoft erforderlich sind. Ebenso kündigte es die mit Spannung erwarteten RTX Blackwell GPUs der nächsten Generation und kommende Softwaretools zur Unterstützung beim Aufbau an.