- Google plant, einen KI-Agenten namens Jarvis im Chrome-Browser einzufĂŒhren. Jarvis soll komplexe Aufgaben wie Webseitenbesuche und Zahlungen autonom ausfĂŒhren können. Jarvis könnte eine bedeutende Erweiterung der FunktionalitĂ€ten des Sprachmodells Gemini darstellen. Andere Unternehmen wie Anthropic und Swarm Framework entwickeln ebenfalls KI-Agenten. Diese Entwicklungen zeigen das Potenzial von KI-Agenten fĂŒr zukĂŒnftige Technologien.
Mit der stetig fortschreitenden Entwicklung von generativer KI erobert ein neues Konzept die Technologiebranche: KI-Agenten. Google könnte bald einen eigenen Agenten im Rahmen seines kommenden groĂen Sprachmodells, bekannt als Gemini, vorstellen. Unter dem geheimnisvollen Namen Projekt Jarvis plant Google einen KI-Agenten, der direkt im Chrome-Browser agiert. Diese Innovation könnte die gröĂte VerĂ€nderung seit EinfĂŒhrung des Browsers im Jahr 2008 darstellen. Jarvis soll in der Lage sein, alltĂ€gliche Aufgaben nach einfachen Befehlen auszufĂŒhren, mit einer Autonomie, die bisher nicht möglich war.
Gemini: Die nÀchste Generation
Bereits jetzt zeigt sich die LeistungsfĂ€higkeit von Gemini im aktuellen Modell 1.5 Pro, das als Einkaufs- und Reisebegleiter agiert. Mit der Weiterentwicklung wird erwartet, dass Jarvis komplexere Aufgaben ĂŒbernimmt, etwa das Besuchen von Webseiten, das AusfĂŒllen von Formularen oder sogar das DurchfĂŒhren von Zahlungen. Ein solches Potenzial bedeutet eine erhebliche Erweiterung dessen, was derzeit möglich ist. Man könnte etwa eine Aufforderung formulieren: âPlane mir eine Reise im Dezember fĂŒr 2.000 Dollar.â Im jetzigen Modell könnte dies lediglich eine grobe Planung sein, doch mit Jarvis wĂ€re es möglich, FlĂŒge und Hotels direkt zu buchen und die Details per E-Mail zu ĂŒbermitteln.
Das Potenzial der KI-Agenten
Interessanterweise erinnert der Projektname Jarvis an den berĂŒhmten KI-Assistenten von Tony Stark in der Welt von Science-Fiction. Obwohl der endgĂŒltige Name noch unbekannt ist, scheint die Bezeichnung passend zu sein, wĂ€hrend Google die FĂ€higkeiten seines Modells weiter ausbaut. Seit Mai prĂ€sentiert Google die Fortschritte der KI-Agenten, die die Verarbeitung von Sprach- und Videoinhalten erheblich verbessern und schnellere Antwortzeiten in GesprĂ€chen ermöglichen werden. Man spekuliert, dass dieses Konzept Teil des nĂ€chsten Sprachmodells, Gemini 2.0, sein könnte, dessen Veröffentlichung vielleicht bereits im Dezember angekĂŒndigt wird. Wie weit verbreitet es sein wird, bleibt offen.
Globale Technologie-Trends
WĂ€hrend Google weiter an seinem KI-Agenten arbeitet, sind andere Unternehmen nicht weit hinterher. Anthropic hat kĂŒrzlich seinen Computer Use-Agenten vorgestellt, der eigenstĂ€ndig als Benutzer des GerĂ€ts agiert. Diese Funktion befindet sich momentan in der Betaphase. Parallel dazu entwickelt Swarm Framework ein System von Agenten, die gemeinsam Aufgaben bewĂ€ltigen. Obwohl diese Entwicklungen noch in der experimentellen Phase sind, zeigen sie das gewaltige Potenzial, das KI-Agenten fĂŒr die Zukunft bereithalten.