- Google hat diese Woche den neuen KI-Assistenten Gemini vorgestellt, der als Standardassistent im Pixel 9 integriert ist. . Die Funktion Gemini Live ermöglicht eine natürlichere Kommunikation und ist zunächst auf Englisch verfügbar. . Gemini Live kann mitten im Gespräch unterbrochen werden und soll zukünftig mit anderen Apps und Computer-Vision-Technologie verbunden werden. . Nutzer können aus zehn verschiedenen Stimmen wählen und erhalten eine vollständige Transkription des Gesprächs. . Google plant, viele Assistant-Funktionen in Gemini zu integrieren, während Google Assistant in Haushalten als „gemeinschaftlicher“ Assistent verbleibt.
Google hat diese Woche eine Reihe neuer Hardware auf den Markt gebracht. Darunter ist auch der neue KI-Assistent namens Gemini. Dieser wurde bereits in vielen Android-Telefonen weltweit integriert und ist jetzt der Standardassistent auf dem Pixel 9. Nun gibt es eine neue Art, mit diesem Chatbot zu kommunizieren: Gemini Live. Diese Funktion, die der natürlichen Gesprächsweise zwischen Menschen nahekommen soll, wird derzeit in Englisch eingeführt und kann über den „Live“-Button in der rechten unteren Ecke der Gemini-App aufgerufen werden. Weitere Sprachen und die iOS-App sollen bald folgen.
Sissies Perspektive
Sissie Hsiao, Googles Vizepräsidentin für Gemini-Erfahrungen, erklärte gegenüber WIRED, dass dieser Chatbot nicht einfach nur ein aufgewärmter Google Assistant sei. Stattdessen handelt es sich um ein komplett neu gestaltetes Interface, das auf generativer KI basiert. Nutzer hätten sich im Laufe der Jahre vor allem eines gewünscht: Einen flüssigeren und natürlicheren Assistenten, mit dem sie auf natürliche Weise kommunizieren können, ohne ihre Sprechweise ändern zu müssen. Zudem soll der Assistent komplexere Lebensprobleme lösen, nicht nur einfache Aufgaben.
Starten Sie Gemini und Sie sehen einen leeren Bildschirm mit einem ätherischen Licht, das von unten aufleuchtet. Sie können ein Gespräch beginnen, auch wenn Ihr Telefon gesperrt ist, und es ist auch über Googles neue kabellose Ohrhörer zugänglich. Es gibt zehn Stimmen zur Auswahl, variierend in Ton, Akzent und Stil. Am Ende der Sitzung erhalten Sie eine vollständige Transkription des Gesprächs, die in der Gemini-App jederzeit abrufbar ist.
Neue Dimension der Interaktion
Im Gegensatz zu den bisherigen Sprachassistenten können Sie Gemini Live mitten im Gespräch unterbrechen, ohne die gesamte Erfahrung zu stören. Das ist besonders nützlich, da Gemini dazu neigt, viel zu reden. Die Idee ist, Gemini Live mit anderen Apps über Erweiterungen zu verbinden. Viele dieser Erweiterungen sind jedoch noch nicht verfügbar. Beispielsweise können Sie Gemini Live bitten, eine Partyeinladung in Ihrem Gmail abzurufen und nach Uhrzeit und Ort zu fragen, anstatt selbst danach zu suchen. Oder Sie suchen nach einem Rezept und bitten es, die Zutaten in einer Einkaufsliste in Google Keep hinzuzufügen. Diese Erweiterungen für Apps wie Keep, Tasks, Utilities, Calendar und YouTube Music sollen in den kommenden Wochen aktiviert werden.
Später im Jahr plant Google, Gemini Live mit Computer-Vision-Technologie auszustatten. So können Sie die Kamera-App Ihres Telefons verwenden und in Echtzeit Gemini nach den Objekten fragen, die Sie in der realen Welt betrachten. Stellen Sie sich vor, Sie laufen an einem Konzertplakat vorbei und bitten Gemini, die Termine in Ihrem Kalender zu speichern und eine Erinnerung zum Ticketkauf einzurichten.
Gespräch mit Gemini
Die bisherigen Erfahrungen mit Sprachassistenten waren hauptsächlich transaktional. Bei Gemini Live ist das anders. Es geht über einfache Anfragen wie den Wetterbericht oder das Schließen der Jalousien hinaus. Hsiao erzählte von einer Fahrt nach Hause, bei der sie Gemini Live nach den Olympischen Spielen in Paris und Celine Dion fragte. Die KI antwortete ausführlich und Hsiao entdeckte, dass Dion auch auf Chinesisch singen kann. Dies zeigte die Möglichkeiten auf, die durch die neugierige und explorative Interaktion mit der Technologie eröffnet werden.
Im eigenen Test fragte ich Gemini nach Abendessen-Ideen. Wir hatten ein Hin-und-Her-Gespräch, bis Gemini ein Garnelengericht vorschlug. Als ich sagte, dass ich allergisch gegen Garnelen sei, empfahl die KI Lachs. Schließlich führte sie mich durch die Zubereitung eines Hähnchensalats, den ich jederzeit in der App nachlesen kann.
Google Assistant und Gemini
Aber was ist mit dem Google Assistant? In der Gemini-App gibt es eine Option, zum Google Assistant zu wechseln, falls man den alten Assistenten weiter nutzen möchte. Es bleibt abzuwarten, wie lange diese Option bestehen bleibt, da Google plant, viele Assistant-Funktionen in Gemini zu integrieren. Einige Aufgaben kann der Google Assistant noch besser, aber das wird sich zunehmend ändern, sagt Hsiao.
Googles Strategie ist es, Gemini als persönlichen Assistenten zu nutzen, während der Google Assistant als „gemeinschaftlicher“ Assistent in Haushalten bleibt. Dies soll verhindern, dass persönliche Daten in gemeinsamen Räumen zugänglich werden. Auch wenn es momentan nach einem Branding-Chaos klingt, liegt der Schwerpunkt darauf, den bestmöglichen Service zu bieten, egal ob auf dem persönlichen Smartphone oder im Haushalt.
Insgesamt bietet Gemini Live eine vielversprechende Zukunft für interaktive und kontinuierliche Konversationen mit der Technologie. Ob es sich dabei um die Verwaltung von E-Mails oder die Planung von Einkäufen handelt, diese Art der Interaktion könnte das Suchen und Finden von Informationen revolutionieren.