- Googles Gemini-Chatbot kann Chaos erkennen und Haushaltstipps geben. Die Funktion wurde in der DeepMind-Abteilung entwickelt und ist ein universeller KI-Assistent. Der Zugriff auf die Gemini-Funktion ist für Nutzer mit bestimmten Android-Telefonen und einem 20 Dollar-Abonnement möglich. Gemini Live kann Gemälde im Madhubani-Stil korrekt erkennen und analysieren. Trotz einiger Schwächen zeigt Gemini bedeutende Fortschritte in der KI-Entwicklung.
Es ist zutiefst irritierend, wenn eine KI in einem gespenstisch freundlichen Tonfall mit mir spricht und mir rät, das Durcheinander auf meinem Arbeitsplatz aufzuräumen. Ich bin ein wenig stolz darauf, aber anscheinend ist es an der Zeit, die unordentlich verteilten Geräte zu stapeln und den Kabelsalat zu ordnen. Mein Schwesterlein würde dem sicherlich zustimmen. Doch der eigentliche Knackpunkt liegt in der Aktion, dass eine KI meinen Tisch sieht, das Chaos erkennt und Haushaltstipps gibt. Genau das kann Googles Gemini-Chatbot inzwischen leisten. Und noch vieles mehr.
Vielfältige Fähigkeiten einer modernen KI
Der Clou liegt in einer kürzlich hinzugekommenen Funktion, die seit Jahren in Entwicklung war. Das große Ziel besteht darin, eine alles sehende, alles hörende und extrem intelligente KI auf Ihr Telefon zu bringen. Google vermarktet diese Superkräfte unter einem eher uninspirierten Namen: mit Kamera- und Bildschirmfreigabe. Entwickelt wurde es in der DeepMind-Abteilung, das Projekt startete ursprünglich als „universeller KI-Assistent“. Es ist bedauerlich, dass der finale Name nicht besonders visionär ist.
Das Ganze beginnt mit dem Zugang zu der Funktion. Die Fähigkeit ist jetzt für Nutzer mit bestimmten Android-Telefonen verfügbar. Sollten Sie über ein Android-Gerät mit einem Gemini Advanced-Abonnement verfügen, so können Sie auf das neue Tool zugreifen. Die Kosten belaufen sich auf 20 Dollar pro Monat. Ich habe es auf zwei erwähnten Geräten ausprobiert und nun auch auf meinem eigenen Telefon einsatzbereit. Das Beste daran? Sie müssen keine technischen Hürden überwinden, um Zugriff darauf zu erhalten. Einfache Tastenkombinationen genügen, um Gemini aufzurufen. Egal, welche App Sie gerade verwenden, das neue Kamera- und Bildschirmfreigabe-Feature ist immer und überall im Betriebssystem als Overlay zugänglich.
Bemerkenswerte Funktionen der Gemini Live-Funktion
Ich begann, indem ich die Kamera nach einem Gemälde ausrichtete und danach fragte. Gemini Live erkannte es korrekt als ein Gemälde im Madhubani-Stil, analysierte die markante Farbgebung und Tierdarstellung. Daraufhin folgte eine kurze Geschichtsstunde und Informationen zu verschiedenen Stilvarianten, die sich im Laufe der Jahre entwickelt haben. Die Informationen waren bis ins kleinste Detail präzise. Glücklicherweise können Sie auch textbasiert mit Gemini interagieren, falls Sprachausgaben in Ihrer Situation unpraktisch wären. Was mir besonders gefiel, war, dass Gemini nicht übermäßig gesprächig war und man die Freiheit hatte, sie jederzeit zu unterbrechen, was den Gesprächen einen „natürlichen“ Anklang verleiht.
Ich setze Gemini in einer Vielzahl von Situationen ein. Es war erstaunlich, wie groß die Bandbreite der Themen war, die es abdeckte. Trotz einiger Schwächen, wie der fehlenden Echtzeit-Suche oder der Unfähigkeit, bestimmte Schriftarten korrekt zu erkennen, bleibt Gemini Live eine der bedeutendsten Weiterentwicklungen von KI, die uns einen faszinierenden Einblick in die Zukunft der Technologie gibt. Es fehlt noch ein wenig an Vielfalt und einer Lösung für das „konfidente Lügner“-Syndrom, aber die Fortschritte sind schon jetzt bemerkenswert. Ein paar essentielle Verbesserungen und Gemini könnte bald das Smartphone-Erlebnis grundlegend revolutionieren.