- Genau einen Tag vor einem wichtigen und bereits länger angekündigten Google-KI-Event hatte OpenAI etwas Wichtiges mitzuteilen
- Das Unternehmen OpenAI stellte die neue Generation GPT-4o vor – den schnelleren und vielseitigeren Chatbot
- Gemini von Google soll große Pläne für die Zukunft haben, um die Suche, die Arbeit mit Google-Apps und das Android-Betriebssystem zu revolutionieren
- Zukunftsmusik oder Realität? Erste Praxistests mit Gemini zeigen einige Probleme mit der Funktionalität
- Es gibt auch andere Konkurrenten auf dem Markt, die mit Künstlicher Intelligenz arbeiten, wie Copilot von Microsoft, Claude von Anthropic und Meta AI von Facebook.
Genau einen Tag vor einem wichtigen und bereits länger angekündigten Google-KI-Event hatte OpenAI etwas Wichtiges mitzuteilen. Natürlich auch etwas mit KI. Denn OpenAI ist das Unternehmen hinter ChatGPT, dem bekanntesten und erfolgreichsten KI-Chatbot.
Die Präsentationen waren trotzdem sehr verschieden. [Die neue Generation: GPT-4o von OpenAI] wurde vorgestellt – das ist der nächste Chatbot, schneller und vielseitiger. Er ist sofort verfügbar. Google stellte die Neuerungen bei der eigenen Gemini-KI vor. Es waren sehr viele, doch die meisten davon sollen erst im Laufe des Jahres kommen.
Auch, wenn es also um Äpfel und Birnen geht: Zu vergleichen gibt es eine Menge. Wir werfen einen Blick auf Funktionsumfang, Lücken, Kosten – und wagen einen ersten Praxistest.
GPT-4o: Der schnellere und vielseitigere Chatbot von OpenAI
GPT-4o quatscht munter drauf los. Das gefühlt größte Update am neuen GPT ist die Geschwindigkeit. Wer je einen KI-Chatbot ausprobiert hat, kennt den Effekt: Nach jeder Eingabe passiert lange Sekunden erst einmal gar nichts, dann wird häppchenweise eine geschwätzige Antwort generiert.
Mehr zum Thema Ganz anders der Sprachchat mit GPT-4o: Ist die Verbindung hergestellt, quatschen wir frei mit der KI und müssen kaum länger warten als bei einem herkömmlichen Telefonat mit echten Menschen. Das verändert die Dynamik des Gesprächs grundlegend. Natürliche Frage-und-Antwort-Runden entfalten sich. Wir fallen der KI ins Wort und sie verstummt kurz, bevor sie geduldig antwortet.
Auch den Sprachchat gibt‘s gratis, allerdings nicht ohne Anmeldung. Bei unserem Test endete das Gespräch in der Gratisversion meistens mit einem plötzlichen „Sorry, I am experiencing issues right now“ – die Server sind überlastet.
Unbedingt klüger wirkt die KI auf uns immer noch nicht. Sie redet menschlich, freundlich und schnell, wirkt mitunter täuschend echt. Toll funktioniert sie bei Aufgaben, die auf allgemein verfügbarem Wissen basieren. Einen philosophischen Grundsatz für ein achtjähriges Kind erklären? Kein Problem!
Google Gemini: Große Pläne für die Zukunft
Gemini hat große Pläne. Google hat fast zwei Stunden gebraucht, um die zahllosen Änderungen und Neuerungen der eigenen KI zu erklären. Kein Wunder, denn Gemini soll überall landen, soll die Suche, die Arbeit mit allen Google-Apps und das komplette Android-Betriebssystem für Handys umkrempeln. Gemini soll Fotos auswerten, Schuhe umtauschen, Reisen planen und frei mit uns reden.
Doch das ist Zukunftsmusik. Die Google KI verteilt sich, zahlreiche Services und Dienste werden entwickelt, und die wenigsten davon sind jetzt schon in Deutschland verfügbar. Bis zum Ende des Jahres aber soll Gemini uns als persönlicher Tutor beim Lernen helfen, soll Bilder, Musik und Videos erstellen, soll die Google-Suche völlig umkrempeln. Komplette Planungs- und Rechercheaufgaben sollen mit einem Befehl ausgeführt werden können.
[Zukunftsmusik oder Realität? Erste Praxistests mit Gemini]Zahlende Kunden mit Gemini Advanced können jetzt neu auf Gemini 1.5 Pro zugreifen. Doch im ersten Praxistest bemerken wir keinen Unterschied zu vorher. Richtig gut soll Gemini jetzt darin sein, große Inhaltsmengen zu verarbeiten. Doch blöderweise funktioniert der Upload für Dokumente bei uns zum Artikelzeitpunkt nicht. Wenn wir lange Texte direkt ins Eingabefenster kopieren, kann er die Inhalte aber eloquent und weitgehend fehlerfrei zusammenfassen.Ein spannender Ausblick wartet in den . Hier können wir mit ImageFX Bilder erstellen. Die Qualität der Bilder ist nicht besser als bei Konkurrenzprodukten. Ein echter Aha-Effekt ist aber die Möglichkeit, Elemente der Bilder zu markieren und nachzubearbeiten.
Technisch beeindruckend sind TextFX für interaktive Sprachspiele (etwa Alliterationen) und MusicFX für Fahrstuhlmusikschnipsel auf Bestellung. Beides dürfte den meisten Menschen wenig nützen, ist aber sehr unterhaltsam.
[Konkurrenten auf dem Markt: Copilot, Claude und Meta AI]Es gibt nicht nur Google und OpenAI. Hier ein kurzer Überblick, welche Konkurrenten auch was mit Künstlicher Intelligenz machen.Copilot – ist die KI von Microsoft, früher auch „Bing Chat“ genannt. Sie ist verwirrenderweise eng mit ChatGPT verwandt. Völlig gratis und ohne Anmeldung ist der vergleichsweise leistungsstarke benutzbar. Auch auf das leistungsstarke Tool zum Bildererstellen gewährt Microsoft mit Einschränkungen Zugriff. Quatschen kann der Copilot auch, doch er klingt langsam und hölzern.
Claude – ist der Chatbot des Start-ups Anthropic. Die Firma ist weniger bekannt, doch antwortet auf Augenhöhe mit den Großen. Lange konnte Claude uns herzlich egal sein, denn in Deutschland war er nicht verfügbar. Doch das hat sich Anfang der Woche geändert. Auch bei Claude kostet aber das klügere Modell Geld, rund 21 Euro pro Monat.
Meta AI – ist die künstliche Intelligenz des Facebook-Konzerns Meta. Spannend ist sie, weil sie für Millionen von Menschen den ersten Kontakt mit KI bedeuten wird. Schließlich ist Meta AI dann in den Apps von Instagram und Whatsapp ansprechbar. Noch ist das Angebot aber nicht in Deutschland verfügbar.
KI-Browser können zahlreiche KI-Funktionen und verschiedene Assistenten dorthin bringen, wo viele Menschen sie benötigen: Beim Surfen im Internet. Interessante Kandidaten wie Brave, Arc und Opera haben wir kürzlich verglichen.