Die Geschichte der künstlichen Intelligenz wurde von sogenannten “AI Winters” geprägt, in denen die Technologie scheinbar an einem Totpunkt angelangte und die Finanzierung versiegte. Jeder dieser Zeiträume wurde von Proklamationen begleitet, dass es einfach zu schwierig für Menschen sei, Maschinen wirklich intelligent zu machen. Googles neues AI-Modell Gemini, das als grundlegend neue Art von AI-Modell und das bislang leistungsstärkste des Unternehmens gilt, legt jedoch nahe, dass ein neuer AI-Winter in absehbarer Zeit nicht zu erwarten ist. Tatsächlich gibt es gute Gründe zu der Annahme, dass der derzeitige AI-Boom gerade erst begonnen hat. OpenAI hatte keine hohen Erwartungen an das, was später Gemini genannt wurde. Es handelte sich einfach um einen Test einer neuen Benutzeroberfläche für ihre textgenerierenden großsprachigen Modelle (LLMs). Die Fähigkeit des Chatbots, eine Vielzahl von Aufgaben zu erledigen, von der Synthese von Essays und Gedichten bis hin zur Beantwortung von Programmierproblemen, beeindruckte und beunruhigte viele Menschen und setzte die Tech-Branche in Bewegung. Als Google sein neues LLM zu ChatGPT hinzufügte, waren einige Experten so verängstigt, dass sie Alarm schlugen. Es gibt bereits wenige Belege dafür, dass jemand diesen Alarmruf beachtet hat. Es ist unvorstellbar geworden, dass Google jetzt die Messlatte erhöht – und möglicherweise auch die Regeln des Spiels geändert hat – indem es Gemini angekündigt hat. Google nennt Gemini ein “nativ multimodales” Modell, was bedeutet, dass es nicht nur aus Text lernen kann, sondern auch Erkenntnisse aus Audio, Video und Bildern sammelt. ChatGPT zeigt, wie viel KI-Modelle über die Welt lernen können, wenn ihnen genügend Text gegeben wird. Einige KI-Forscher argumentieren, dass schon die Erhöhung der Textmenge ihre Fähigkeiten auf ein Niveau bringen würde, das dem von Menschen ebenbürtig ist. Es gibt jedoch nur so viel, das man über die physische Realität lernen kann, wenn man den Filter des von Menschen darüber geschriebenen Texts hat. Die schwer zu beseitigenden Einschränkungen von LLMs wie GPT-4 – wie die Halluzination von Informationen, schlechtes Denken und ihre seltsamen Sicherheitslücken – deuten darauf hin, dass das Skalieren bestehender Technologien Grenzen hat. Vor der heutigen Gemini-Ankündigung betonte WIRED in einem Artikel, dass ein neuer Ansatz im AI-Bereich nötig sei. Der Leiter der Entwicklung von Gemini, Demis Hassabis, war voraussagbar überschwänglich über Gemini und behauptete, es führe neue Fähigkeiten ein, die schließlich die Produkte von Google hervorheben würden. Aber Hassabis sagte auch, dass, um AI-Systeme zu liefern, die die Welt auf eine Weise verstehen können, die heutige Chatbots nicht können, LLMs mit anderen KI-Techniken kombiniert werden müssen. Dies passt zu Aussagen von OpenAI-Chef Sam Altman im April, als er deutlich machte, dass trotz des Erfolgs von ChatGPT einen große neue Idee erforderlich ist. Es scheint, als ob Google jetzt ein Konzept vorgeführt hat, das über ChatGPT hinausgeht. Aber vielleicht die bemerkenswerteste Botschaft des Gemini-Launchs ist, dass Google auf etwas Bedeutsameres hinarbeiten will als heuteige Chatbots – so wie es scheint, auch OpenAI.