- OpenAI präsentierte eine bahnbrechende Technologie im März, die die Technikwelt erschütterte. Anthropic verkündete heute eine eigene bedeutende AI-Weiterentwicklung, Claude 3.5 Sonnet, die besonders in Mathematik, Programmierung und Logik fähiger ist. Fortschritte in der AI beruhen jetzt mehr auf Innovationen im Design und Training statt auf reiner Vergrößerung der Modellgröße. Traditionalle Benchmarks zur Messung von AI-Fortschritten können irreführend sein; neue Prüfmethoden werden entwickelt. Noch ist unklar, wann der nächste große Sprung in der AI-Entwicklung stattfinden wird, obwohl OpenAI bereits an GPT-5 arbeitet.
Als OpenAI im vergangenen März seine neueste Entwicklung präsentierte, erschütterte dies die Technikwelt zutiefst. Diese Technologie war in der Lage, auf eine Art und Weise zu chatten und zu programmieren, die zuvor unvorstellbar war. Heute hingegen verkündete Anthropic, ein Konkurrent von OpenAI, eine eigene bedeutende AI-Weiterentwicklung, die Chatbots und andere Anwendungen revolutionieren soll. Doch obwohl das neue Modell in mancherlei Hinsicht das Beste der Welt ist, handelt es sich eher um einen kleinen Fortschritt als um einen großen Sprung nach vorn.
Der Claude 3.5 Sonnet
Anthropics neues Modell, genannt Claude 3.5 Sonnet, ist eine Verbesserung der bestehenden Claude 3-Familie von AI-Modellen. Es ist noch fähiger, mathematische, programmiertechnische und logische Probleme zu lösen, wie nach üblichen Maßstäben gemessen wird. Anthropic behauptet, dass es außerdem deutlich schneller ist, besser Sprachnuancen versteht und sogar einen verbesserten Sinn für Humor besitzt. Diese Fähigkeiten sind zweifellos nützlich für Entwickler, die Anwendungen und Dienste auf Basis von Anthropics AI-Modellen entwickeln möchten.
Das Unternehmen erinnert jedoch daran, dass die Welt weiterhin auf einen weiteren großen Sprung in der AI-Entwicklung wartet, ähnlich wie bei der Einführung von GPT-4. Seit mehr als einem Jahr bauen sich die Erwartungen auf die Veröffentlichung eines Nachfolgers namens GPT-5 auf, der von OpenAI entwickelt wird. Der CEO von OpenAI, Sam Altman, äußerte, dass dies eine weitere Revolution in der AI-Fähigkeiten einläuten könnte.
Fortschritte und Herausforderungen
GPT-4 kostete mehr als 100 Millionen Dollar in der Entwicklung, und es wird allgemein erwartet, dass GPT-5 noch größer und teurer sein wird. Obwohl OpenAI, Google und weitere AI-Entwickler neue Modelle veröffentlicht haben, die GPT-4 übertreffen, wartet die Welt noch immer auf den nächsten großen Schritt. Der Fortschritt in der AI hat sich zuletzt verlangsamt und verlässt sich mehr auf Innovationen im Design und Training von Modellen als auf eine rohe Vergrößerung der Modellgröße und Rechenleistung, wie es bei GPT-4 der Fall war.
Michael Gerstenhaber, Produktleiter bei Anthropic, erklärt, dass das neue Claude 3.5 Sonnet-Modell größer ist als sein Vorgänger, seine neue Kompetenz jedoch vor allem aus Innovationen im Training zieht. Beispielsweise erhielt das Modell Feedback, das seine Fähigkeiten im logischen Denken verbessern sollte. Anthropic behauptet, dass Claude 3.5 Sonnet die besten Modelle von OpenAI, Google und Facebook in populären AI-Benchmarks übertrifft.
Die Bedeutung von Benchmarks und echten Anwendungen
Es ist jedoch wichtig zu beachten, dass Fortschritte in der AI anhand herkömmlicher Benchmarks wie den von Anthropic gepriesenen irreführend sein können. AI-Entwickler sind stark motiviert, ihre Kreationen so zu gestalten, dass sie in diesen Benchmarks gut abschneiden. Summer Yue, Forschungsleiterin bei Scale AI, betont, dass diese Benchmarks oft durch Datenverunreinigungen, inkonsistente Bewertungsmaßstäbe und unzureichend geprüfte Fachkenntnisse beeinflusst werden.
Scale AI entwickelt neue Wege, um die Intelligenz von AI zu messen, indem es Tests auf Basis geheimer Daten erstellt und die Expertise derjenigen überprüft, die Feedback zu den Fähigkeiten eines Modells geben. Yue ist optimistisch, dass Unternehmen zunehmend versuchen werden, die Intelligenz ihrer Modelle auf bedeutungsvollere Weise nachzuweisen.
Anthropic hebt solche Auswirkungen für Claude 3.5 Sonnet hervor. Unternehmen, die die neueste Version nutzen, haben ihre neu gefundene Reaktionsfähigkeit und Problemlösungsfähigkeiten als vorteilhaft befunden. Kunden wie eine Investmentfirma setzen Claude ein, um bei Programmieraufgaben zu helfen.
Noch ist unklar, wie lange die Welt auf den nächsten großen Sprung in der AI warten muss. OpenAI hat begonnen, sein nächstes großes Modell zu trainieren. In der Zwischenzeit werden neue Methoden erforderlich sein, um zu bemessen, wie nützlich die Technologie wirklich ist.