OpenAI schlägt zurück: Wie o3-mini DeepSeek übertreffen soll

DeepSeek hat in der KI-Industrie Aufsehen erregt, indem es trotz bescheidener Ressourcen beeindruckende Leistungen zeigte. OpenAI plant, im Wettlauf mit DeepSeek ein neues Modell, o3-mini, schneller als geplant zu veröffentlichen, um dessen Einfluss entgegenzuwirken. Innerhalb von OpenAI herrschen Spannungen zwischen Teams, vor allem im Hinblick auf die Priorisierung von Modellen zur Argumentationsfähigkeit versus Chat-Entwicklungen. OpenAIs Infrastrukturprojekt Stargate soll interne Engpässe reduzieren und den Abstand zu DeepSeek wieder vergrößern. Der Erfolg von DeepSeek hat Fragen über den Rechenaufwand und die Effizienz in der Modellentwicklung aufgeworfen.

Gerade etwas mehr als eine Woche ist vergangen, seit DeepSeek Wellen in der KI-Industrie geschlagen hat. Ihr neues Modell, das trotz bescheidener Ressourcen erstaunliche Leistung zeigt, sorgte für Aufsehen, vor allem bei OpenAI. Mitarbeiter zweifelten an der Rechtmäßigkeit von DeepSeeks Methoden, vermuteten, dass das Start-up sich unerlaubt Wissen von OpenAIs Modellen angeeignet hatte. Die Erfolge von DeepSeek führten sogar dazu, dass die Finanzwelt den hohen Rechenaufwand, den Unternehmen wie OpenAI betreiben, in Frage stellte. „DeepSeek R1 ist der Sputnik-Moment der KI“, schrieb der bekannte Erfinder Marc Andreessen.

OpenAI’s Reaktion

In Reaktion auf diesen Druck wird OpenAI heute ein neues Modell vorstellen, früher als geplant. Das Modell, o3-mini, erscheint sowohl für die API als auch für den Chat. Es soll die Argumentationsfähigkeiten von o1 mit der Geschwindigkeit von 4o kombinieren: schnell, kostengünstig und intelligent, mit dem klaren Ziel, DeepSeek zu übertreffen. Niko Felix, ein Sprecher von OpenAI, betont jedoch, dass o3-mini bereits lange vor DeepSeeks Durchbruch in Entwicklung war.

Innerhalb OpenAIs herrscht nun ein Gefühl der Dringlichkeit. Der zunehmende Einfluss von DeepSeek hat das Unternehmen bewogen, effizienter zu werden, um im Konkurrenzkampf nicht ins Hintertreffen zu geraten. Ein Teil der Problematik liegt darin, dass OpenAI einst als gemeinnützige Forschungseinrichtung begann, nun jedoch mit dem Anspruch, profitabel zu sein, arbeitet.

Spannungen im Unternehmen

Ein Ringen um Macht und Ressourcen scheint zwischen den verschiedenen Bereichen von OpenAI zu herrschen. Die Missstimmung zwischen den Teams, die an fortschrittlicher Argumentation arbeiten und jenen, die Chats entwickeln, konnte bisher nicht beigelegt werden. Einige Mitarbeiter drängen auf ein einheitliches Chatprodukt, das je nach Komplexität der Anfrage erkennen kann, welches Modell zum Einsatz kommen sollte. Diese Vision bleibt jedoch bislang unerfüllt, und Anwender von ChatGPT werden dazu angehalten, selbstständig zwischen verschiedenen Modelleinstellungen zu wählen.

Ein Insider berichtet, dass das Chat-Produkt den größten Umsatzanteil generiert, während o1 von der Führung offensichtlich bevorzugt behandelt wird. Dies führt zu Frustrationen, besonders unter ehemaligen Mitarbeitern, die sich mehr Engagement der Führungsriege für Chat wünschten.

Technische Herausforderungen

Die Einführung von o1 und die prinzipiellen Einschränkungen des „berry“ Code-Stacks bilden zusätzlich Herausforderungen. Der Stack wurde für Experimente konzipiert, bot jedoch nicht die strukturelle Stabilität, die für ein Massenprodukt wie Chat nötig gewesen wäre. Interne Bestrebungen, diese Technologien zu vereinen, wurden Beobachtern zufolge nie konsequent umgesetzt. Mitarbeiter sahen sich genötigt, unter Priorisierung des berry-Stacks zu arbeiten, was Unmut unter denjenigen schürte, die an der Chat-Entwicklung beteiligt waren.

Die Industrie ist sich uneins, wie sie den Erfolg von DeepSeek interpretieren soll. Einige sind der Ansicht, dass die Anzahl benötigter Chips überschätzt wurde, andere argumentieren, dass Effizienzgewinne in der Modellentwicklung letztlich nicht die Bedeutung von Rechenkraft schmälern werden. Miles Brundage, ein unabhängiger KI-Forscher, der bei OpenAI tätig war, meint: „Am Ende wird das Unternehmen mit der besten Hardware dennoch triumphieren.“

Zukunftsausblick

OpenAI setzt große Hoffnungen auf sein neues Infrastrukturprojekt, Stargate genannt, das die internen Engpässe lindern soll. Ein neues Rechenzentrum in Texas ist bereits im Bau. Details des Projekts halten sich jedoch in Grenzen, doch Gerüchte deuten auf eine massive Erweiterung der Kapazitäten hin. Mit diesem Schritt könnte OpenAI den Abstand zu DeepSeek wieder etablieren und ihre Vision für die künstliche Intelligenz langfristig umsetzen.