- OpenAI kündigte ein kostengünstiges “Mini” Modell namens GPT-4o mini an, das 60 Prozent günstiger als das bisher günstigste Modell ist und eine höhere Leistung bietet. Das neue Modell soll die Verbreitung von Künstlicher Intelligenz fördern und nimmt die zunehmende Konkurrenz im KI-Cloud-Markt sowie das wachsende Interesse an kleinen Open Source KI-Modellen in den Blick. Olivier Godement erklärt, dass die Kostensenkung durch verbesserte Modellarchitektur, verfeinerte Trainingsdaten und Trainingsregime erreicht wurde. Meta plant, die größte Version von Llama 3 mit 400 Milliarden Parametern zu veröffentlichen, während Start-ups wie Anthropic, Cohere und AI21 ähnliche Angebote entwickeln. Godement betont die Bedeutung von Sicherheitsaspekten in OpenAIs Cloud-Angeboten und sieht möglicherweise zukünftig Modelle vor, die Kunden auf ihren eigenen Geräten verwenden können.
OpenAI kündigte heute ein kostengünstiges “Mini” Modell an, das es mehr Unternehmen und Programmen ermöglicht, von seiner Technologie zu profitieren. Das neue Modell, benannt als GPT-4o mini und ab sofort erhältlich, ist 60 Prozent günstiger als das bisher günstigste Modell von OpenAI und bietet dabei eine höhere Leistung, so das Unternehmen. Dieser Schritt wird als Teil eines Bestrebens zur Verbreitung von Künstlicher Intelligenz (KI) möglichst breit charakterisiert, spiegelt jedoch auch die zunehmende Konkurrenz unter KI-Cloud-Anbietern sowie das wachsende Interesse an kleinen und frei zugänglichen Open Source KI-Modellen wider. Erwartungsgemäß wird Meta nächste Woche die größte Version seines sehr leistungsfähigen kostenlosen Angebots, Llama 3, vorstellen.
Olivier Godement, Produktmanager bei OpenAI und verantwortlich für das neue Modell, erklärt: “Der ganze Sinn von OpenAI besteht darin, KI sicher zu entwickeln und zu verbreiten und sie weiträumig zugänglich zu machen.” Ein intelligentes System zu einem niedrigeren Preis bereitzustellen, sei eine der effektivsten Methoden dafür. Godement zufolge wurde das kostengünstigere Angebot entwickelt, indem die Modellarchitektur verbessert und die Trainingsdaten sowie das Trainingsregimen verfeinert wurden. GPT-4o mini übertrifft andere “kleine” Modelle auf dem Markt in mehreren gängigen Benchmarks, sagt OpenAI.
Zunehmende Konkurrenz im KI-Markt
Dank der bemerkenswerten Fähigkeiten seines Chatbots, der Ende 2022 debütierte, hat OpenAI eine signifikante Stellung im Cloud-KI-Markt erlangt. Das Unternehmen erlaubt externen Nutzern den Zugang zu dem großen Sprachmodell, das ChatGPT antreibt, genannt GPT-4o, gegen eine Gebühr. Es bietet auch ein weniger leistungsstarkes Modell, genannt GPT-3.5 Turbo, zu etwa einem Zehntel der Kosten von GPT-4o an. Das durch den Erfolg von ChatGPT ausgelöste Interesse an Sprachmodellen hat Wettbewerber dazu veranlasst, ähnliche Angebote zu entwickeln. Google, ein Pionier in der KI-Technologie, hat große Anstrengungen unternommen, ein großes Sprachmodell und einen Chatbot unter dem Markennamen Gemini zu bauen und zu kommerzialisieren. Start-ups wie Anthropic, Cohere und AI21 haben Millionen gesammelt, um ihre eigenen großen Sprachmodelle für Geschäftskunden und Entwickler zu entwickeln und zu vermarkten.
Veröffentlichung und Open Source Modelle
Der Bau der leistungsstärksten großen Sprachmodelle erfordert enorme finanzielle Ressourcen, aber einige Unternehmen haben sich entschieden, ihre Kreationen als Open Source zu veröffentlichen, um Entwickler für ihre Ökosysteme zu gewinnen. Im April veröffentlichte Meta sein bisher leistungsstärkstes kostenloses Modell. Das Unternehmen stellte eine kleine Version des Modells mit 8 Milliarden Parametern – ein grober Maßstab für die Portabilität und Komplexität eines Modells – sowie eine leistungsstärkere, mittelgroße Version mit 70 Milliarden Parametern vor. Das mittelgroße Modell kommt in mehreren Benchmark-Scores nah an OpenAIs bestes Angebot heran.
Mehrere Quellen bestätigten gegenüber WIRED, dass Meta plant, die größte Version von Llama 3 mit 400 Milliarden Parametern am 23. Juli zu veröffentlichen, obwohl sie einräumen, dass sich das Veröffentlichungsdatum ändern könnte. Es ist unklar, wie leistungsfähig diese Version von Llama 3 sein wird, aber einige Unternehmen haben sich schon für kleinere und kostenlose Modelle entschieden, da sie günstiger und anpassbar sind und eine größere Kontrolle über das Modell und die ihm zugeführten Daten bieten. Godement gibt zu, dass sich die Bedürfnisse der Kunden weiterentwickeln. “Wir sehen immer mehr, dass Entwickler und Unternehmen kleine und große Modelle kombinieren, um das beste Produkterlebnis zu einem für sie sinnvollen Preis und mit angemessener Latenzzeit zu schaffen,” sagt er.
Zukunftsperspektiven und Sicherheitsaspekte
Godement erklärt, dass OpenAIs Cloud-Angebote Kunden Modelle zur Verfügung stellen, die mehr Sicherheitstests durchlaufen haben als die der Konkurrenz. Er fügt hinzu, dass OpenAI in Zukunft Modelle entwickeln könnte, die Kunden auf ihren eigenen Geräten verwenden können. “Wenn wir eine massive Nachfrage sehen, könnten wir diese Tür öffnen”, sagt er.