- OpenAI hat die ersten open-weight Modelle seit über fünf Jahren vorgestellt, darunter gpt-oss-120b und gpt-oss-20b. Die Modelle sind kostenlos auf Hugging Face verfügbar und können lokal auf Endgeräten ausgeführt werden. Ein offener Zugang zu den Gewichten ermöglicht es, in die internen Parameter der Modelle Einblick zu nehmen. Beide Modelle sind unter der Apache 2.0 Lizenz erhältlich, was kommerzielle Nutzung erlaubt. Die gpt-oss-Modelle bieten starke Benchmark-Ergebnisse und innovative Funktionalitäten im Vergleich zu früheren OpenAI-Veröffentlichungen.
OpenAI hat kürzlich seine ersten open-weight Modelle seit über fünf Jahren vorgestellt. Die beiden Sprachmodelle, gpt-oss-120b und gpt-oss-20b, können lokal auf Endgeräten ausgeführt und für spezifische Zwecke angepasst werden. Dies stellt einen Kurswechsel dar, da OpenAI bisher vorwiegend auf proprietäre Veröffentlichungen gesetzt hatte. Sam Altman, der CEO von OpenAI, erklärte per E-Mail: “Wir freuen uns, dieses Modell, das das Ergebnis von Milliarden Dollar an Forschung darstellt, der Welt zugänglich zu machen, um KI in die Hände möglichst vieler Menschen zu legen.” Diese beiden Modelle sind offiziell kostenlos auf Hugging Face verfügbar, einer beliebten Plattform für Entwickler.
Einblicke in Open-Weight Modelle
Was ein open-weight Modell besonders auszeichnet, ist die Verfügbarkeit seiner „Gewichte“, die es jedem ermöglichen, in die internen Parameter Einsicht zu nehmen, um zu verstehen, wie es Informationen verarbeitet. OpenAI sieht dies nicht als Konkurrenz zu seinen kostenpflichtigen Diensten, sondern als Ergänzung. Ein bemerkenswerter Unterschied zu ChatGPT besteht darin, dass die gpt-oss Modelle auch ohne Internetverbindung und innerhalb von Firewalls betrieben werden können. Die gpt-oss-Modelle basieren auf einer neuen Methodik, die letztes Jahr vorgestellt wurde. Diese generieren nicht nur Resultate, sondern durchlaufen mehrere Schritte, um auf Anfragen zu reagieren. Obwohl sie rein textbasiert sind, können sie das Web durchsuchen, cloudbasierte Modelle zur Hilfe heranziehen, Code ausführen und Software als API navigieren.
Technische Details und Lizenzierung
Das kleinere Modell, gpt-oss-20b, ist kompakt genug, um auf einem normalen Endgerät mit mehr als 16 GB Arbeitsspeicher ausgeführt zu werden. Beide Modelle sind unter der Apache 2.0 Lizenz erhältlich, was die kommerzielle Nutzung und Integration in andere lizenzierte Software ermöglicht. Die Ankündigung dieser Modelle im März wurde aus Sicherheitsgründen verzögert, um sicherzustellen, dass sie nicht für unerwünschte Zwecke missbraucht werden können. Eric Wallace, Sicherheitsforscher bei OpenAI, betont, dass man das Modell intern auf potenzielle Missbrauchsrisiken abgestimmt hat. Während der Tests erreichten sie jedoch keine bedenklichen Risikowerte.
Vergleich zu früheren Veröffentlichungen
Wie schneiden diese Modelle im Vergleich zu anderen OpenAI-Veröffentlichungen ab? Chris Koch, ein Forscher von OpenAI, bemerkte in einer Präsentation, dass die Benchmark-Ergebnisse beider Modelle recht stark sind. Besonders gpt-oss-120b zeigte eine Performance nahe an OpenAIs proprietären Modellen, übertraf diese in manchen Bewertungen sogar. Diese Veröffentlichung steht im Kontext eines zunehmend kompetitiven Marktes, in dem Talente von Unternehmen wie OpenAI und Meta regelrecht umworben werden. Sam Altman betont den Wunsch, Innovationen im Bereich open-weight Modelle durch amerikanische Werte voranzutreiben und somit ein Höchstmaß an Nutzen für die Allgemeinheit zu bieten.