- OpenAI kündigt Einführung fortschrittlicher Sprachfunktion und fünf neuer Stimmen für Plus- und Teams-Abonnenten an.
- Enterprise- und Edu-Abonnenten erhalten nächste Woche Zugang zur fortschrittlichen Sprachfunktion.
- Neue Sprachfunktion ermöglicht direkte Gespräche mit dem Chatbot und läuft auf dem GPT-4o-Modell.
- Zusätzlich werden benutzerdefinierte Anweisungen und eine Gedächtnisfunktion eingeführt, die vorherige Gespräche erinnern kann.
- Die Funktion ist in der EU, dem Vereinigten Königreich, der Schweiz, Island, Norwegen und Liechtenstein nicht verfügbar.
OpenAI verkündete am Dienstag via Twitter, dass es in dieser Woche damit beginnen wird, seine fortschrittliche Sprachfunktion sowie fünf neue Stimmen für die konversationelle KI für Abonnenten der Plus- und Teams-Tarife einzuführen. Ab nächster Woche werden Enterprise- und Edu-Abonnenten ebenfalls Zugang erhalten.
Die fortschrittliche Sprachfunktion wird für alle Plus- und Team-Nutzer in der ChatGPT-App im Laufe der Woche ausgerollt. Während Sie geduldig gewartet haben, hat OpenAI benutzerdefinierte Anweisungen, eine Gedächtnisfunktion, fünf neue Stimmen und verbesserte Akzente hinzugefügt. Die KI kann nun auch „Entschuldigung, dass ich zu spät bin“ in über 50 Sprachen sagen.
Neue Stimmen und verbesserte Funktionalitäten
Die fortschrittliche Sprachfunktion, die auf dem GPT-4o-Modell läuft, ermöglicht es Nutzern, schriftliche Texteingaben zu umgehen und direkt mit dem Chatbot zu sprechen. Diese Funktion wurde erstmals auf einer Veranstaltung vorgestellt und im Juli zur Beta-Testung freigegeben. Nun können alle zahlenden Abonnenten diese Funktion selbst ausprobieren.
Das Unternehmen hat auch fünf neue Stimmen für den Chatbot vorgestellt: Arbor, Maple, Sol, Spruce und Vale. Diese werden sowohl im Standard- als auch im fortschrittlichen Sprachmodus verfügbar sein und die vier bestehenden Stimmen – Breeze, Juniper, Cove und Ember – ergänzen, die ChatGPT bereits anbietet. OpenAI betonte, dass Video- und Bildschirmfreigabe derzeit nicht im fortschrittlichen Sprachmodus unterstützt werden, diese Funktionen jedoch zu einem späteren Zeitpunkt hinzukommen werden.
Kundenspezifische Anweisungen und Gedächtnisfunktion
Darüber hinaus integriert OpenAI zwei Tools, um die Fähigkeiten der fortschrittlichen Sprachfunktion an den restlichen textbasierten Chatbot-Einsatz anzupassen: benutzerdefinierte Anweisungen und eine Gedächtnisfunktion. Anfangs konnte die fortschrittliche Sprachfunktion nur Informationen aus der aktuellen Unterhaltung referenzieren. Mit der Gedächtnisfunktion wird die KI auch Details aus vorherigen Gesprächen abrufen können, wodurch die Notwendigkeit entfällt, dass Nutzer sich wiederholen müssen. Ebenso sollen benutzerdefinierte Anweisungen als Grundregeln für das Modell fungieren, um entsprechende Antworten zu generieren, beispielsweise könnten alle codierungsbezogenen Antworten in Python dargestellt werden.
Plus- und Teams-Abonnenten erhalten eine In-App-Benachrichtigung, sobald die Funktion für ihr Konto verfügbar ist. Leider ist die fortschrittliche Sprachfunktion in der EU, dem Vereinigten Königreich, der Schweiz, Island, Norwegen und Liechtenstein nicht verfügbar.
Google Konkurrenz
ChatGPT ist nicht die einzige KI, die direkt mit ihren Nutzern kommunizieren kann. Die Ankündigung von OpenAI kommt weniger als zwei Wochen nach der Veröffentlichung von Googles Gemini Live, die ebenfalls sprachbasierte Interaktionen ermöglicht, und das sogar für Nutzer der kostenlosen Stufe.