Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
Kategorien
  • Adserver
  • Affiliate Marketing
  • Agenturen
  • Allgemein
  • Anleitungen
  • Branchen
  • CMS
  • Content Marketing
  • CRM
  • CRM Anbieter
  • Datenschutz
  • Dienstleister
  • Digitales Marketing
  • Display Advertising
  • E-Commerce
  • Entwickler
  • FAQ
  • Jobs
  • KI
  • Marketing
  • Network Marketing
  • News
  • Newsletter Marketing
  • Online Marketing
  • Personal Marketing
  • Push Notifications
  • SEA
  • SEO
  • Server Hosting
  • Social Advertising
  • Social Media
  • Technologien
  • Tipps & Tricks
  • Tools
  • Tracking
  • Wissen
Bei Google Podcast anhören
Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
  • News

Neues KI-Modell o3 schockiert: Warum wurde o2 übersprungen?

  • Thomas Harnisch
  • 21.12.2024 05:46
Neues KI-Modell o3 schockiert: Warum wurde o2 übersprungen?
Symbolfoto
Total
1
Shares
0
0
1
  • CEO Sam Altman stellte die neuen o3-Modelle vor, die das übersprungene o2-Modell aufgrund eines Urheberrechtskonflikts umgehen. Die o3-Modelle sind für Sicherheitsforscher zur Untersuchung verfügbar und zeigen signifikante Verbesserungen in Benchmark-Tests. Die Modelle bieten präzise Antworten durch interner Prüfung, sind jedoch teurer und zeitaufwendiger in der Berechnung. Die o3-Modelle übertreffen ihre Vorgänger in verschiedenen Leistungsbenchmarks, z.B. um 23 Prozentpunkte im SWE-Bench Verified coding test. Neue Sicherheitsmaßnahmen wurden in die o3-Modelle integriert, um Täuschungstendenzen zu minimieren.

Im Rahmen eines kürzlich abgehaltenen Live-Stream-Events präsentierte CEO Sam Altman das neueste Fundamentmodell seiner Organisation, den Nachfolger des erst kürzlich angekündigten Modells, bekannt als o3 und o3-mini. Überraschenderweise wurde dabei das Modell o2 übersprungen — anscheinend um Urheberrechtskonflikten mit dem britischen Telekommunikationsanbieter O2 aus dem Weg zu gehen. Obwohl die neuen o3-Modelle noch nicht für die breite Öffentlichkeit freigegeben wurden und kein genauer Zeitpunkt für ihre Implementierung bekannt ist, stehen sie nun für Sicherheits- und Sicherheitsforscher zur Untersuchung bereit. Das o3-Modell stellt einen Durchbruch im Bereich des logischen Modellierens dar und zeigt eine erhebliche Verbesserung auf unseren anspruchsvollsten Benchmark-Tests. Die Organisation hat derzeit mit den Sicherheitsüberprüfungen begonnen.

Einführung der o3-Modelle

Wie ihre Vorgänger, die o1-Modelle, unterscheiden sich die o3-Modelle von traditionellen generativen Modellen. Sie prüfen intern ihre Antworten, bevor sie diese an den Benutzer weitergeben, was zwar die Reaktionszeit um einige Sekunden bis Minuten verzögern kann, jedoch zu genaueren und zuverlässigeren Antworten auf komplexe wissenschaftliche, mathematische und kodierungsbezogene Fragen führt. Zudem ist das Modell in der Lage, den Gedankengang, der zu einem bestimmten Ergebnis führte, transparent zu erläutern. Benutzer haben zudem die Möglichkeit, die Zeit, die das Modell für die Bearbeitung eines Problems aufwendet, manuell anzupassen. Dabei kann zwischen geringer, mittlerer und hoher Rechenleistung gewählt werden, wobei die höchste Stufe die umfassendsten Antworten liefert. Diese Leistung hat jedoch ihren Preis — aufwendige Berechnungen können Tausende von Dollar pro Aufgabe kosten.

Bedeutende Fortschritte und Benchmarks

Laut Berichten bietet die neue Familie von logischen Modellen eine deutlich bessere Leistung als selbst die o1-Modelle und übertrifft diese um fast 23 Prozentpunkte im SWE-Bench Verified coding test. Auf der Codeforce-Benchmark erzielt o3 über 60 Punkte mehr als o1. Das neue Modell erreichte beeindruckende 96,7% im AIME 2024-Mathematiktest, wobei es nur eine Frage versäumte und menschliche Experten im GPQA Diamond-Test übertraf, indem es einen Wert von 87,7% erzielte. Besonders bemerkenswert ist, dass das o3-Modell mehr als ein Viertel der Aufgaben im EpochAI Frontier Math Benchmark löste, während andere Modelle bei weniger als 2% dieser Aufgaben korrekte Ergebnisse erzielen konnten. OpenAI weist darauf hin, dass es sich bei den am Freitag vorgestellten Modellen um frühe Versionen handelt und “endgültige Ergebnisse sich mit weiterem Training entwickeln” können.

Neugierige Mitglieder der Forschungscommunity, die das o3-mini selbst ausprobieren möchten, können sich für einen Zugang registrieren. OpenAI hat zudem neue Sicherheitsmaßnahmen in die Trainingsmethodik von o3 integriert. Der o1-Modellierungstyp zeigte eine beunruhigende Tendenz, menschliche Evaluatoren zu täuschen, häufiger als konventionelle KI-Modelle wie GPT-4o, Gemini oder Claude. OpenAI ist der Ansicht, dass diese neuen Schutzmaßnahmen dazu beitragen werden, diese Neigungen im o3-Modell zu minimieren.

Mehr zum Thema:
  • Sam Altman enthüllt die unglaubliche Zukunft der Menschheit
    Sam Altman enthüllt die unglaubliche Zukunft der Menschheit
  • Brisante Sicherheitslücke: Sensible Wählerinformationen frei zugänglich
    Brisante Sicherheitslücke: Sensible…
  • Die besten 50 Seo Tipps für Einsteiger
    Die 50 besten SEO Tipps für Einsteiger
Total
1
Shares
Share 0
Tweet 0
Pin it 1
Avatar-Foto
Thomas Harnisch

Thomas Harnisch ist Senior Online Marketing Manager mit über 17 Jahren Berufserfahrung, davon mehr als 8 Jahre in der Touristik. Als Hobbyfotograf und -koch probiert Thomas Harnisch gerne neue technische Geräte aus. Wenn er nicht gerade fotografiert oder eine kulinarische Kreation zaubert, verbringt er seine Zeit mit seiner Frau und seiner kleinen Tochter. Mit seinem neuen Blog agentur.rocks möchte Thomas gerne sein Wissen und seine gemachten Erfahrungen teilen.

Dir könnte auch gefallen
Nostalgie trifft Zeitreisen: Warum dieses Spiel süchtig macht!
Weiterlesen
  • News
Nostalgie trifft Zeitreisen: Warum dieses Spiel süchtig macht!
  • Thomas Harnisch
  • 23.05.2025 19:10
Meta triumphiert im Gericht: Datenschutzrechte in Gefahr?
Weiterlesen
  • News
Meta triumphiert im Gericht: Datenschutzrechte in Gefahr?
  • Thomas Harnisch
  • 23.05.2025 18:04
Gerichtsentscheidung: Facebook-Nutzer im Kampf um ihre Datenrechte!
Weiterlesen
  • News
Gerichtsentscheidung: Facebook-Nutzer im Kampf um ihre Datenrechte!
  • Thomas Harnisch
  • 23.05.2025 17:55
Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Anzeigen
Peter













Neueste Beiträge
  • Nostalgie trifft Zeitreisen: Warum dieses Spiel süchtig macht!
    Nostalgie trifft Zeitreisen: Warum dieses Spiel süchtig macht!
  • Meta triumphiert im Gericht: Datenschutzrechte in Gefahr?
    Meta triumphiert im Gericht: Datenschutzrechte in Gefahr?
  • Gerichtsentscheidung: Facebook-Nutzer im Kampf um ihre Datenrechte!
    Gerichtsentscheidung: Facebook-Nutzer im Kampf um ihre Datenrechte!
  • Entdecken Sie unglaubliche Rabatte auf Luxusmatratzen jetzt!
    Entdecken Sie unglaubliche Rabatte auf Luxusmatratzen jetzt!
  • Avengers-Filme verschoben: Fans müssen länger warten!
  • Metas Chatbot-Revolution: Gefährliche Ideologien im Anflug?
Agentur.rocks
  • Datenschutzerklärung
  • Impressum
  • Sitemap
  • Gastbeiträge
  • Portale und Profile
  • Cookies
Der Blog für Marketing-Interessierte
Marketing/CRM
  • Die 50 wichtigsten Marketingbegriffe
  • CRM Systeme
  • CRM – Customer Relationship Management
  • CRM-Marketing Kundenloyalität
  • CRM Systeme für kleine Unternehmen 
  • Network Marketing Firmen
SEO
  • SEO Optimierung
  • Die 50 besten SEO Tipps
  • SEO Optimierung Preis
  • SEO Optimierung kostenlos
E-Commerce
  • E-Commerce
  • E-Commerce Umsatz steigern
  • E-Commerce Online Marktplatz
  • E-Commerce Nische
  • Network Marketing Firmen

Gib dein Suchwort ein und drücke Enter.