Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
Kategorien
  • Adserver
  • Affiliate Marketing
  • Agenturen
  • Allgemein
  • Anleitungen
  • Branchen
  • CMS
  • Content Marketing
  • CRM
  • CRM Anbieter
  • Datenschutz
  • Dienstleister
  • Digitales Marketing
  • Display Advertising
  • E-Commerce
  • Entwickler
  • FAQ
  • Jobs
  • KI
  • Marketing
  • Network Marketing
  • News
  • Newsletter Marketing
  • Online Marketing
  • Personal Marketing
  • Push Notifications
  • SEA
  • SEO
  • Server Hosting
  • Social Advertising
  • Social Media
  • Technologien
  • Tipps & Tricks
  • Tools
  • Tracking
  • Wissen
Bei Google Podcast anhören
Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
  • News

Menschliche Trainer und CriticGPT: Die Zukunft von ChatGPT enthüllt

  • Thomas Harnisch
  • 28.06.2024 02:01
Menschliche Trainer und CriticGPT: Die Zukunft von ChatGPT enthüllt
Symbolfoto
Total
1
Shares
0
0
1
  • Ein Heer von menschlichen Trainern hat maßgeblich zum Erfolg von ChatGPT beigetragen.
  • Die Technik des Reinforcement Learning mit menschlichem Feedback (RLHF) hilft, KI-Modelle kohärenter und weniger anstößig zu machen.
  • OpenAI hat das Modell CriticGPT entwickelt, das Fehler findet, die menschliche Trainer übersehen könnten, besonders bei der Bewertung von Code.
  • Die Integration von CriticGPT in das RLHF-Stack könnte die Genauigkeit und Intelligenz von KI-Modellen weiter verbessern.
  • Langfristig könnte die Technik dazu beitragen, vertrauenswürdigere und an menschlichen Werten orientierte KI-Modelle zu trainieren.

Eines der wesentlichen Elemente, das ChatGPT zu einem durchschlagenden Erfolg verholfen hat, ist ein Heer von menschlichen Trainern. Diese geben dem Modell hinter dem Bot Anleitungen, was als gute und schlechte Ausgabe gilt. Nun könnte das Hinzufügen von noch mehr KI zur Unterstützung dieser menschlichen Trainer dazu beitragen, dass KI-Helfer intelligenter und zuverlässiger werden. In der Entwicklung von ChatGPT hat OpenAI die Nutzung von Reinforcement Learning mit menschlichem Feedback, oder RLHF, vorangetrieben. Diese Technik verwendet Eingaben von menschlichen Testern, um ein KI-Modell zu verfeinern, sodass dessen Ausgabe kohärenter, weniger anstößig und genauer beurteilt wird.

Die Bedeutung des Feedbacks

Der Input, den die Trainer geben, fließt in einen Algorithmus ein, der das Verhalten des Modells steuert. Diese Technik hat sich als entscheidend erwiesen, sowohl um Chatbots zuverlässiger und nützlicher zu machen als auch um deren Fehlverhalten zu verhindern. „RLHF funktioniert sehr gut, hat aber einige Schlüssellimitierungen“, sagt Nat McAleese, ein Forscher bei OpenAI, der an der neuen Arbeit beteiligt ist. Eines der Probleme liegt darin, dass menschliches Feedback inkonsistent sein kann. Ein weiteres ist die Schwierigkeit, dass selbst erfahrene Menschen extrem komplexe Ausgaben, wie anspruchsvollen Softwarecode, bewerten können.

OpenAI hat ein neues Modell entwickelt, indem es ihr leistungsstärkstes Angebot, GPT-4, verfeinert hat, um menschliche Trainer zu unterstützen, die mit der Bewertung von Code beauftragt sind. Das Unternehmen stellte fest, dass das neue Modell, genannt CriticGPT, Fehler finden konnte, die Menschen übersehen hatten. Menschliche Richter fanden seine Kritiken zu Code 63 Prozent der Zeit besser. OpenAI wird in die Zukunft blicken und erwägen, den Ansatz auf Bereiche jenseits von Code auszudehnen.

Erweiterte Anwendungen

„Wir beginnen damit, diese Technik in unserem RLHF-Chat-Stack zu integrieren“, sagt McAleese. Zwar merkt er an, dass der Ansatz nicht perfekt sei und auch CriticGPT Fehler machen könne, indem es Halluzinationen produziert. Doch könnte diese Technik dazu beitragen, OpenAIs Modelle sowie Werkzeuge wie ChatGPT durch die Reduzierung von Fehlern im menschlichen Training genauer zu machen. Weiterhin könnte sich dies als entscheidend erweisen, um KI-Modelle viel intelligenter zu machen, da es Menschen ermöglichen könnte, eine KI zu trainieren, die ihre eigenen Fähigkeiten übertrifft. „Und da die Modelle immer besser werden, vermuten wir, dass die Menschen mehr Hilfe benötigen werden“, fügt McAleese hinzu.

Die neue Technik ist eine von vielen, die derzeit entwickelt werden, um große Sprachmodelle zu verbessern und mehr Fähigkeiten aus ihnen herauszuholen. Dies ist auch Teil eines Bestrebens, sicherzustellen, dass sich KI akzeptabel verhält, selbst wenn sie leistungsfähiger wird. Erst vor wenigen Wochen hat Anthropic, ein Konkurrent von OpenAI, der von Ex-OpenAI-Mitarbeitern gegründet wurde, die Einführung seines eigenen Chatbots Claude bekannt gegeben. Dies erlangte Aufmerksamkeit dank Verbesserungen im Trainingsregime des Modells und den Daten, mit denen es gefüttert wurde.

Langfristige Auswirkungen

Die neue Technik könnte OpenAI dabei helfen, immer leistungsfähigere KI-Modelle zu trainieren, während sie gleichzeitig sicherstellt, dass deren Ausgaben vertrauenswürdiger und mehr mit menschlichen Werten übereinstimmend sind. Dies gilt insbesondere, falls es dem Unternehmen gelingt, diese Technik auf mehr Bereiche als nur den Codeeinsatz auszuweiten. OpenAI hat zudem angekündigt, dass es sein nächstes großes KI-Modell trainiert und ernsthaft daran arbeitet, sicherzustellen, dass es sich korrekt verhält.

Diese Weiterentwicklungen folgen einer intensiven Phase, in der die langfristigen Risiken der KI bewertet werden. Die Gruppe, die sich dieser Aufgabe widmet, wurde von Ilya Sutskever, einem Mitgründer des Unternehmens und ehemaligen Vorstandsmitglied, koordiniert. Sutskever sorgte kurzfristig für Aufruhr, als er CEO Sam Altman kurzzeitig verdrängte, bevor er dazu beitrug, Altman wieder in seine Position zurückzubringen. Einige Mitglieder dieses Teams haben seitdem das Unternehmen verlassen, während es eiligst daran arbeitet, mächtige KI-Algorithmen zu entwickeln und zu kommerzialisieren.

Mehr zum Thema:
  • Die besten 50 Seo Tipps für Einsteiger
    Die 50 besten SEO Tipps für Einsteiger
  • Revolution im KI-Bereich: Warum ChatGPT alles verändert!
    Revolution im KI-Bereich: Warum ChatGPT alles verändert!
  • SEO
    SEO Optimierung: Wie Sie Ihre Seiten für eine…
Total
1
Shares
Share 0
Tweet 0
Pin it 1
Avatar-Foto
Thomas Harnisch

Thomas Harnisch ist Senior Online Marketing Manager mit über 17 Jahren Berufserfahrung, davon mehr als 8 Jahre in der Touristik. Als Hobbyfotograf und -koch probiert Thomas Harnisch gerne neue technische Geräte aus. Wenn er nicht gerade fotografiert oder eine kulinarische Kreation zaubert, verbringt er seine Zeit mit seiner Frau und seiner kleinen Tochter. Mit seinem neuen Blog agentur.rocks möchte Thomas gerne sein Wissen und seine gemachten Erfahrungen teilen.

Dir könnte auch gefallen
Entdecke die luxuriöse Einkaufsliste der berühmtesten Superschurken!
Weiterlesen
  • News
Entdecke die luxuriöse Einkaufsliste der berühmtesten Superschurken!
  • Thomas Harnisch
  • 23.05.2025 16:04
Weiterlesen
  • News
Warum der 5. Juni Nintendo für immer verändern könnte
  • Thomas Harnisch
  • 23.05.2025 15:07
Die Geheimnisse hinter dem süchtig machenden NYT-Wortpuzzle!
Weiterlesen
  • News
Die Geheimnisse hinter dem süchtig machenden NYT-Wortpuzzle!
  • Thomas Harnisch
  • 23.05.2025 14:46
Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Anzeigen
Peter













Neueste Beiträge
  • Entdecke die luxuriöse Einkaufsliste der berühmtesten Superschurken!
    Entdecke die luxuriöse Einkaufsliste der berühmtesten Superschurken!
  • Warum der 5. Juni Nintendo für immer verändern könnte
  • Die Geheimnisse hinter dem süchtig machenden NYT-Wortpuzzle!
    Die Geheimnisse hinter dem süchtig machenden NYT-Wortpuzzle!
  • Klicken Sie hier, um das neue süchtig machende Puzzle zu meistern!
    Klicken Sie hier, um das neue süchtig machende Puzzle zu meistern!
  • Entdecke das Mini-Rätsel, das dein Gehirn blitzschnell fordert!
    Entdecke das Mini-Rätsel, das dein Gehirn blitzschnell fordert!
  • Entdecken Sie das Geheimnis hinter dem NYT-Kreuzworträtsel!
Agentur.rocks
  • Datenschutzerklärung
  • Impressum
  • Sitemap
  • Gastbeiträge
  • Portale und Profile
  • Cookies
Der Blog für Marketing-Interessierte
Marketing/CRM
  • Die 50 wichtigsten Marketingbegriffe
  • CRM Systeme
  • CRM – Customer Relationship Management
  • CRM-Marketing Kundenloyalität
  • CRM Systeme für kleine Unternehmen 
  • Network Marketing Firmen
SEO
  • SEO Optimierung
  • Die 50 besten SEO Tipps
  • SEO Optimierung Preis
  • SEO Optimierung kostenlos
E-Commerce
  • E-Commerce
  • E-Commerce Umsatz steigern
  • E-Commerce Online Marktplatz
  • E-Commerce Nische
  • Network Marketing Firmen

Gib dein Suchwort ein und drücke Enter.