Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
Kategorien
  • Adserver
  • Affiliate Marketing
  • Agenturen
  • Allgemein
  • Anleitungen
  • Branchen
  • CMS
  • Content Marketing
  • CRM
  • CRM Anbieter
  • Datenschutz
  • Dienstleister
  • Digitales Marketing
  • Display Advertising
  • E-Commerce
  • Entwickler
  • FAQ
  • Jobs
  • KI
  • Marketing
  • Network Marketing
  • News
  • Newsletter Marketing
  • Online Marketing
  • Personal Marketing
  • Push Notifications
  • SEA
  • SEO
  • Server Hosting
  • Social Advertising
  • Social Media
  • Technologien
  • Tipps & Tricks
  • Tools
  • Tracking
  • Wissen
Bei Google Podcast anhören
Agentur.rocks
  • Technologien
    • KI
    • Adserver
    • CMS
    • CRM
    • E-Commerce
    • Tools
    • Tracking
  • Marketing
    • Affiliate Marketing
    • Content Marketing
    • Display Advertising
    • Network Marketing
    • Newsletter Marketing
    • Digitales Marketing
    • Push Notifications
    • SEA
    • SEO
    • Social Advertising
    • Personal Marketing
    • Social Media
  • Agenturen
  • Dienstleister
    • Daten Dienstleister
    • Entwickler
    • Server Hosting
  • Tools und Weiteres
    • News
    • Anleitungen
    • Wissen
    • CRM Systeme
    • Tipps & Tricks
    • FAQ
    • Jobs
    • Rechner
      • Cost per Action (CPA) berechnen
      • Cost per Click (CPC) berechnen
      • Cost per Lead (CPL) berechnen
      • Cost per View (CPV)
      • Cost per Order (CPO) berechnen
      • Kosten Umsatz Relation (KUR) berechnen
    • Datenschutz
      • Datenschutz News
      • Datenschutz Tools
  • News

Harvard revolutioniert KI-Forschung mit riesigem Bücher-Datensatz

  • Thomas Harnisch
  • 12.12.2024 05:34
Harvard revolutioniert KI-Forschung mit riesigem Bücher-Datensatz
Symbolfoto
Total
1
Shares
0
0
1
  • Harvard stellt ein Datenset von fast einer Million gemeinfreier Bücher für die KI-Entwicklung zur Verfügung. Das Datenset ist etwa fünfmal größer als vorherige Datensets für Sprachmodelle wie Metas Llama. Ziel ist es, Zugang zu qualitativ hochwertigen Daten für kleinere KI-Akteure zu ermöglichen. Die Harvard-Datenbank wird von Microsoft und OpenAI finanziell unterstützt. Die Initiative steht im Kontext globaler Bemühungen, gemeinfreies Material für KI-Entwicklung zu nutzen.

Die Harvard University hat kürzlich angekündigt, dass sie ein hochqualitatives Datenset von nahezu einer Million gemeinfreier Bücher zur Verfügung stellt, das von jedermann verwendet werden kann, um große Sprachmodelle und andere KI-Tools zu trainieren. Dieses Datenset wurde von Harvards neu initiierter Institutionellen Dateninitiative erstellt und steht unter finanzieller Förderung von Microsoft und OpenAI. Die Bücher wurden im Rahmen des Google Books-Projekts digitalisiert und unterliegen keinem Urheberrechtsschutz mehr. Verglichen mit den vorigen Datensets ist dieses etwa fünfmal so groß wie das, welches für die Ausbildung von KI-Modellen wie Metas Llama verwendet wurde. Die Sammlung umfasst verschiedene Genres, Jahrzehnte und Sprachen, darunter Werke von Shakespeare, Charles Dickens und Dante sowie unbekannte tschechische Mathematik-Lehrbücher und walisische Taschenwörterbücher.

Ein Schub für die Chancengleichheit

Greg Leppert, geschäftsführender Direktor der Institutionellen Dateninitiative, unterstreicht den Versuch, mit diesem Projekt das Spielfeld auszugleichen. Es soll der breiten Öffentlichkeit, einschließlich kleineren Akteuren in der KI-Industrie und individuellen Forschern, der Zugang zu hochgradig verfeinerten und kuratierten Inhaltsrepositorien ermöglicht werden, wie sie normalerweise nur großen Technologiekonzernen vorbehalten sind. Die Bücher haben alle eine gründliche Prüfung durchlaufen. Leppert glaubt, dass die neue gemeinfreie Datenbank zusammen mit anderen lizenzierten Materialien genutzt werden könnte, um KI-Modelle aufzubauen. Er zieht einen Vergleich zur Bedeutung von Linux als fundamentales Betriebssystem und betont, dass Firmen dennoch weitere Trainingsdaten benötigen würden, um ihre Modelle von denen der Konkurrenz abzuheben.

Öffentliche Daten für private Initiativen

Burton Davis, Vizepräsident und stellvertretender General Counsel für geistiges Eigentum bei Microsoft, betont, dass die Unterstützung des Projekts den Bemühungen entspricht, zugängliche Datenpools für KI-Startups zu schaffen, die im Interesse der Öffentlichkeit verwaltet werden. Dabei plant Microsoft keinesfalls, alle verwendeten KI-Trainingsdaten durch gemeinfreie Alternativen wie die Bücher aus der neuen Harvard-Datenbank zu ersetzen. Angesichts laufender Gerichtsverfahren, die sich mit der Nutzung bestimmter Inhalte zum KI-Training befassen, bleibt die Zukunft, wie KI-Tools gebaut werden, ungewiss. Sollten die KI-Unternehmen ihre Fälle gewinnen, könnten sie weiterhin ohne Lizenzvereinbarungen mit Rechteinhabern fortfahren. Verlieren sie jedoch, könnten umfassende Änderungen bei der Modellentwicklung erforderlich werden. Auch andere Projekte vor allem in Frankreich und anderen Ländern treiben ähnliche Initiativen voran, wobei die Harvard-Datenbank nur ein Beispiel in einer wachsenden Bewegung ist, die sich für eine verstärkte Nutzung von gemeinfreiem Material einsetzt.

Mehr zum Thema:
  • Mark Zuckerberg verschenkt die beste KI der Welt: Meta Llama 3.1
    Mark Zuckerberg verschenkt die beste KI der Welt:…
  • Die besten 50 Seo Tipps für Einsteiger
    Die 50 besten SEO Tipps für Einsteiger
  • Die besten kostenlosen CRM Systeme
    CRM – Customer Relationship Management zur…
Total
1
Shares
Share 0
Tweet 0
Pin it 1
Avatar-Foto
Thomas Harnisch

Thomas Harnisch ist Senior Online Marketing Manager mit über 17 Jahren Berufserfahrung, davon mehr als 8 Jahre in der Touristik. Als Hobbyfotograf und -koch probiert Thomas Harnisch gerne neue technische Geräte aus. Wenn er nicht gerade fotografiert oder eine kulinarische Kreation zaubert, verbringt er seine Zeit mit seiner Frau und seiner kleinen Tochter. Mit seinem neuen Blog agentur.rocks möchte Thomas gerne sein Wissen und seine gemachten Erfahrungen teilen.

Dir könnte auch gefallen
Weiterlesen
  • News
Entdecke die geheimen Filmjuwelen auf Netflix für dein Wochenende!
  • Thomas Harnisch
  • 23.05.2025 06:07
Weiterlesen
  • News
Drei überwältigende Netflix-Serien, die Sie nicht verpassen dürfen!
  • Thomas Harnisch
  • 23.05.2025 04:07
Mickey 17 auf HBO Max: Die unerwartete Sci-Fi-Premiere!
Weiterlesen
  • News
Mickey 17 auf HBO Max: Die unerwartete Sci-Fi-Premiere!
  • Thomas Harnisch
  • 23.05.2025 03:10
Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Anzeigen
Peter













Neueste Beiträge
  • Entdecke die geheimen Filmjuwelen auf Netflix für dein Wochenende!
  • Drei überwältigende Netflix-Serien, die Sie nicht verpassen dürfen!
  • Mickey 17 auf HBO Max: Die unerwartete Sci-Fi-Premiere!
    Mickey 17 auf HBO Max: Die unerwartete Sci-Fi-Premiere!
  • Entdecke die Zukunft: Ohrhörer übersetzen über 100 Sprachen!
    Entdecke die Zukunft: Ohrhörer übersetzen über 100 Sprachen!
  • Xbox Game Pass: Diese neuen Titel sprengen alle Erwartungen!
  • Elon Musks Rechenzentrum in Flammen: Gefahr für Serverbetrieb?
Agentur.rocks
  • Datenschutzerklärung
  • Impressum
  • Sitemap
  • Gastbeiträge
  • Portale und Profile
  • Cookies
Der Blog für Marketing-Interessierte
Marketing/CRM
  • Die 50 wichtigsten Marketingbegriffe
  • CRM Systeme
  • CRM – Customer Relationship Management
  • CRM-Marketing Kundenloyalität
  • CRM Systeme für kleine Unternehmen 
  • Network Marketing Firmen
SEO
  • SEO Optimierung
  • Die 50 besten SEO Tipps
  • SEO Optimierung Preis
  • SEO Optimierung kostenlos
E-Commerce
  • E-Commerce
  • E-Commerce Umsatz steigern
  • E-Commerce Online Marktplatz
  • E-Commerce Nische
  • Network Marketing Firmen

Gib dein Suchwort ein und drücke Enter.