- Die New York Times verklagt OpenAI und Microsoft.
- Die Times behauptet, dass Millionen ihrer Artikel ohne ihre Zustimmung verwendet wurden.
- Generative KI-Modelle “lernen” aus Beispielen.
- Anbieter argumentieren, dass das Fair Use Doctrine einen umfassenden Schutz für ihre Datensätze bietet.
- Der Konflikt zwischen Anbieter und Medien hat zu einer wachsenden Zahl von Rechtsstreitigkeiten geführt.
Die New York Times verklagt OpenAI und seinen engen Kooperationspartner (und Investor), Microsoft, wegen mutmaßlicher Verletzung des Urheberrechts durch das Training von generativen KI-Modellen an Inhalten der Times.
In der Klage vor dem Bundesbezirksgericht in Manhattan behauptet die Times, dass Millionen ihrer Artikel ohne ihre Zustimmung verwendet wurden, um KI-Modelle zu trainieren, darunter solche, die OpenAI’s und Microsofts Technologien unterstützen. Die Times verlangt, dass OpenAI und Microsoft die Modelle und Trainingsdaten, die das Beanstandete Material enthalten, “zerstören”, und für “Milliarden von Dollar an gesetzlichen und tatsächlichen Schäden” verantwortlich gemacht werden.
In einer per E-Mail versandten Erklärung sagte ein Sprecher von OpenAI: “Wir respektieren die Rechte von Inhaltserstellern und Eigentümern und sind entschlossen, mit ihnen zusammenzuarbeiten, um sicherzustellen, dass sie von KI-Technologie und neuen Umsatzmodellen profitieren. Unsere laufenden Gespräche mit der New York Times waren produktiv und verliefen konstruktiv, so dass wir überrascht und enttäuscht über diese Entwicklung sind. Wir hoffen, dass wir eine für beide Seiten vorteilhafte Möglichkeit finden werden, zusammenzuarbeiten, wie wir es mit vielen anderen Verlagen tun”.
Generative KI-Modelle “lernen” aus Beispielen, um Aufsätze, Codes, E-Mails, Artikel und mehr zu erstellen, und Anbieter wie OpenAI durchsuchen das Web nach Millionen bis Milliarden dieser Beispiele, um sie ihren Trainingssets hinzuzufügen. Einige Beispiele sind gemeinfrei. Andere sind es nicht, oder fallen unter restriktive Lizenzen, die eine Zitierung oder spezifische Formen der Entschädigung erfordern.
Anbieter argumentieren, dass das Fair Use Doctrine einen umfassenden Schutz für ihre Datensätze bietet. Die Rechteinhaber sind anderer Meinung; eine wachsende Anzahl von Nachrichtenorganisationen verwendet inzwischen Code, um zu verhindern, dass OpenAI, Google und andere ihre Webseiten nach Trainingsdaten durchsuchen.
Der Konflikt zwischen Anbieter und Medien hat zu einer wachsenden Zahl von Rechtsstreitigkeiten geführt, wobei die Klage der Times die neueste ist.
Die Schauspielerin Sarah Silverman unterstützte im Juli zwei Klagen, in denen Meta und OpenAI beschuldigt werden, Silvermans Memoiren “aufgenommen” zu haben, um ihre KI-Modelle zu trainieren. In einer separaten Klage behaupten Tausende von Schriftstellern, darunter Jonathan Franzen und John Grisham, dass OpenAI ihre Werke als Trainingsdaten ohne ihre Erlaubnis oder Kenntnisquellen herangezogen habe. Und mehrere Entwickler haben einen laufenden Fall gegen Microsoft, OpenAI und GitHub über CodeGPT, ein mit KI betriebenes Codegenerierungstool, das, wie die Kläger behaupten, unter Verwendung ihres IP-geschützten Codes entwickelt wurde.