- Der Urheberrechtsstreit zwischen der New York Times, OpenAI und Microsoft hat eine hitzige Phase erreicht. Ingenieure von OpenAI haben unbeabsichtigt Daten gelöscht, was die Beweissicherung der Times erschwert. OpenAI hat einen Großteil der Daten wiederhergestellt, aber wichtige Informationen wie Dateinamen fehlen der Times noch. Der Fall befindet sich in der Beweisaufnahme, wobei OpenAI gezwungen wurde, seine Trainingsdaten offenzulegen. Dieser Fall könnte einen Präzedenzfall für zukünftige Rechtsstreitigkeiten in der KI-Branche setzen.
Rechtsstreitigkeiten sind selten harmonisch, doch der Urheberrechtsstreit zwischen der New York Times und den Technologie-Giganten OpenAI und Microsoft erreicht eine besonders hitzige Phase. Diese Woche warf die Times vor, dass Ingenieure von OpenAI unbeabsichtigt Daten gelöscht haben, die das Team der Zeitung in über 150 Stunden mühsamer Arbeit zur Beweissicherung extrahiert hatte. Zwar konnte OpenAI einen Großteil der Daten wiederherstellen, doch fehlen der Times nach eigenen Angaben immer noch die ursprünglichen Dateinamen und Verzeichnisstrukturen. Dies erschwert es, nachzuvollziehen, wo die Artikel der Kläger möglicherweise in die KI-Modelle von OpenAI eingearbeitet wurden.
Herausforderungen in der Beweissicherung
Laut einer am Mittwoch von Anwältin Jennifer B. Maisel eingereichten Erklärung bedeutet dieser Verlust, dass das Material nicht verwendbar ist, um mögliche Kopieranwendungen zu bestimmen. OpenAI-Sprecher Jason Deutrom betonte jedoch, man stimme mit den Charakterisierungen nicht überein und werde bald eine Antwort einreichen. Die New York Times lehnte es ab, einen Kommentar abzugeben. Im Jahr zuvor hatte die Times ihre Urheberrechtsklage gegen OpenAI und Microsoft erhoben und denen vorgeworfen, ihre Artikel unrechtmäßig zur Ausbildung von KI-Tools wie ChatGPT verwendet zu haben. Dieser Fall gehört zu einer Reihe von Prozessen gegen AI-Unternehmen und Verlage, zu denen auch eine ähnliche Klage der Daily News zählt, die von denselben Anwälten betreut wird.
Die Bedeutung des Prozesses
Der aktuelle Fall befindet sich in der Beweisaufnahme, wobei beide Parteien verpflichtet sind, angeforderte Dokumente und Informationen vorzulegen. Dabei musste OpenAI dem Gericht seine Trainingsdaten offenlegen – ein bedeutender Schritt, da OpenAI bisher nie öffentlich gemacht hat, welches Material seine KI-Modelle speist. Dazu wurde ein “Sandbox”-System aus zwei “virtuellen Maschinen” erstellt, durch das sich die Anwälte der Times durchklicken konnten. In ihrer Erklärung brachte Maisel vor, dass OpenAI-Ingenieure Daten gelöscht hätten, die von der Times auf einer dieser Maschinen organisiert wurden. OpenAI räumte gegenüber den Papieranwälten ein, dass die Informationen gelöscht wurden, und bemühte sich noch am selben Tag um Abhilfe. Doch bei der Durchsicht der “wiederhergestellten” Daten zeigte sich, dass sie zu unübersichtlich waren, was die Anwälte zwang, die Arbeit von Grund auf neu zu beginnen.
Einfluss auf zukünftige Rechtsprechung
Interessanterweise handelt es sich nicht um den ersten Streitpunkt in diesem Verfahren. Zuvor hatten die Times und die Tech-Unternehmen darüber gestritten, welche Partei die Verantwortung für die Durchsicht der Trainingsdaten tragen muss. In einem jüngsten Schreiben erhob die Zeitung erneut den Anspruch, dass OpenAI besser positioniert sei, diese Aufgabe zu übernehmen. In einer Einreichung früher in diesem Monat stellte Anwalt Steven Lieberman fest, dass “schwerwiegende und wiederholte technische Probleme” es unmöglich machten, effektiv und effizient durch OpenAI’s Trainingsdatensätze zu suchen, um das volle Ausmaß der Urheberrechtsverletzung zu erkennen. Parallel dazu fordert Microsoft die New York Times auf, alle Dokumente im Zusammenhang mit ihrer eigenen Nutzung von generativer KI offenzulegen. In einer Einreichung wurde explizit auf den bekannten Tech-Kolumnisten Kevin Roose verwiesen. Microsoft argumentierte, Informationen über die KI-Nutzung der Times könnten in mehrfacher Hinsicht relevant für ihre Verteidigung sein, inklusive einer möglichen positiven Auswirkung auf die Zeitung.
Während sich diese Auseinandersetzungen vor Gericht entfalten, bemüht sich OpenAI um Content-Lizenzierungsverträge mit anderen Verlagen wie The Atlantic und Vox Media. Klar ist, dass dieser Fall einen Präzedenzfall schaffen wird, wie die KI-Branche in den USA operieren kann.