- Leser werden in eine Welt 800 Jahre nach einem katastrophalen Ereignis versetzt, das die westliche Zivilisation beendet hat. Wissenschaftler finden Tagebucheinträge, die die Lebensweise im 20. Jahrhundert in Großbritannien erklären. Digitale Hinterlassenschaften wie alte Facebook-Posts werden als moderne Zeitkapseln betrachtet und von KI-Systemen genutzt. Meta und andere Unternehmen nutzen öffentliche Online-Inhalte zur Schulung ihrer KI-Modelle. Datenschutzbedenken führen zu Konflikten zwischen Meta und europäischen Datenschutzbehörden.
In R. C. Sherriff’s Roman werden Leser in eine Welt 800 Jahre nach einem katastrophalen Ereignis versetzt, das die westliche Zivilisation beendet hat. Auf der Suche nach Hinweisen über eine Leerstelle in der Geschichte ihres Planeten stoßen Wissenschaftler einer neuen Weltordnung auf Tagebucheinträge in einem sumpfigen Ödland, das einst als England bekannt war. Für die Bewohner dieses neuen Imperiums wird erst durch diese Aufzeichnungen des pensionierten Lehrers Edgar Hopkins, mit seinen banalen Ländereien, Eitelkeiten und dem Versuch, preisgekrönte Hühner zu züchten, die Lebensweise im 20. Jahrhundert in Großbritannien verständlich.
Digitale Fossilien
Wenn Sie futuristischen Wesen das Leben auf der Erde näherbringen wollten, glaubten Sie früher, dass Sie eine Zeitkapsel von tieferer Bedeutung als Sherriffs engstirniger Protagonist Edgar Hopkins schaffen könnten. Doch beim Durchstöbern Ihrer zehn Jahre alten Facebook-Posts diese Woche, stellten Sie fest, dass Ihre Hinterlassenschaft möglicherweise noch unscheinbarer ist. Frühere Beiträge, Urlaubsfotos und die Namen von Millionen Facebook- und Instagram-Nutzern weltweit werden effektiver als Zeitkapsel der Menschheit behandelt und in Trainingsdaten umgewandelt. Das bedeutet, dass Ihre banalen Beiträge über Universitätsabgabetermine („3 Energydrinks runter, noch 1.000 Wörter zu schreiben“) sowie unbemerkenswerte Urlaubsbilder (eins zeigt sie zusammengesunken über Ihrem Handy auf einer stehenden Fähre) Teil dieses Korpus werden.
Datenschutz-Dilemma
Die Tatsache, dass diese Erinnerungen so langweilig und gleichzeitig sehr persönlich sind, macht das Interesse von Meta umso beunruhigender. Das Unternehmen betont, dass es sich nur für bereits öffentliche Inhalte interessiert: Private Nachrichten, ausschließlich mit Freunden geteilte Beiträge und Instagram-Stories sind tabu. Trotzdem speist sich die KI plötzlich aus persönlichen Artefakten, die jahrelang in unbeachteten Ecken des Internets verstaubt sind. Für die Leser außerhalb Europas ist der Schritt bereits vollzogen; die Deadline, die Meta bekannt gegeben hat, galt nur für Europäer. Die Beiträge amerikanischer Facebook- und Instagram-Nutzer trainieren seit 2023 die Modelle von Meta AI, wie Unternehmenssprecher Matthew Pollard mitteilte.
Meta ist nicht das einzige Unternehmen, das Ihre Online-Historie in KI-Futter verwandelt. Der WIRED-Reporter Reece Rogers entdeckte kürzlich, dass Googles KI-Suchfunktion auf seine journalistischen Arbeiten zurückgreift.
Die Jagd nach alten Erinnerungen
Doch herauszufinden, welche persönlichen Überbleibsel genau die zukünftigen Chatbots alimentieren, war nicht einfach. Einige Seiten, zu denen Sie im Laufe der Jahre beigetragen haben, sind schwer aufzufinden. Frühes soziales Netzwerk Myspace wurde 2016 von Time Inc. übernommen, das zwei Jahre später von der Meredith Corporation gekauft wurde. Eine Anfrage bei Meredith zu Ihrem alten Account wurde mit der Nachricht beantwortet, dass Myspace inzwischen an eine Werbefirma namens Viant Technology ausgelagert wurde. Eine E-Mail an einen auf der Website gelisteten Kontakt wurde mit der Nachricht zurückgesandt, dass die Adresse „nicht gefunden werden konnte.“
Die Nachfrage bei noch existierenden Unternehmen war einfacher. Die Blogging-Plattform Tumblr, auf der Sie als Teenager öffentliche Beiträge gepostet haben, teilte mit, dass diese, falls Sie nicht widersprochen haben, mit „einem kleinen Netzwerk von Inhalts- und Forschungspartnern, einschließlich denen, die KI-Modelle trainieren“ geteilt werden. YahooMail, das Sie jahrelang nutzten, informierte Sie, dass eine Stichprobe alter E-Mails „anonymisiert“ und „aggregiert“ intern von einem KI-Modell verwendet werde, um beispielsweise Nachrichten zusammenzufassen. Microsoft, Eigentümer von LinkedIn, erklärte, dass Ihre öffentlichen Beiträge zur Schulung von KI genutzt werden, wobei einige „persönliche“ Details ausgeschlossen wurden.
Anpassung der Arbeitswelten
Neben LinkedIn scheinen Unternehmen weniger gewillt, Algorithmen Zugriff auf Nachrichten oder Dokumente zu gewähren, die Sie für die Arbeit erstellt haben. Der Office-Messaging-Dienst Slack bestritt frühere Berichte, er nutze Kundenmails zur KI-Schulung. Microsoft teilte ebenfalls mit, dass Inhalte, die in seinen Office-Produkten – Word, Excel, PowerPoint, Outlook (ehemals Hotmail) und Teams – erstellt werden, nicht zur Schulung von Basis-Modellen verwendet würden. Auch Google erklärte, dass seine Arbeitstools, wie die kostenpflichtigen und kostenlosen Versionen von Gmail, tabu seien, obwohl Modelle auf YouTube-Videos trainiert würden.
Meta steht dabei nicht allein. Doch seine Neupositionierung von Facebook- und Instagram-Inhalten fällt ins Auge, da viele Menschen die Plattformen nutzten, um sehr persönliche Meilensteine zu dokumentieren. Da Sie in Europa leben, sind Ihre Facebook- und Instagram-Posts vorerst außer Reichweite von Metas KI. Die Bekanntgabe der KI-Trainingspläne von Meta löste jedoch einen neuen Streit zwischen Meta und den europäischen Datenschutzbehörden aus und zwang Meta, seine Pläne zur Nutzung europäischer Beiträge einschließlich britischer vorübergehend zu pausieren.