Nutzung von Social-Media-Daten in KI-Modellen

Zur Optimierung von KI-Modellen benötigen diese großen Datenmengen. Welche rechtlichen Anforderungen bei der Datenzusammenführung aus verschiedenen Netzwerken nötig sind, ist gerade aus der Sicht von Entwicklern und Anbietern von Interesse. Ein aktuelles Urteil gibt hierzu eine erste Einschätzung. Der Fokus liegt auf die Datenschutz-Grundverordnung (DSGVO) und den Digital Markets Act (DMA).

Eilverfahren

Das OLG Köln (Urteil vom 23.05.2025, Az. 15 UKI 2/25; NJW 2025,3156) hat erstmals eine Entscheidung über die Zulässigkeit der Verbreitung öffentlich zugänglicher Daten zum KI-Training getroffen. Das Urteil betrifft allerdings eine Sonderkonstellation des Trainings durch Anbieter sozialer Netzwerke (hier: Meta) mit Daten, die ihre Nutzer innerhalb der Netzwerke (Instagram/Facebook) öffentlich gestellt haben. Die Nutzung öffentlich geteilter Nutzerdaten sollte nach der Ankündigung von Meta zum Training eines KI-Large-Language-Modells dienen. Die Verbraucherzentrale Nordrhein-Westfalen hatte gegen die Pläne geklagt, um eine Zustimmung einzufordern. Der Eilantrag wurde im Rahmen des einstweiligen Rechtschutzes abgewiesen.

Das OLG hat entschieden, dass Meta öffentliche Nutzerdaten (z. B. Posts, Profilbilder) für das Training seiner KI nutzen darf, da die Daten anonymisiert werden und Nutzer aktiv widersprechen müssen – eine Klage der Verbraucherzentrale wurde abgewiesen; das Urteil erlaubt die Nutzung öffentlich zugänglicher Daten für das Training der Meta-KI, solange strenge Datenschutzmaßnahmen (Anonymisierung) eingehalten werden und Betroffene ein wirksames Widerspruchsrecht haben, was im Konflikt mit dem großen Datenbedarf der KI gesehen wird.

Kernaussagen

Was sind die Kernpunkte des Urteils?

Meta ist ein sogenannter Torwächter iSv Art. 2 Nr. 1 DMA, da das Unternehmen mit Facebook und Instagram zwei zentrale Plattformdienste in der Variante der sozialen Netzwerke betreibt. Meta darf personenbezogene Daten aus zwei zentralen Plattformdiensten nach Art. 5 Abs. 2 lit. b) DMA nicht zusammenführen, es sei denn, es liegt eine Einwilligung des Endnutzers vor. Das Gericht hat klargestellt, dass die von Meta geplante Einbringung öffentlich zugänglicher Inhalte aus den beiden Netzwerken in ein unstrukturiertes Trainingsdatenset nicht dem Zusammenführungsverbot unterliegt, da keine gezielte personenbezogene Verknüpfung derselben Nutzer erfolgt. Ob diese Auslegung in einem Hauptsacheverfahren Bestand haben wird, kann nur der EuGH entscheiden.

Das OLG hat außerdem die Datenverarbeitung durch Meta im Rahmen des KI-Trainings für rechtens angesehen und sich dabei auf das berechtigte Interesse nach Art. 6 Abs. 1 S. 1 lit. f. DSGVO berufen. Diese Norm setzt voraus, dass der Verantwortliche ein berechtigtes Interesse wahrnimmt, die Datenverarbeitung zur Verwirklichung des berechtigten Interesses erforderlich ist und die Grundrechte und Grundfreiheiten des Betroffenen gegenüber dem berechtigten Interesse des Verantwortlichen nicht überwiegen. Das OLG ist hier der Auffassung, dass Meta mit dem Aufbau eines regional angepassten KI-Modells ein legitimes wirtschaftliches Ziel verfolgt.

Das OLG hält die Erforderlichkeit der Datenverarbeitung für gegeben, da die Verarbeitung geeignet ist, den verfolgten Zweck zu erreichen. Ein weniger beeinträchtigendes Mittel der Privatsphäre hat das Gericht nicht gesehen. Hierzu muss man wissen, dass im Eilverfahren nur eine summarische Prüfung stattfindet. Mithin konnte nicht eingehend geprüft werden, ob es eine sinnvollere Alternative gibt.

Von erheblicher Bedeutung war insbesondere die Interessenabwägung zwischen den Betroffenen und Meta. Das OLG erläutert die Folgen für die Betroffenen, die Öffentlichkeit der Daten, das durch Meta eingeräumte Widerspruchsrecht und die Verarbeitung von Daten über Dritte. Letzterer Aspekt bleibt allerdings aus Sicht des OLG problematisch, nämlich dann, wenn Nutzer Inhalte veröffentlichen, die auch andere Personen betreffen. Denn diese Personen haben keine Möglichkeit der Datenverarbeitung zu widersprechen. Dennoch hat das Gericht keinen Nachteil für die Betroffenen gesehen, da beim Training von KI-Modellen keine gezielte Verarbeitung personenbezogener Daten mit der Identifizierung von Personen im Vordergrund steht.

Verarbeitung sensibler Daten

Das OLG hat die Nutzung sensibler Daten nach Art. 9 DSGVO im Rahmen des KI-Trainings unter bestimmten Voraussetzungen für zulässig erachtet. Das Verarbeitungsverbot komme nur dann zum Tragen, wenn der Betroffene es im konkreten Falle durch Aktivierung geltend mache. Personenbezogene Daten, die der Nutzer selbst veröffentlicht hat, fallen demnach unter den Ausnahmetatbestand des Art. 9 Abs. 2 lit e) DSGVO. Das Gericht verwies auch auf die KI-VO, wonach ein striktes Verbot der Verarbeitung sensibler Daten dem Ziel einer führenden Rolle der KI-Entwicklung in Europa entgegenstehen würde.

Bedeutung des Urteils

Das Urteil hat Signalwirkung für die datenschutzrechtliche Zulässigkeit von KI-Training mit öffentlichen Internetdaten. Kritische Stimmen sehen allerdings das Urteil gerade in Bezug auf die Verarbeitung von Daten Dritter als unzureichend an. Dies gilt auch für die Verarbeitung sensibler Daten nach Art 9 DSGVO, da neben der Ausnahme nach Art. 9 Abs. 2 lit e) DSGVO eine Datenverarbeitung ohne Einwilligung des Betroffenen nicht stattfinden kann. Die systematische Lösung zu Art. 9 DSGVO wird teilweise als unzureichend gesehen. Es bleibt zu hoffen, dass der Europäische Gerichthof (EuGH) eine Vorlage in einem Hauptsacheverfahren erhält, da sich dieser mit Eilverfahren nicht auseinandersetzt.

Ein Beitrag von

Dr. Paul Klickermann (v.i.S.d.P.)
Rechtsanwalt
Fachanwalt für Urheber- und Medienrecht
Lehrbeauftragter der Johannes Gutenberg-Universität Mainz (JGU)

Der Verlag

Werbung

Neueste Beiträge