Politik & Medien
Verhandlung in Hamburg

Gerichtsverfahren Kneschke gegen Laion e.V.

Landgericht Hamburg verhandelt deutschlandweit erstes Verfahren um die Nutzung von Fotografien zum Training von KI-Modellen.

Ein Bericht von Julia Laatsch

Bislang haben Urheber*innen nur eingeschränkte Möglichkeiten, Einfluss darauf zu nehmen, ob die von ihnen ins Internet oder einem Vertragspartner zur Verfügung gestellten Werke zu KI-Trainingszwecken verwendet werden, sowie am Erfolg dieser KI-Trainingsdatensätze Anteil zu haben.

Am 11. Juli 2024 fand am Landgericht Hamburg die ursprünglich für den 25. April 2024 geplante Verhandlung Laion e.V. gegen Robert Kneschke statt. Die Verhandlung war öffentlich. Aufgrund des großen öffentlichen Interesses musste kurz vor Beginn ein größerer Verhandlungssaal organisiert werden. Anwesend waren neben Medienvertreter*innen auch zahlreiche Urheber*innen aus verschiedenen kulturellen Bereichen sowie Verbandsvertreter*innen, Jurist*innen und Verantwortungsträger*innen aus dem Bildungssektor. Ein erstes Urteil wird voraussichtlich am 27. September 2024 verkündet. Es gilt als wahrscheinlich, dass eine verbindliche letztinstanzliche Entscheidung wohl erst durch den EuGH erfolgen wird.

 

Doch worum ging es hier genau?

Die beiden Richter stellten vor: Kläger ist der Fotograf Robert Kneschke, vertreten durch den Fachanwalt für Urheber- und Medienrecht Sebastian Deubelli. Beklagter ist der »gemeinnützige Verein Laion e.V.«. Manch einer im Saal bekam kurzzeitig Husten, der sich jedoch legte, als die Richter sagten, sie kämen auf den Begriff der Gemeinnützigkeit später erneut ausführlicher zurück.

Offiziell ging es um die juristische Klärung dieser drei Kernthemen:

1. Das Herunterladen des Bildes von Robert Kneschke im Jahr 2021 in niedriger Auflösung mit Wasserzeichen von einer Stockfotoseite, welche Lizenzen im Auftrag von Kneschke zum Verkauf anbietet. Dies wird von Laion e.V. nicht bestritten, sondern aufgrund von Ausnahmen vom deutschen Urheberrecht als zulässig erachtet. Man habe hier Bilder heruntergeladen, mit Hilfe von künstlicher Intelligenz Beschreibungen mit Bildinhalten abgeglichen, die Datei gelöscht und dafür den entsprechenden Hyperlink in den Datensatz aufgenommen.

2. Liegt hier eine Nutzung im Sinne des § 44b vor, der Text- und Data-Mining-Ausnahme im Urheberrechtsgesetzbuch? Hier vertrat das Gericht die Auffassung, dass die Datei auf der Stockfoto-Website »rechtmäßig zugänglich« sei, jedoch könne sich Laion e.V. aus Sicht des Gerichts hier nicht auf die Flüchtigkeit der Vervielfältigungshandlung berufen. Fraglich bleibt vorerst, ob dies zu Zwecken der wissenschaftlichen Forschung erfolgt ist, oder ob hier »unter dem Deckmantel der Gemeinnützigkeit« eigentlich wirtschaftliche Interessen beim Verkauf des Datensatzes »LAION 5B« verfolgt werden, so die Richter. Auf diesem Verzeichnis mit mehr als fünf Milliarden Bildern basieren viele aktuelle Bildgeneratoren.

3. Ist der Opt-Out-Hinweis durch Dritte (Stockfoto-Agentur) im Jahr 2021 in angemessener Weise erfolgt? Das Gericht stellte fest: Der Rechtevorbehalt durch die Agentur wurde in natürlicher englischer Sprache auf einer HTML-Webseite der Bildagentur erklärt und umfasst generell alle automatisierten Vorgänge durch Bots, jedoch nicht ausdrücklich KI-Bots. Hier ließ das Gericht offen, ob die Art des Rechtevorbehalts ausreichend maschinenlesbar sei.

Spannend waren jedoch vor allem auch die Zwischentöne. Denn genau wie in der Fotografie gibt es auch unter Jurist*innen nicht nur Schwarz und Weiß, sondern zahlreiche Grautöne. Erst recht, wenn es sich um Neuland handelt, wie in diesem Fall, bei dem auch Richter*innen nicht auf eine Reihe vergleichbarer Verfahren und verwandte Urteile zugreifen können, sondern sich selbsterklärtermaßen in zahlreichen hypothetischen Räumen bewegen.

Beide Richter wurden von vielen Beobachter*innen als sehr gut vorbereitet und tief in der Materie verhaftet wahrgenommen. Dies ermöglichte eine geschickte Verhandlungsführung, welche sowohl Laion e.V. als auch die Klägerseite zur Lösungsfindung in den hypothetischen Raum einlud. Wohlwissend, dass es an diesem Tag kein abschließendes Urteil geben wird, jedoch sachdienliche Informationen für die folgende/n Instanz/en zusammengetragen werden können.

In jenem hypothetischen Raum wurde der Nutzungsvorbehalt in maschinenlesbarer Form ausführlich diskutiert. Also jene Möglichkeit zur Erklärung, dass Bilder nicht von Webseiten-Crawlern mit dem Ziel, sie für KI-Datensätze zu sammeln, benutzt werden dürfen. Der Gesetzgeber hat zwar die Definition der »maschinenlesbaren Form« seit der EU-Urheberrechtsreform 2021 formuliert – ob dies in der Praxis jedoch über die AGB, ein Copyright auf der Webseite oder eine sogenannte robots.txt-Datei erfolgen kann und soll, ist derzeit noch immer absolut unklar. Ergänzend kommt die Problematik der geeigneten Sprache hinzu, was die Maschinenlesbarkeit grundsätzlich beeinflussen kann.

 

Würden wir also annehmen, wir hätten sowohl unsere AGB als auch unseren Copyrightvermerk plus Impressum auf der Webseite sowie eine vorbildliche robots.txt-Datei einwandfrei in englischer Sprache erstellt, um uns nicht auf eine Lösung zu verlassen: Können wir dann sicher sein, dass unsere Bilder nicht zum KI-Training verwendet werden?

Nein! So die Einschätzung der Richter. Denn die AGB würden sich grundsätzlich nicht an einer maschinenlesbaren Form orientieren. Bliebe also das Copyright auf der Webseite und die robots.txt. Ersteres wurde im Fall der Stockfotoagentur in den Nutzungsbedingungen eindeutig formuliert und von KI-Crawlern nicht berücksichtigt. Wie genau würde weltweit eine eindeutige Formulierung lauten? Zur robots.txt gibt es gespaltene Meinungen. Für die einen gilt sie als Allheilmittel, da sie eine weltweit einheitliche maschinenlesbare Form hat. Für die anderen ist sie zu komplex und unzumutbar für die Urheber*innen, die eben keine Programmierer*innen sind. Außerdem sei in Frage zu stellen, ob weltweit alle Urheber*innen der englischen Sprache mächtig seien und dies vorausgesetzt werden kann oder ob die jeweilige Landessprache akzeptiert werden muss.

Es gibt jedoch noch einen anderen Fakt, der gegen die Regelung durch die robots.txt-Datei spricht, der in der gerichtlichen Diskussion leider überhaupt keine Erwähnung fand. Das Auffindbarsein in den Suchergebnissen ist für die Urheber*innen in den meisten Fällen eine Notwendigkeit, um ihren Beruf auskömmlich ausüben zu können. Dazu ist es zwingend notwendig, die eigene Webseite von Bots crawlen und indexieren zu lassen. Wir können also nicht grundsätzlich alle Bots »aussperren« – jedoch bietet die Datei die Möglichkeit, unterschiedliche Berechtigungen je Bot zu vergeben. Diese Bots haben verschiedene Namen – sehr viele verschiedene Namen, die sich tagesaktuell ändern können. Vor dem Hintergrund der Vielzahl an Bot-Namen: Wie soll es hier möglich sein, ständig neue Bots in die Datei aufzunehmen und das Crawlen zu verbieten? Zumal die Namen der Bots doch in der Regel erst bekannt werden, wenn sie schon sehr aktiv waren und zahlreiches Material gesammelt haben.

Brauchen wir alle eine neue Morgenroutine: Zähneputzen, aktuelle KI-Bots aussperren und danach, wie immer, die Haustür abschließen beim Verlassen der Wohnung? Doch bei der verschlossenen Haustür ist es wie bei der robots.txt-Datei: Diebe können sich daran halten, müssen es aber nicht. Und die besten Diebe sind doch in der Regel jene, welche sich gut tarnen, bekannte Muster nachahmen und sich als echter Browser ausgeben – eine leichte technische Anpassung genügt und Bot-Betreiber haben sozusagen einen gefälschten Pass in Form eines User-Agents.

Laut einer durchgeführten Analyse von Cloudflare (2024), einem US-amerikanischen Unternehmen für Internetsicherheitsdienste, griffen KI-Bots auf rund 39% der eine Million wichtigsten Internetseiten zu, die Cloudflare verwenden, aber nur 2,98% dieser Websites ergriffen Maßnahmen, um diese Anfragen zu blockieren oder anzufechten.

 

Trotz dreistündiger Verhandlung bleiben viele Fragen offen, für die Urheber*innen, Technologieunternehmen und die Wirtschaft gleichermaßen dringend gesetzliche, praxistaugliche und eindeutige Rahmenbedingungen benötigen:

  • Wer entscheidet, welche Daten zum Training von KI-Modellen genutzt werden?
  • Wie wird die Entscheidung von Urheber*innen für oder gegen ein Training von KI-Modellen in maschinenlesbarer Form in der Praxis rechtssicher einheitlich umgesetzt?
  • Wie werden Urheber*innen für die ungefragte Nutzung ihrer Daten zu Trainingszwecken für die vergangenen Jahre entschädigt?
  • Wie ist es Urheber*innen auch in Zukunft noch möglich, ihre Werke im Internet als Arbeitsbeispiel im Portfolio zu zeigen und Auftraggeber*innen gegenüber gleichzeitig ein exklusives Nutzungsrecht zu gewährleisten, wie es in der Praxis häufig üblich ist?

Und nicht zuletzt dürfen wir uns auch folgenden Fragen widmen:

In welcher Welt wollen wir leben? Welche Werte wollen wir als Gesellschaft vertreten und wie wollen wir die Arbeit von uns Menschen zukünftig wertschätzen?