Rechtsanwalt Joerg Heidrich ging auf der Digitalkonferenz re:publica der Frage nach, ob unsere Texte und Fotos digitales Freiwild fürs KI-Training der US-Konzerne sind. Seine Antwort lautet ja, seine weiteren Thesen könnten für manche verstörend sein. Man sollte sich den Vortrag auf YouTube ansehen.

Joerg Heidrich, Rechtsanwalt aus Hannover und u. a. Justitiar und Autor beim Heise Verlag (c’t), beantwortet in seinem Vortrag vom 27. Mai 2024 zunächst die Frage, ob es den rechtlich überhaupt legal ist, dass die KI-Entwickler ungefragt urheberrechtlich geschütztes Material wie Texte und Fotos fürs Training u. a. ihrer »großen Sprachmodelle« nutzen, auf denen z. B. das vielzitierte ChatGPT aufbaut.

§ 44b UrhG: KI darf Texte nutzen

Die für einen Juristen ungewohnt eindeutige Antwort: Ja. Das europäische und deutsche Urheberrecht erlaubt ausdrücklich die ungefragte Nutzung von urheberrechtlich geschütztem Material für das sogenannte »Data Mining«. Was darunter zu verstehen ist, definiert § 44b des Urheberrechts, der mit der letzten Reform neu aufgenommen wurde. So heißt es in den beiden ersten Absätzen des § 44b UrhG:

(1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. (2) Zulässig sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining. Die Vervielfältigungen sind zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind.

Man beachte, dass zu diesen Zwecken sogar eine temporäre Vervielfältigung zulässig ist und man wundert sich nicht, dass Marktführer OpenAI immer wieder betont, dass anschließend keine Texte mehr auf den eigenen Servern gespeichert seien.

Die oft gehörte Behauptung, die Tech-Firmen würden Texte von Autoren unerlaubt nutzen, ist also falsch. Das Verhalten mag aus Autorensicht verwerflich sein, illegal ist es nicht.

Wer eine Nutzung seiner Texte nicht wünscht, muss dem laut UrhG ausdrücklich widersprechen. Im Absatz 3 ist von »vorbehalten« die Rede:

(3) Nutzungen nach Absatz 2 Satz 1 sind nur zulässig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugänglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.

Heidrich erwähnt in seinem Vortrag die beiden Wege. Zum einen sollte man im Impressum einen entsprechenden Satz aufnehmen.

Diesen findet man auch immer mehr in aktuellen Büchern und auch Self-Publishern ist empfohlen, diesen Hinweis aufzunehmen:

XY behält sich eine Nutzung der Inhalte für Text- und Data-Mining im Sinne von § 44b UrhG ausdrücklich vor.

Ob die US-Konzerne sich an Sätze im Impressum einer europäischen Website Publikation halten, sei natürlich eine andere Frage, so Heidrich sarkastisch.

Die einzig »maschinenlesbare Form«, die Absatz 3 erwähnt ist derzeit der Einsatz einer robots.txt-Datei (mehr dazu hier) und künftig vielleicht ein entsprechendes Tool (mehr dazu hier).

In nahezu jedem Werk wird künftig KI stecken

Dann wird es interessant in Heidrichs Vortrag. Die einen könnten es logisch, die anderen verstörend finden.

Denn überall auf der Welt gestehen die Gesetzestexte nur menschlichen Wesen Urheberrechte zu. Ein Prozess um das Selfie eines Affen, sorgte vor einiger Zeit um entsprechende Aufmerksamkeit. Ein Gericht entschied, dass das Selfie eines Affen nicht urheberrechtlich geschützt sei, da nur künstlerische Werke von Menschen diesen Schutz genießen.

Joerg Heidrichs These ist aber, dass die KI einen immer größeren Anteil an unseren Werken übernehmen wird, da KI-Assistenten künftig Bestandteil jeder Software sein werden. Für Office gibt es Microsofts »Copilot« und auch andere Anbieter wie Apple werden KI-Funktionen in ihre Betriebssysteme integrieren, mit denen wir texten oder Mails beantworten. Heidrich nennt dies daher die »Copilotisierung der Wissensarbeit«. In nahezu jedem Werk werde künftig KI stecken, davon ist Heidrich überzeugt.

Ab wann, so stellt Heidrich die rhetorische Frage, verliert dann ein mit Hilfe von KI geschriebener Text seinen Schutz? Wenn der überwiegende Teil von der KI stammt, also 51%, setzt Heidrich an.

Das Problem sei jedoch, dass niemand – nicht einmal die KI-Firmen selbst – feststellen kann, wie hoch der KI-Anteil an künstlerischen Werken ist. Vielleicht wissen es irgendwann nicht einmal die Autoren, die die integrierten KI-Funktionen nutzen.

Menschlich erstellte Werke werden Luxus

In diesem Zusammenhang kommt Heidrich auf die bislang eher freiwillige Kennzeichnungspflicht von KI-genierierten oder KI-erstellen Texten zu sprechen. Zum einen weist er darauf hin, dass als KI-generiert ausgewiesene Texte und Bilder eben keinen urheberrechtlichen Schutz genießen und diese Werke dann auch von anderen kopiert und genutzt werden dürfen.

Zum anderen prognostiziert Heidrich, dass insbesondere in Zeitungen und Zeitschriften die Kennzeichnung in Zukunft anders herum laufen wird. Menschlich erstellte Werke werden zu einem »besonderen Luxus mit höheren Kosten« und diese werden dann entsprechend gekennzeichnet.

Heidrich kommt zum Ergebnis, dass das bestehende Urheberrecht nicht in der Lage sein wird, diese Entwicklungen auszugleichen, und es werde nur begrenzt anwendbar sein. »These: Das Ende des Urheberrechts?« ist der Titel seiner Powerpoint-Folie, die zahlreich vom Publikum abfotografiert wird.

Im Rahmen seines Vortrags geht Heidrich auch auf die Frage ein, wenn schon die Ausgabe einer KI nicht geschützt sei, ob denn die Eingabe, der sogenannte Promt, geschützt sei, der die Anweisung für die KI war, auf deren Basis das KI-Werk entstand.

Die Antwort gibt hier ebenfalls das Urheberrecht. Geschützt sind nämlich »persönliche geistige Schöpfungen«. Juristen sprechen davon, dass ein Werk daher eine gewisse »Schöpfungshöhe« aufweisen müsse, um diesen Schutz zu genießen. Romane haben diesen, Gebrauchsanweisungen oder Wetterberichte eher nicht.

Heidrich zeigt an einem Katzenbild, dass ein Prompt dann geschützt ist, wenn er eine Geschichte erzählt und somit eine gewisse Schöpfungshöhe aufweist.

Ein allgemein beschreibender Prompt für eine Bild-KI wie: »Erstelle das Bild eines müden Königs auf einem Thron« ist daher nicht geschützt. Verpackt man die Anweisung jedoch kreativ in einer Geschichte, so kann der Prompt urheberrechtlichen Schutz genießen: »Es ist spät. Die Räume der Grafikagentur sind menschenleer. Nur dort hinten sitzt noch jemand an einem leuchtenden Bildschirm. Es ist ein Texter. Er muss noch einen Auftrag fertigstellen. Eigentlich ist er zu Besserem berufen, als so spät noch hier zu sitzen. Er sieht sich selbst auf König auf einem Thron. Du bist dieser Texter. Zeichne dich selbst als müden König auf diesem Thron.«

Der Vortrag von Joerg Heidrich im Video