In einem Blog-Beitrag kündigt die Firma OpenAI einen nicht näher spezifizierten »Media Manager« für Urheber und Verlage an, mit dem diese die Nutzung ihrer Inhalte durch die KI steuern können sollen. Der Beitrag trieft vor »Menschlichkeit« und »Respekt«, die Absicht scheint klar.

Die Firma OpenAI und andere Entwickler sogenannter »großer Sprachmodelle« haben diese massiv und ungefragt mit urheberrechtlich geschütztem Material trainiert. Dafür wurde die Firma von Autoren, Verlage und Politikern reichlich kritisiert und verklagt. Zwar ist die Lage rechtlich nicht so eindeutig wie beim bloßen Kopieren der Werke, dennoch fußt der Umsatz dieser Unternehmen in Teilen auf der Nutzung der geistigen Werke Dritter. Der Jahresumsatz von ChatGPT-Entwickler OpenAI soll 2023 bei über 2 Milliarden US-Dollar gelegen haben.

Um der Kritik etwas entgegenzuhalten, kündigte man vor einiger Zeit an, sich künftig an die Anweisungen der robots.txt zu halten. Diese Text-Datei auf einem Webserver dient ursprünglich dazu, Suchmaschinen die Indexierung der kompletten Website oder bestimmter Bereiche und Dateien zu untersagen – so sich diese freiwillig daran halten. Auch die Bots der Firma OpenAI sollen diese Hinweise beachten (siehe Bericht), wenn sie Web-Texte fürs Training suchen.

In einem Blog-Beitrag kündigt OpenAI für 2025 einen sogenannten »Media Manager« an, der es Urhebern und Rechteinhabern differenzierter und besser ermöglichen soll mitzuteilen, welche Texte und Daten OpenAI nutzen darf und welche nicht. Obwohl der Beitrag länger ist, fehlen Infos, wie dieses Tool arbeiten soll, wie es generell funktioniert und ob und in welchem Umfang die Urheber Zeit und Mühe aufwenden müssen, um die ChatGPT-Bots von den eigenen Werken fernzuhalten. Völlig unspezifisch heißt es dazu:

OpenAI entwickelt Media Manager, ein Tool, das es Urhebern und Rechteinhabern ermöglicht, uns mitzuteilen, welche Inhalte sie besitzen, um festzulegen, wie ihre Werke in die Entwicklung und das Training zum maschinellen Lernen einbezogen oder ausgeschlossen werden sollen. Wir planen, im Laufe der Zeit weitere Auswahlmöglichkeiten und Funktionen einzuführen.

Man hofft, das Werkzeug 2025 bereitzustellen und dass es einen Standard für alle KI-Entwickler setzen werde.

Den Beitrag durchziehen Begriffe wie »Menschlichkeit« und global eingesetzte Lösungen auf Basis der KI, sollen die Welt ein wenig besser zu machen. Und von »Respekt« gegenüber den Urhebern ist die Rede. Man wolle bei der Entwicklung des Media Managers mit Künstlern, Filmemachern und den großen Konzernverlagen wie Financial Times, Le Monde, Prisa Media und Axel Springer zusammenarbeiten. Ebenfalls ist von »Partnerschaft« die Rede.

Nicht die Rede ist im Text von Vergütung, Bezahlung oder Lizenzgebühren, obwohl es zwischen den großen Konzernen wie Springer längst entsprechend bezahlte »Partnerschaften« gibt. Mit den Verwertungsgesellschaften der Urheber jedoch nicht.

OpenAI ist es wichtig zu betonen, dass man keine Datenbank sei, dass es keine Kopien der Inhalte auf den Servern der Firma gebe. Eine klare Abgrenzung zu und Positionierung gegen Google.

Der eigentliche Sinn und Zweck des Blog-Beitrags besteht darin, das milliardenschwere Unternehmen als Wohltäter und als gemeinnützig darzustellen, um urheberrechtlich geschützte Inhalte von Dritten weiterhin nach US-Recht kostenfrei nutzen zu können. Diese »Fair Use«-Regel ist eine Besonderheit des US-Urheberrechts, die es so im deutschen Recht nicht gibt. Wer in den USA mit dem geistigen Eigentum anderer kein Geschäft macht, darf es honorarfrei nutzen.

In Zukunft wird es – wahrscheinlich nach langen juristischen Verhandlungen und Auseinandersetzungen – zu Einigungen kommen müssen, wie die einzelnen Urheber vergütet werden, wenn ihre Daten fürs KI-Training genutzt werden. Mit Blog-Posts wie dem zum Media Manager wird das Unternehmen dann belegen, wie sehr man schon immer auf das Wohl der Urheber bedacht war – nachdem das Unternehmen deren Werke und Arbeit längst schon seit Jahren ungefragt und unentgeltlich genutzt hat.

Wolfgang Tischer