StartseiteLiterarisches LebenUrheberrecht: ChatGPT von eigenen Inhalten ausschließen

Urheberrecht: ChatGPT von eigenen Inhalten ausschließen

09.08.2023

Aktualisiert am 09.08.2023

2 Min.

ChatGPT-Bot mithilfe der robots.txt-Datei ausschließen

Damit die künstliche Intelligenz von ChatGPT gute Texte schreiben kann, wird sie überwiegend mit Inhalten aus dem Internet trainiert. Darunter auch urheberrechtlich geschütztes Material. Autoren und Verlage, die künftig verhindert wollen, dass die KI von eigenen Texten lernt, können jetzt ChatGPT von der eigenen Website aussperren.

Künftig gibt sich ChatGPT zu erkennen, wenn sich das »Texternteprogramm« des Herstellers OpenAI die Inhalte der eigenen Website einverleiben will.

Es ist eine Kennung, wie sie jeder Browser und beispielsweise auch Google verwendet, wenn Inhalte ausgelesen werden. Der sogenannte Bot von OpenAI identifiziert sich mit der Kennung »GPTBot«.

Wer nicht möchte, dass die Texte der eigenen Website zum Training der Text-KI verwendet werden und dass sich ChatGPT beispielsweise auch an Leseproben oder kostenfrei bereitgestellten und urheberrechtlich geschützten Inhalten bedient, kann den Bot mit einer sogenannten robots.txt-Datei von der kompletten Website oder Teilen davon ausgeschlossen werden. Auch diese Technik ist nicht neu, sondern kann seit jeher genutzt werden, um maschinelle Besucher wie z. B. Google von der Indexierung auszuschließen.

Um die komplette Website für den GPTBot zu sperren, legt man im Hauptverzeichnis des Webservers eine Textdatei mit dem Namen robots.txt ab. In diese Datei schreibt oder ergänzt man die folgenden Zeilen:

User-agent: GPTBot
Disallow: /

Man kann dieses Kommando auch verfeinern, indem man dem Bot gezielt den Zugriff auf echte oder virtuelle Unterverzeichnisse entzieht oder erlaubt:

User-agent: GPTBot
Allow: /pressemeldungen/
Disallow: /leseproben/

Für Content-Management-Systeme wie WordPress gibt es Erweiterungen (Plugins), mit denen sich die Datei robots.txt editieren lässt. Das oft eingesetzte SEO-Plugin von Yoast ermöglicht die Bearbeitung unter »Yoast SEO > Werkzeuge > Datei-Editor > robots.txt«

Natürlich ist man bei der ganzen Sache darauf angewiesen, dass sich ChatGPT bzw. OpenAi auch an diese Anweisungen hält. Und natürlich kann man sich auch fragen, warum man aktiv etwas tun muss, um den Bot auszuschließen. Aber das kann man leider nicht aussuchen. Außerdem gibt es mittlerweile zahlreiche ähnliche KI-Anbieter, die diese virtuelle Sperre nicht beachten werden.

Von Urheberinnen und Urhebern wird jedoch immer wieder beklagt, dass sich ChatGPT an rechtlich geschützten Inhalten bediene, ohne dass die Urheber dafür entlohnt werden. ChatGPT lernt ungefragt von den Texten anderer, ohne Schulgeld zu bezahlen. Dass sich der Bot von OpenAI nun zu erkennen gibt, mag ein kleines Zugeständnis nach dieser Kritik sein.

Wer seine Inhalte also vor dem Zugriff schützen möchte, sollte die erwähnten Zeilen in seine robots.txt-Datei einfügen.

Tags
ChatGPT
KI

Weitere Beiträge zum Thema

Vorheriger Beitrag

Zum 140. Geburtstag: »knallvergnügt« – Ein Joachim-Ringelnatz-Abend mit Wolfgang Tischer (Live-Mitschnitt)

Nächster Beitrag

Praxisabend ChatGPT: Wie Autorinnen und Autoren die KI für sich nutzen können

6 Kommentare

John 09.08.2023 um 12:55

Danke für den Tipp.

Auf diesen Kommentar antworten
Sebastian Meister 17.08.2023 um 19:48

Sehr guter Hinweis.
Es kann nicht sein, dass die Tech-Firmen mit der geistigen Arbeit anderer steinreich werden.

Ich werde den Hinweis umsetzen.

Auf diesen Kommentar antworten
Daniel Hartmann 18.08.2023 um 13:37

Ja, das sollte eigentlich jeder machen.
Ohne massenhaften Input ist die KI nämlich nutzlos.

Auf diesen Kommentar antworten
- Marcel Waldvogel 24.08.2023 um 13:40
  
  Es wirkt sich nur leider nicht auf bereits gecrawlte Inhalte oder andere Trainingssets aus. Google will seine Infos aus den Suchcrawls 1:1 für Bard verwenden, ohne Wahlmöglichkeit.
  
  Bessere Ansätze sind die TDM Directive der EU (IMHO wahrscheinlich zahnlos) und die TDMrep-Erweiterung aus dem W3C-Umfeld (zu unkonkret und unflexibel, wird sich so nicht durchsetzen). Ein paar Sätze mehr dazu hier (Englisch): https://netfuture.ch/2023/07/blocking-ai-crawlers-robots-txt-chatgpt/
  
  Auf diesen Kommentar antworten
  - Daniel Hartmann 29.08.2023 um 19:10
    
    Danke für die Information.
    
    Auf diesen Kommentar antworten
Uschi Ronnenberg 24.08.2023 um 16:08

Guter Tipp, danke Dir!

Auf diesen Kommentar antworten

Urheberrecht: ChatGPT von eigenen Inhalten ausschließen

Weitere Beiträge zum Thema

Schreibzeug mit KI und unser KI-Webinar

Gucktipp: Die KI und das Ende des Urheberrechts

Für eine bessere Welt: ChatGPT-Macher kündigen Media Manager für Urheber und Verlage an

6 Kommentare

Schreiben Sie einen Kommentar Antworten abbrechen