
Früher waren es Plagiate, heute sucht man in Texten nach Spuren von KI, jüngst in den Reden von Thüringens Ministerpräsident Mario Voigt. Meist werden dazu »KI-Detektoren« verwendet. Einige Lektorinnen sagen, sie könnten KI-Merkmale in Romanen auch ohne sie erkennen. Aber woran? Und wie zuverlässig ist das?
Halluzinieren und KI-Detektoren
Die FAZ hat im Juni 2026 einen Gastbeitrag von Thüringens Ministerpräsident Mario Voigt »depubliziert«. Unter anderem waren darin Zitate frei erfunden, die auf das sogenannte »Halluzinieren« einer KI schließen ließen, also wenn Dinge einfach erfunden werden. Man habe bei der Recherche von FragDenStaat aber auch KI-Detektoren wie »Pangram« und »GPTZero« eingesetzt.
Im aktuellen Fall war die Analyse korrekt, und Voigt hat zugegeben, dass man in der Staatskanzlei KI einsetze. Man bedaure aber nur die fehlende Kennzeichnung.
KI-generierte Romane, so heißt es schon länger, würden mittlerweile Amazons Self-Publishing-Plattform KDP überschwemmen.
Woran erkennt man den KI-Einsatz bei Romanen?
Wenn man es so will, sind Romane eine einzige Halluzination, also schöpferische Texterfindungen. Woran erkennt man dann – auch ohne den Einsatz der KI-Detektoren –, dass KI verwendet wurde?
Merkmal 0: Satzzeichen
»An der Verwendung von Gedankenstrichen«, würden vielleicht einige sagen. Demnach geriete auch dieser Text sofort unter KI-Verdacht, denn ich habe gleich zwei im letzten Absatz verwendet. Doch ich garantiere, diesen Beitrag ohne KI verfasst zu haben – mit Ausnahme des bewusst eingesetzten und gekennzeichneten Textbeispiels unten. Ups, schon wieder ein Gedankenstrich. Zum Gedankenstrich habe ich mich bereits hier ausführlich geäußert.
Ein Beispieltext wird analysiert
Öffnen Sie also einmal eine beliebige KI (ChatGPT, Claude oder Gemini), und geben Sie die folgende, sehr allgemeine Anweisung (Prompt) ein:
Schreibe den ersten Absatz eines Liebesromans
ChatGPT gibt mir ohne weitere Kommentare Folgendes zurück:
Als sie die Tür des Cafés öffnete, hob niemand den Kopf. Niemand außer ihm. Es war kein dramatischer Moment, kein Blitzschlag, keine dieser Geschichten, die später von Schicksal sprechen. Draußen hing der Regen wie ein grauer Vorhang zwischen den Häusern, drinnen klirrte Geschirr, eine Espressomaschine zischte, jemand lachte zu laut. Und doch blieb für einen Augenblick alles stehen. Sie schob sich eine nasse Haarsträhne hinters Ohr, suchte mit dem Blick einen freien Platz und bemerkte nicht, dass ein Fremder am Fenster sein aufgeschlagenes Buch vergaß, weil er sie ansah, als hätte er nach etwas gesucht, von dem er bis eben nicht gewusst hatte, dass es ihm fehlte.
(Romananfang im Juni 2026 mit ChatGPT erstellt)
Woran würde man in diesem Text erkennen, dass er von der KI erstellt wurde?
Merkmal 1: Das verbrauchte Setting
Ich gebe diesen Prompt seit langem gerne bei Vorträgen, Seminaren und Workshops ein. Ohne dass ich nachgezählt habe, ist ein erstes empirisches Erkennungsmerkmal das verbrauchte Setting. Zu 90% beginnt der Text in einem Café oder in einer Buchhandlung. Ebenfalls wird es zu 90% regnen oder es wird Regen erwähnt. Ebenso treffen die beiden Protagonisten sofort im ersten Absatz aufeinander. Dabei ist es egal, mit welcher KI der Anfang erstellt wird.
Nun könnte man natürlich im Prompt bereits vorgeben, dass Cafés und Buchhandlungen als Schauplatz bitte nicht herangezogen werden, aber auch dann wird meist auf das Nächstliegende ausgewichen, nämlich auf die Welt der Verkehrsmittel (Bahnhof, Zug, Bus, Auto).
Merkmal 2: Der semantische Dreiklang
Ein weiteres, sehr typisches Merkmal von KI-Texten ist der sogenannte semantische Dreiklang. Auch den sehen wir im obigen Beispiel nicht nur einmal: »kein dramatischer Moment, kein Blitzschlag, keine dieser Geschichten«, »drinnen klirrte Geschirr, eine Espressomaschine zischte, jemand lachte zu laut«. Aus irgendwelchen stochastischen Gründen liebt die KI solche Dreierreihungen.
Merkmal 3: Die mehrfache Verneinung
Oft damit verbunden sind mehrfache Verneinungen nach dem Muster: »Nicht x, nicht y, nicht einmal z.« oder »… sondern z«. Auch das sehen wir hier: »kein dramatischer Moment, kein Blitzschlag, keine dieser Geschichten« oder im Ansatz auch in »hob niemand den Kopf. Niemand außer ihm.«
Merkmal 4: Abgegriffene Bilder
Noch ein Merkmal sind verbrauchte, abgegriffene oder wenig originelle Bilder wie hier der »Regen wie ein grauer Vorhang«.
Merkmal 5: Unsinnige Metaphern
Und nicht zuletzt sind wohlklingende Metaphern, die sich bei genauem Lesen als sprachlicher Unsinn entpuppen, oft ein Zeichen von KI-Einsatz. In unserem Beispiel, das ich bewusst nicht verändert habe, hält sich die KI dahingehend zurück. Ein klein wenig sehen wir einen solchen Unsinn dennoch in »als hätte er nach etwas gesucht, von dem er bis eben nicht gewusst hatte, dass es ihm fehlte.«
Merkmal 6: Emotionale Eintönigkeit
Würden wir diesen ersten Absatz von der KI weiterschreiben lassen, so würden wir mit Sicherheit ein weiteres Merkmal von KI-Texten feststellen: die emotionale Gleichförmigkeit. Die KI tendiert immer dazu, uns zu loben. Sie wägt gerne das eine gegen das andere ab. Wenn wir ihr einen Fehler nachweisen, entschuldigt sie sich sofort und gibt uns recht. Daraus resultiert, dass die emotionale Bandbreite in belletristischen KI-Texten nicht sonderlich hoch ist. Ein Gespräch am Frühstückstisch wird mit ähnlicher Emotionalität geschildert wie der erste Streit des Liebespaares.
Keines der Merkmale lässt auf KI schließen
Jedoch muss betont werden: Keines dieser Merkmale – genauso wenig wie der Gedankenstrich – ist ein Beweis für den KI-Einsatz. Auch Menschen verwenden unsinnige Metaphern, lassen die Handlung an wenig originellen Schauplätzen spielen oder verwenden den semantischen Dreiklang.
Man sieht aber an diesem sehr kurzen Beispieltext, den ich in keiner Weise angepasst habe und der vor Zeugen in einem Vortrag erzeugt wurde, dass die Häufung der Merkmale auf 100% KI schließen lässt und der Sachverhalt eindeutig ist. Lektorinnen und Lektoren werden diese Merkmale mittlerweile auch ohne Hilfsmittel erkennen.
Vergleich der KI-Detektoren
Umso besser, würde man meinen, werden es die sogenannten KI-Detektoren herausfinden, die wiederum KI-Modelle sind, die darauf trainiert wurden, KI-Merkmale zu erkennen.
Wir öffnen also das kostenfreie Werkzeug NoGPT, kopieren den ersten Absatz der Liebesgeschichte hinein.
Es wird zunächst angezeigt, dass es 107 Wörter sind. Die sprachliche Komplexität (Lexical Complexity) liege bei 53 von 100.
Wir klicken auf »Check for AI« und das Tool gibt aus:

Mit 99%iger Wahrscheinlichkeit von einem Menschen geschrieben!
Was? Bei so vielen zuvor erläuterten KI-Indikatoren hätte man es genau andersherum erwartet, zumal wir ja wissen, dass der Text zu 100% von der KI geschrieben wurde.
Ein zweiter Versuch mit dem kommerziellen Tool Pangram, das eine solch kleine Textmenge jedoch kostenfrei prüft. Ergebnis:

Mit 100%iger Wahrscheinlichkeit von einer KI geschrieben!
Wüssten wir es nicht besser, stünde es nun eindeutig Aussage gegen Aussage.
Welcher Prüfsoftware sollten wir dann aber glauben?
Einzige sichere Erkenntnis: Auch auf die Prüfsoftware ist kein Verlass, wir sollten unser Urteil niemals auf die Maschine stützen, es könnte falsch sein.
Denn: Die sogenannten KI-Detektoren sind keine Wundermaschinen – sie sind nichts weiter als eine KI, der eine andere Oberfläche übergestülpt wurde und der ein paar fest definierte Prompts mitgegeben wurden, so wie man es z. B. in Claude unter »Projects« machen kann.
Erkennt die KI ihre eigenen Werke?
Also machen wir einen dritten Versuch und fragen schlichtweg das KI-Modell Opus 4.8 von Claude nach dem Text. Wir formulieren möglichst neutral: Mit welcher Wahrscheinlichkeit ist der folgende Text von einem Menschen oder einer KI geschrieben? Was spricht für oder gegen wen? Das Ganze geben wir zudem im Inkognito-Modus ein, bei dem die KI ohne Vorwissen über den Nutzer agiert.
Und siehe da, Claude kommt zu dem Schluss, dass der Text mit 80 bis 90%iger Wahrscheinlichkeit von einer KI stamme. Die »rekursive Epiphanie-Formel« am Ende des Textes ist für Claude das stärkste Indiz: »Sie wirkt tief, kostet aber nichts und schließt die Vignette glatt ab.« Auch die anderen von mir genannten Merkmale erkennt Claude: die Dreier-Verneinung und das Ambiente-Triplett. Auch die fehlende Reibung wird als KI-Indiz gewertet. Nichts am Text überrasche.
Interessanterweise ist für Claude das Setting der Geschichte ein starkes Indiz für einen menschlichen Autor. Es sei »ein menschliches Klischee, lange älter als jede KI.«
Wie immer wird die KI am Schluss des Urteils ausgewogen und warnt davor, dass ihr Urteil auch falsch sein könnte.
Machen wir also am Schluss den ultimativen Test, der das Universum zur Implosion bringen könnte: Wir fragen ChatGPT selbst, ob der von ChatGPT geschriebene Text von einer KI stammt. Und zwar ebenfalls im Inkognito-Modus (Temporärer Chat), sodass die KI nicht weiß, dass sie den Text geschrieben hat.
Das Ergebnis: Die perfekte Konstruktion der Geschichte spreche für einen menschlichen Urheber. Kein Wort bei ChatGPT zu den Dreiklängen. Für die KI sprächen die extrem vertrauten Motive (Café, Regen, der Fremde, die Haarsträhne hinter dem Ohr …). Auch hier sagt ChatGPT, dass der Schlusssatz sehr nach »KI-Romantik« klinge.
Die Einschätzung von ChatGPT zum eigenen Text: »ca. 60% KI, 40% Mensch«.
Das Claude einen von ChatGPT verfassten Text deutlicher als KI-geschrieben einstuft als ChatGPT, ist dann doch eine interessante Beobachtung.
Ein KI-Text lässt sich nicht eindeutig erkennen
Kann man also einen KI-Text eindeutig erkennen? Nein. Weder kann dies ein Mensch noch die KI selbst. Allerdings kann die Häufigkeit der oben genannten Indizien eher für den KI-Einsatz sprechen. Ich selbst konnte den obigen Beispieltext klug analysieren, weil ich wusste, dass er von einer KI stammt. Aber ein Blindtest wäre ebenso wenig aussagekräftig, denn ein Mensch könnte sich den Spaß erlauben und wie eine KI schreiben.
Wir suchen nach dem Künstlichen im Text und finden dabei vor allem unsere eigene Sehnsucht nach dem Echten. Wir wollen Grenzen ziehen und merken, dass die Grenze längst durch uns hindurchläuft.
Wolfgang Tischer
Dieser Text wurde zur Veranstaltungsreihe »KI und Literatur« des Garnisonsschützenhauses Stuttgart im Rahmen des Literatursommers 2026 Baden-Württemberg verfasst.

