StartseiteSchreibenWie man erkennt, ob ein Roman mit KI geschrieben wurde

Wie man erkennt, ob ein Roman mit KI geschrieben wurde

15.06.2026

Aktualisiert am 15.06.2026

7 Min.

Screenhot des KI-Detektors Pangram mit einer von Google Gemini gezeichneten Lupe

Früher waren es Plagiate, heute sucht man in Texten nach Spuren von KI, jüngst in den Reden von Thüringens Ministerpräsident Mario Voigt. Meist werden dazu »KI-Detektoren« verwendet. Einige Lektorinnen sagen, sie könnten KI-Merkmale in Romanen auch ohne sie erkennen. Aber woran? Und wie zuverlässig ist das?

Inhaltsübersicht dieses Beitrags

Halluzinieren und KI-Detektoren

Die FAZ hat im Juni 2026 einen Gastbeitrag von Thüringens Ministerpräsident Mario Voigt »depubliziert«. Unter anderem waren darin Zitate frei erfunden, die auf das sogenannte »Halluzinieren« einer KI schließen ließen, also wenn Dinge einfach erfunden werden. Man habe bei der Recherche von FragDenStaat aber auch KI-Detektoren wie »Pangram« und »GPTZero« eingesetzt.

Im aktuellen Fall war die Analyse korrekt, und Voigt hat zugegeben, dass man in der Staatskanzlei KI einsetze. Man bedaure aber nur die fehlende Kennzeichnung.

KI-generierte Romane, so heißt es schon länger, würden mittlerweile Amazons Self-Publishing-Plattform KDP überschwemmen.

Woran erkennt man den KI-Einsatz bei Romanen?

Wenn man es so will, sind Romane eine einzige Halluzination, also schöpferische Texterfindungen. Woran erkennt man dann – auch ohne den Einsatz der KI-Detektoren –, dass KI verwendet wurde?

Merkmal 0: Satzzeichen

»An der Verwendung von Gedankenstrichen«, würden vielleicht einige sagen. Demnach geriete auch dieser Text sofort unter KI-Verdacht, denn ich habe gleich zwei im letzten Absatz verwendet. Doch ich garantiere, diesen Beitrag ohne KI verfasst zu haben – mit Ausnahme des bewusst eingesetzten und gekennzeichneten Textbeispiels unten. Ups, schon wieder ein Gedankenstrich. Zum Gedankenstrich habe ich mich bereits hier ausführlich geäußert.

Ein Beispieltext wird analysiert

Öffnen Sie also einmal eine beliebige KI (ChatGPT, Claude oder Gemini), und geben Sie die folgende, sehr allgemeine Anweisung (Prompt) ein:

Schreibe den ersten Absatz eines Liebesromans

ChatGPT gibt mir ohne weitere Kommentare Folgendes zurück:

Als sie die Tür des Cafés öffnete, hob niemand den Kopf. Niemand außer ihm. Es war kein dramatischer Moment, kein Blitzschlag, keine dieser Geschichten, die später von Schicksal sprechen. Draußen hing der Regen wie ein grauer Vorhang zwischen den Häusern, drinnen klirrte Geschirr, eine Espressomaschine zischte, jemand lachte zu laut. Und doch blieb für einen Augenblick alles stehen. Sie schob sich eine nasse Haarsträhne hinters Ohr, suchte mit dem Blick einen freien Platz und bemerkte nicht, dass ein Fremder am Fenster sein aufgeschlagenes Buch vergaß, weil er sie ansah, als hätte er nach etwas gesucht, von dem er bis eben nicht gewusst hatte, dass es ihm fehlte.
(Romananfang im Juni 2026 mit ChatGPT erstellt)

Woran würde man in diesem Text erkennen, dass er von der KI erstellt wurde?

Merkmal 1: Das verbrauchte Setting

Ich gebe diesen Prompt seit langem gerne bei Vorträgen, Seminaren und Workshops ein. Ohne dass ich nachgezählt habe, ist ein erstes empirisches Erkennungsmerkmal das verbrauchte Setting. Zu 90% beginnt der Text in einem Café oder in einer Buchhandlung. Ebenfalls wird es zu 90% regnen oder es wird Regen erwähnt. Ebenso treffen die beiden Protagonisten sofort im ersten Absatz aufeinander. Dabei ist es egal, mit welcher KI der Anfang erstellt wird.

Nun könnte man natürlich im Prompt bereits vorgeben, dass Cafés und Buchhandlungen als Schauplatz bitte nicht herangezogen werden, aber auch dann wird meist auf das Nächstliegende ausgewichen, nämlich auf die Welt der Verkehrsmittel (Bahnhof, Zug, Bus, Auto).

Merkmal 2: Der semantische Dreiklang

Ein weiteres, sehr typisches Merkmal von KI-Texten ist der sogenannte semantische Dreiklang. Auch den sehen wir im obigen Beispiel nicht nur einmal: »kein dramatischer Moment, kein Blitzschlag, keine dieser Geschichten«, »drinnen klirrte Geschirr, eine Espressomaschine zischte, jemand lachte zu laut«. Aus irgendwelchen stochastischen Gründen liebt die KI solche Dreierreihungen.

Merkmal 3: Die mehrfache Verneinung

Oft damit verbunden sind mehrfache Verneinungen nach dem Muster: »Nicht x, nicht y, nicht einmal z.« oder »… sondern z«. Auch das sehen wir hier: »kein dramatischer Moment, kein Blitzschlag, keine dieser Geschichten« oder im Ansatz auch in »hob niemand den Kopf. Niemand außer ihm.«

Merkmal 4: Abgegriffene Bilder

Noch ein Merkmal sind verbrauchte, abgegriffene oder wenig originelle Bilder wie hier der »Regen wie ein grauer Vorhang«.

Merkmal 5: Unsinnige Metaphern

Und nicht zuletzt sind wohlklingende Metaphern, die sich bei genauem Lesen als sprachlicher Unsinn entpuppen, oft ein Zeichen von KI-Einsatz. In unserem Beispiel, das ich bewusst nicht verändert habe, hält sich die KI dahingehend zurück. Ein klein wenig sehen wir einen solchen Unsinn dennoch in »als hätte er nach etwas gesucht, von dem er bis eben nicht gewusst hatte, dass es ihm fehlte.«

Merkmal 6: Emotionale Eintönigkeit

Würden wir diesen ersten Absatz von der KI weiterschreiben lassen, so würden wir mit Sicherheit ein weiteres Merkmal von KI-Texten feststellen: die emotionale Gleichförmigkeit. Die KI tendiert immer dazu, uns zu loben. Sie wägt gerne das eine gegen das andere ab. Wenn wir ihr einen Fehler nachweisen, entschuldigt sie sich sofort und gibt uns recht. Daraus resultiert, dass die emotionale Bandbreite in belletristischen KI-Texten nicht sonderlich hoch ist. Ein Gespräch am Frühstückstisch wird mit ähnlicher Emotionalität geschildert wie der erste Streit des Liebespaares.

Keines der Merkmale lässt auf KI schließen

Jedoch muss betont werden: Keines dieser Merkmale – genauso wenig wie der Gedankenstrich – ist ein Beweis für den KI-Einsatz. Auch Menschen verwenden unsinnige Metaphern, lassen die Handlung an wenig originellen Schauplätzen spielen oder verwenden den semantischen Dreiklang.

Man sieht aber an diesem sehr kurzen Beispieltext, den ich in keiner Weise angepasst habe und der vor Zeugen in einem Vortrag erzeugt wurde, dass die Häufung der Merkmale auf 100% KI schließen lässt und der Sachverhalt eindeutig ist. Lektorinnen und Lektoren werden diese Merkmale mittlerweile auch ohne Hilfsmittel erkennen.

Vergleich der KI-Detektoren

Umso besser, würde man meinen, werden es die sogenannten KI-Detektoren herausfinden, die wiederum KI-Modelle sind, die darauf trainiert wurden, KI-Merkmale zu erkennen.

Wir öffnen also das kostenfreie Werkzeug NoGPT, kopieren den ersten Absatz der Liebesgeschichte hinein.

Es wird zunächst angezeigt, dass es 107 Wörter sind. Die sprachliche Komplexität (Lexical Complexity) liege bei 53 von 100.

Wir klicken auf »Check for AI« und das Tool gibt aus:

Ki-Prüfung: Das Ergebnis von NoGPT (Screenshot)

Mit 99%iger Wahrscheinlichkeit von einem Menschen geschrieben!

Was? Bei so vielen zuvor erläuterten KI-Indikatoren hätte man es genau andersherum erwartet, zumal wir ja wissen, dass der Text zu 100% von der KI geschrieben wurde.

Ein zweiter Versuch mit dem kommerziellen Tool Pangram, das eine solch kleine Textmenge jedoch kostenfrei prüft. Ergebnis:

Ki-Prüfung: Das Ergebnis von Pangram (Screenshot)

Mit 100%iger Wahrscheinlichkeit von einer KI geschrieben!

Wüssten wir es nicht besser, stünde es nun eindeutig Aussage gegen Aussage.

Welcher Prüfsoftware sollten wir dann aber glauben?

Einzige sichere Erkenntnis: Auch auf die Prüfsoftware ist kein Verlass, wir sollten unser Urteil niemals auf die Maschine stützen, es könnte falsch sein.

Denn: Die sogenannten KI-Detektoren sind keine Wundermaschinen – sie sind nichts weiter als eine KI, der eine andere Oberfläche übergestülpt wurde und der ein paar fest definierte Prompts mitgegeben wurden, so wie man es z. B. in Claude unter »Projects« machen kann.

Erkennt die KI ihre eigenen Werke?

Also machen wir einen dritten Versuch und fragen schlichtweg das KI-Modell Opus 4.8 von Claude nach dem Text. Wir formulieren möglichst neutral: Mit welcher Wahrscheinlichkeit ist der folgende Text von einem Menschen oder einer KI geschrieben? Was spricht für oder gegen wen? Das Ganze geben wir zudem im Inkognito-Modus ein, bei dem die KI ohne Vorwissen über den Nutzer agiert.

Und siehe da, Claude kommt zu dem Schluss, dass der Text mit 80 bis 90%iger Wahrscheinlichkeit von einer KI stamme. Die »rekursive Epiphanie-Formel« am Ende des Textes ist für Claude das stärkste Indiz: »Sie wirkt tief, kostet aber nichts und schließt die Vignette glatt ab.« Auch die anderen von mir genannten Merkmale erkennt Claude: die Dreier-Verneinung und das Ambiente-Triplett. Auch die fehlende Reibung wird als KI-Indiz gewertet. Nichts am Text überrasche.

Interessanterweise ist für Claude das Setting der Geschichte ein starkes Indiz für einen menschlichen Autor. Es sei »ein menschliches Klischee, lange älter als jede KI.«

Wie immer wird die KI am Schluss des Urteils ausgewogen und warnt davor, dass ihr Urteil auch falsch sein könnte.

Machen wir also am Schluss den ultimativen Test, der das Universum zur Implosion bringen könnte: Wir fragen ChatGPT selbst, ob der von ChatGPT geschriebene Text von einer KI stammt. Und zwar ebenfalls im Inkognito-Modus (Temporärer Chat), sodass die KI nicht weiß, dass sie den Text geschrieben hat.

Das Ergebnis: Die perfekte Konstruktion der Geschichte spreche für einen menschlichen Urheber. Kein Wort bei ChatGPT zu den Dreiklängen. Für die KI sprächen die extrem vertrauten Motive (Café, Regen, der Fremde, die Haarsträhne hinter dem Ohr …). Auch hier sagt ChatGPT, dass der Schlusssatz sehr nach »KI-Romantik« klinge.

Die Einschätzung von ChatGPT zum eigenen Text: »ca. 60% KI, 40% Mensch«.

Das Claude einen von ChatGPT verfassten Text deutlicher als KI-geschrieben einstuft als ChatGPT, ist dann doch eine interessante Beobachtung.

Ein KI-Text lässt sich nicht eindeutig erkennen

Kann man also einen KI-Text eindeutig erkennen? Nein. Weder kann dies ein Mensch noch die KI selbst. Allerdings kann die Häufigkeit der oben genannten Indizien eher für den KI-Einsatz sprechen. Ich selbst konnte den obigen Beispieltext klug analysieren, weil ich wusste, dass er von einer KI stammt. Aber ein Blindtest wäre ebenso wenig aussagekräftig, denn ein Mensch könnte sich den Spaß erlauben und wie eine KI schreiben.

Wir suchen nach dem Künstlichen im Text und finden dabei vor allem unsere eigene Sehnsucht nach dem Echten. Wir wollen Grenzen ziehen und merken, dass die Grenze längst durch uns hindurchläuft.

Wolfgang Tischer

Dieser Text wurde zur Veranstaltungsreihe »KI und Literatur« des Garnisonsschützenhauses Stuttgart im Rahmen des Literatursommers 2026 Baden-Württemberg verfasst.

Weitere Beiträge zum Thema

Vorheriger Beitrag

SPIEGEL-Bericht: Bundesregierung lässt frühkindliche Leseförderung auslaufen

Nächster Beitrag

S. Fischer zieht von Frankfurt nach Berlin: Wo bleibt die Provinz?

8 Kommentare

Hans Peter Roentgen 15.06.2026 um 14:03

Danke, Wolfgang Tischer
Ich lektoriere seit über 20 Jahren Anfängertexte und habe all die geannten KI Merkmale immer wieder in diesen Texten gefunden.
übrigens bieten Ki Testprogramme mittlerweile hlte Dienstleistung an, Texte so umzuschreiben, dass keiner mehr di KI Urheberrschaft erkennen würde.

Auf diesen Kommentar antworten
Matthias Burisch 15.06.2026 um 16:11

Danke und Kompliment — sehr gute Analyse!
MB

Auf diesen Kommentar antworten
Marieluise 15.06.2026 um 16:59

Wer braucht denn die genaue Unterscheidung? Ich teile ein nach langweiliger und origineller Literatur. Bei eigenen Versuchen hat noch keine KI irgendwas hervorgebracht, das ich originell oder spannend nennen würde. Wie oben schon erwähnt, trifft das aber auch auf 90% aller human erzeugten Texte zu. Ob der Schrott von Möchtegernis oder von KI stammt, ist mir total wurscht.
Ich schlage in einer Buchhandlung irgendein Buch auf irgendeiner Seite auf, die ich probehalber lese. Vielleicht noch eine zweite. Dann weiß ich, ob ich das ganze Buch lesen möchte, und ich wurde noch nie enttäuscht. Wenn KI es in diese Auswahl schaffen würde: Hut ab! Aber KI ist nun mal kein kreatives Hirn, sondern ein sehr begabter Papagei.

Auf diesen Kommentar antworten
Brigitte Schulz 15.06.2026 um 17:23

Da haben wir es doch: Die Detektoren würfeln um die Wette und der Literaturbetrieb manövriert sich erfolgreich in die psychologische Falle! Wenn die KI jetzt schon unsere jahrtausendealten Stilmittel nutzt, um sich im Blindtest erfolgreich als menschlich zu tarnen, während menschliche Lektoren in Zukunft panisch die Haarsträhnen ihrer Protagonistinnen wegzensieren und nur noch gutes Wetter tolerieren, bleibt nur ein Fazit: Am Ende jagen wir als moderne Maschinenstürmer das Gespenst der KI im Spiegelbild unserer eigenen Kulturgeschichte und die KI kichert leise im Hintergrund – natürlich im klassischen Trikolon: veni, vidi, vici.

Auf diesen Kommentar antworten
Stefan Rohmann 15.06.2026 um 19:10

Als Kosument kann es mir egal sein, wer den Text geschrieben hat, so lange er gut ist, und meinen Geschmack trifft.

Auf der Produzentenseite schaut es freilich anders aus.
Wenn eine KI so gut (oder schlecht) wie ein Mensch schreiben kann, nur viel schneller und billiger, wozu dann Autoren bezahlen? Ganz besonders im Bereich von Trivialromanen und Alltagsratgebern, wo die Ansprüche entsprechend niedriger sind?

Und wenn ein Verlag keine Autoren mehr braucht, braucht Amazon keine Verlage mehr, denn die haben die IT-Infrastruktur und Know-how um die leistungsstärkste, modernste KI zu nutzen, und den Online-Shop, um die Bücher direkt an den Kunden zu verkaufen, ebenfalls.

Auf diesen Kommentar antworten
Heike Haimerl 18.06.2026 um 16:23

Herzlichen Dank für diese sehr aufschlussreiche Analyse!

Auf diesen Kommentar antworten
Grfndr 19.06.2026 um 13:59

Ich denke, dass uns dieses Thema in ein paar Monaten schon nicht mehr interessieren wird. Es erinnert mich an die Debatten der 80er Jahre, in denen ernsthaft darüber gestritten wurde, ob man Bücher auf dem Computer schreiben darf statt auf der elektrischen Schreibmaschine (vermutlich gab ähnliche Debatten schon bei der Erfindung des Federkiels, des Kugelschreibers und der Schreibmaschine) oder an die einst beliebte Frage, ob CDs sich besser oder schlechter („echter“) anhören als Schallplatten?. Wie Marieluise oben schreibt: Hauptsache, man wird gut unterhalten. Und wie sie habe ich eine Menge Bücher von „echten Menschen“ gelesen, die so schlecht geschrieben sind, dass ChatGPTs Hervorbringungen wie literarische Meisterwerke wirken. – Noch ein Gedanke dazu: wie wird sich der Habsburg-KI-Effekt auf die Literaturproduktion auswirken (wenn es ihn denn gibt, was mir nicht unplausibel erscheint)? Und wäre das Resultat besser oder schlechter, als wenn sich die aktuelle Literaturproduktion den Trends und Moden angleicht, die an Schreibschulen und Seminaren in Leipzig und anderswo gelehrt werden? Herzliche Grüße in die Runde!

Auf diesen Kommentar antworten
Silvio 21.07.2026 um 18:48

Ich habe es selbst mal ausprobiert: Einen eigenhändig geschriebenen Text, der noch aus Zeiten weit vor der KI stammt – ein Märchen mit typischer Formelhaftigkeit. Ergebnis im ersten Detektor: 61 % von KI geschrieben – wie gesagt: mindestens fünf Jahre vor der KI. Zweiter Detektor: 86 %. Dritter Detektor: 0 %.
Umgekehrt: ein KI-generierter Text. Erster Detektor: 96 %. Zweiter Detektor: 0 %. Dritter Detektor: 80 %.
Was zu beweisen war …

Alle Bindestriche und Dreierreihen sind ein Geschenk für die KI.

Auf diesen Kommentar antworten