StartseiteHörbücherTod der Hörbuchsprecher? Apple lässt künstliche Intelligenz vorlesen

Tod der Hörbuchsprecher? Apple lässt künstliche Intelligenz vorlesen

Hinweis auf eine Computerstimme als Vorleserin in Apple Books (Foto: Screenshot)
Hinweis auf eine Computerstimme als Vorleserin in Apple Books (Foto: Screenshot)

Unter dem Titel »Death of the narrator?« berichtet der Guardian, dass Apple neuerdings mit einer Computerstimme vertonte Hörbücher verkauft. Doch wer jetzt denkt: »Wer will sowas hören?«, denkt zu kurz. Der Markt ist groß, die Gewöhnung hoch.

»Dieses Hörbuch wird von ›Madison‹ vorgelesen«

Ohne Pressemitteilung und das übliche Marketing-Tamtam bietet Apple ab sofort von einer künstlichen Intelligenz vertonte Hörbücher im eigenen Online-Shop an. Statt des Namens einer Sprecherin oder Sprechers steht dort »Von Apple Books vorgelesen«. In einer Info-Box heißt es »Dieses Hörbuch wird von ›Madison‹ vorgelesen, einer digitalen Stimme, die auf einer menschlichen basiert«.

Madison hört sich erstaunlich gut an. Die Intonation ist kein Vergleich mit Apples Computerstimme »Siri« oder den anderen bislang bekannten computergenerierten Stimmen, beispielsweise in Navigationssystemen.

Stimmen speziell fürs Romance-Genre

Auf einer Info-Seite schreibt Apple, dass diese Stimmen speziell für Hörbücher entwickelt wurden. Und nicht nur das: Sie sind von Linguisten und Toningenieuren sogar speziell fürs Genre »Romance« kreiert (»literary, historical, and women’s fiction are eligible«). Thriller, Fantasy oder Science-Fiction werden laut Apple hingegen aktuell nicht unterstützt.

Das männliche Stimm-Pendant zu »Madison« (Stimmlage Sopran) heißt »Jackson« (Stimmlage Bariton). Zudem soll es in Kürze auch vertonte Sachbücher geben. Hier kommen dann »Helena« und »Mitchell« zum Einsatz.

Schnelle und kostenlose Vertonung

Apple schreibt, dass der Hörbuchmarkt weiterhin wachsend sei und mit den Digitalstimmen eine schnellere und kostengünstigere Vertonung gerade für Self-Publisher möglich sei. Über Apples Partner wie »Draft2Digital« und »Ingram CoreSource« ist die Realisierung kostenlos. Derzeit funktioniert dies nur für englischsprachige Texte, die nicht zu komplex sein dürfen, keine anderssprachigen Passagen beinhalten und eben vorzugsweise dem Genre »Romance« angehören sollten. Das E-Book muss bereits bei Apple Books angeboten werden, und das Manuskript ist als Word-Datei ohne aufwändige Formatierungen einzureichen.

Die Computerstimme scheint nicht einfach nur »vom Blatt« zu lesen. Laut Apple durchläuft die Hörbuchfassung verschiedene Qualitätschecks, und es ist mit einer Produktionszeit von ein bis zwei Monaten zu rechnen.

Qualität »Kaufhausradio«

Doch Hörbuchsprecherinnen und -sprecher müssen nicht zittern und Angst um ihren Job haben. Obwohl Madison und Digitalkollegen erstaunlich gut klingen, besitzen sie eher die Qualität »Kaufhausradio«. Gut, aber dann doch allzu gleichmäßig. Die verschiedenen Charaktere der Geschichte sprechen ähnlich, von einer künstlerisch-dramaturgischen Interpretation sind die vom Computer gesprochenen Hörbücher immer noch weit entfernt.

Zu schnell sollte man aber nicht müde abwinken. Denn gerade im Romance-Genre sind auch viele von menschlichen Sprechern interpretierte Hörbücher eher lieblos und ohne große Ambitionen vorgelesen. Auch diese Produktionen haben nicht immer einen künstlerisch-dramaturgischen Anspruch und liegen eher diametral zu Sprachartisten wie Rufus Beck oder Christian Brückner.

Hoher Gewöhnungseffekt

Und genau auf diesen Markt zielt Apple ab. Bereits vor Jahren haben Untersuchungen mit technisch schlecht codierten MP3-Dateien gezeigt, dass man sich daran gewöhnt, ja irgendwann sogar die bessere Version verschmäht und die gewohnte, schlechtere bevorzugt.

Mit Madison oder Jackson könnte es ähnlich sein.

Wolfgang Tischer

Links ins Web:

Weitere Beiträge zum Thema

1 Kommentar

  1. Es kommt darauf an, wozu man das Hörbuch verwenden will. Braucht man es zum Einschlafen, reicht das auch ohne Apples Zutun schon reichlich vorhandene Mittelmaß.
    Ich meine, dass man die wirklich exzellenten deutschsprachigen Textinterpreten (Damen und Herren) an zwei Händen abzählen kann, hinzugerechnet noch ein paar glanzvolle, die leider schon verstorben sind. Die wird eine KI nie toppen können. Außer die Nachbearbeitung ist aufwändiger als die Aufnahme mit einem Top-Sprecher. Wenn die Ableser ( teilweise sehr bekannte Namen, die das einzige Kaufargument sind) von Automaten ersetzt werden, habe ich kein Mitleid.

Schreiben Sie einen Kommentar

Bitte geben Sie Ihren Kommentar ein.
Bitte geben Sie Ihren Namen ein