Forschende von Google untersuchen, wie kreative Profischreiber und -schreiberinnen zu Künstlicher Intelligenz als Schreibhilfe stehen.
Für ein Experiment beauftragte Googles Forschungsteam 13 Profi-Schreiber aus verschiedenen Bereichen des kreativen Schreibens, ihre Geschichten mit dem KI-Schreibwerkzeug Wordcraft zu verfassen. Sie schrieben Texte mit 1000 bis 1500 Wörtern ohne inhaltliche Vorgaben.
Wordcraft ist ein Text-Editor mit eingebauter KI-Schreibhilfe, die auf Googles Dialog-optimiertem KI-Modell LaMDA basiert. Wordcraft wurde speziell für das Schreiben kreativer und fiktionaler Texte entwickelt. Das Tool ist noch nicht öffentlich verfügbar.
Das gilt auch für LaMDA, das eines der derzeit leistungsfähigsten Sprachmodelle sein soll. Besondere Aufmerksamkeit bekam es im Sommer 2022, als der frühere Google-Ingenieur Blake Lemoine behauptete, das Sprachsystem habe ein Bewusstsein erlangt. Er ließ sich von LaMDAs Dialogfähigkeit, die sich an den Aussagen und Implikationen des Gesprächspartners orientiert, in die Irre führen.
KI ist noch kein Ersatz für Profi-Schreiberinnen, sagen Profi-Schreiberinnen
Der Profi-Schreibtest lief über acht Wochen. Das Team befragte die Schreiber:innen in zwei 45-minütigen Interviews, eines am Anfang des Tests, um Erwartungen zu ermitteln, und eines danach, für die Abfrage von Erfahrungen.
Zudem führten alle Teilnehmenden ein KI-Schreibtagebuch, in dem sie anhand vorgegebener Leitfragen ihre Erfahrungen notierten. Diese Protokolle werteten die Forschenden zusammen mit den Interviews ausführlich aus.
Die grundlegenden Erkenntnisse des Forschungsteams:
- Keiner der 13 Profis sieht sich durch die KI-Texthilfe beruflich bedroht.
- Das größte Potenzial der Technologie beschreiben sie darin, dass die KI kreatives Schreiben für Profis und Hobbyisten "einfacher, schneller und unterhaltsamer" gestalten könnte.
- Das Sprach-Werkzeug eigne sich zudem für die Ideen- und Detailfindung in Geschichten.
- Entwickelnde von KI-Sprachwerkzeugen sollten sich auf die Teile des Schreibens fokussieren, die am wenigsten Freude bereiten, und die Zielgruppe in die Entwicklung einbeziehen.
Mangelnde Konsistenz und langweilige Vorschläge
Als ein Hindernis bei der Textgenerierung beschrieben die Studienteilnehmer die fehlende erzählerische Konsistenz von LaMDA - ein Problem, das alle gängigen großen Sprachmodelle betrifft. Mit den derzeit bekannten Architekturen beschränkt sich deren Aufmerksamkeit auf kurze Absätze, was sie ungeeignet macht für lange, in sich stimmige Texte mit einer klaren dramaturgischen Abfolge und etwa konsistent wiederkehrenden Protagonisten.
Die Teilnehmenden kritisierten zudem langweilige Vorschläge ohne Charakter und klare Handschrift sowie Schwächen bei der Nutzerführung von Wordcraft. Die Langweile-Kritik sehen die Forschenden als Dilemma: Große KI-Sprachmodelle wie LaMDA sind in ihren Generierungsfähigkeiten bewusst eingeschränkt, damit sie keine ethischen oder moralischen Grenzen überschreiten.
"Ein System, das immer auf die Vermeidung von Überschreitungen achtet, behindert sich selbst dabei, jemals menschliche Kreativität zu erreichen, die oft auf der Ablehnung von Tropen und Normen beruht", schreibt das Forschungsteam.
Das Copyright-Problem trifft auch Roman-KIs
Drei Studienteilnehmer äußerten zudem Bedenken darüber, dass die Quelle der Wordcraft-Textvorschläge unbekannt sei. Sollte Wordcraft Textauszüge unverändert etwa aus anderen Romanen übernehmen, könnte dies zu einem Imageschaden beim Autor führen oder sogar rechtliche Konsequenzen haben.
Ein Autor beschrieb Wordcraft-Vorschläge aus den Welten von Doctor Who und Avatar. Die KI-Software habe zudem versucht, bekannte Charaktere wie den Zauberer von Oz und Megatron (Transformers) in die Handlung einzubauen.
Eine mögliche Lösung für dieses Problem könnte sein, dass Wordcraft zukünftig vorab übers Internet kontrolliert, ob ein Text womöglich durch Copyright geschützt ist. Allerdings, so räumen die Forschenden ein, könnten Sprachmodelle die Arbeiten anderer Autor:innen auf subtilere Art replizieren als durch direkte Kopien. Ähnliche Copyright-Diskussionen existieren bei Bildern und bei Code.
Einer der größten Erfolge unserer Studie bestand darin, dass wir die heterogenen Bedürfnisse und Wünsche der Autoren an einen KI-Assistenten aufzeigen konnten. So wie verschiedene Autoren unterschiedliche Rollen benötigen, die von ihren Beta-Lesern und Co-Autoren wahrgenommen werden sollen, fanden wir heraus, dass die Meinungen der Teilnehmer über die richtige Rolle der KI sehr unterschiedlich sind.
Aus dem Paper
Eine detaillierte Auswertung gibt es im Paper "Creative Writing with an AI-Powered Writing Assistant:
Perspectives from Professional Writers".