Eine neue Studie untersucht, ob künstliche Intelligenz (KI) ein maschineller Helfer bei kreativen Aufgaben sein könnte. Die Arbeit stammt von den Forschern Anil Doshi und Oliver Hauser vom University College London bzw. der University of Exeter und wurde in Science Advances veröffentlicht, wie TechCrunch berichtet.
Die Ergebnisse seien durchwachsen: KI habe scheinbar weniger kreativen Menschen geholfen, originellere Geschichten zu schreiben – aber die Kreativität der Gruppe insgesamt gedämpft, schreibt das Portal. Dies sei ein Spagat, der möglicherweise immer häufiger vorkomme, wenn KI-Tools auf kreative Bemühungen einwirkten.
Obwohl die Studie aufgrund ihrer Konzentration auf Kurzgeschichten notwendigerweise begrenzt sei, scheine sie ein gängiges Gefühl zu bestätigen: dass KI zwar hilfreich sein kann, aber letztlich nichts wirklich Neues bei kreativen Unternehmungen bietet.
Die Studie gebe einen ersten Einblick in die wichtige Frage, wie sich große Sprachmodelle und generative KI im Allgemeinen auf menschliche Aktivitäten, einschließlich Kreativität, auswirken werden, habe Hauser in einer E-Mail an TechCrunch geschrieben. Hauser weiter:
«Es gibt zwar ein enormes Potenzial (und zweifellos auch einen großen Hype) dieser Technologie, große Auswirkungen auf die Medien und die Kreativität im Allgemeinen zu haben. Aber es wird wichtig sein, dass KI tatsächlich rigoros evaluiert wird – und man sie nicht einfach auf breiter Front in der Annahme einsetzt, dass sie positive Ergebnisse haben wird.»
Im Rahmen des Experiments wurden Hunderte von Personen gebeten, sehr kurze Geschichten (etwa acht Sätze) zu einem beliebigen Thema zu schreiben, die für ein breites Publikum geeignet sein sollten, erläutert TechCrunch das Vorgehen. Eine Gruppe schrieb einfach selber. Eine zweite Gruppe hatte die Möglichkeit, ChatGPT-4 zu konsultieren, um eine einzige Story-Idee mit ein paar Sätzen zu finden. Davon konnten sie so viel oder so wenig verwenden, wie sie wollten. Eine dritte Gruppe konnte schließlich bis zu fünf solcher Story-Starter bekommen.
Die Geschichten wurden dann sowohl von ihren eigenen Schreibern als auch von einer zweiten Gruppe bewertet, die nichts über die generative KI-Nutzung wusste. Diese Personen bewerteten die Geschichten nach Neuartigkeit, Nützlichkeit (d. h. Wahrscheinlichkeit einer Veröffentlichung) und emotionalem Vergnügen.
Bei der Kreativität handelt es sich um ein Konzept, das nur schwer gemessen werden kann. Die Forscher hätten jedoch gesagt, ihr Ansatz sei in der Wissenschaft weit verbreitet und in anderen Studien gut dokumentiert. Hauser dazu:
«Es gibt jedoch eine Fülle von Forschungsergebnissen zur menschlichen Kreativität, und es gibt eine lebhafte Debatte darüber, wie man die Idee der Kreativität am besten in einem Maß erfassen kann.»
Die Wissenschaftler fanden heraus, das Geschichten von Personen mit einem niedrigen Kreativitätswert, die einfach nur schrieben, in Bezug auf Schreibqualität, Unterhaltungswert und Neuartigkeit zuverlässig schlechter bewertet wurden als andere. Wurde ihnen eine von der KI generierte Idee vorgelegt, schnitten sie in allen Kriterien besser ab. Wenn sie die Wahl zwischen fünf Ideen hatten, schnitten sie sogar noch besser ab.
Bedauerlicherweise hätten jedoch Teilnehmer, die beim Kreativitätskriterium besonders gut abgeschnitten hatten, kaum bis gar nicht von der KI profitiert. Teilweise hätten sie sogar – wenn auch sehr knapp und wohl nicht signifikant – schlechtere Bewertungen erhalten. Es scheine, dass die kreativen Teilnehmer ihre besten Ergebnisse erzielten, wenn sie überhaupt keine KI-Hilfe hatten, schreibt das Portal.
Aber das sei nicht der Teil, der die Forscher beunruhigt habe. Neben der subjektiven Bewertung der Geschichten durch die Teilnehmer führten die Forscher einige weitere Analysen durch. Sie nutzten zum Beispiel die Einbettungs-API von OpenAI, um zu bewerten, wie ähnlich jede Geschichte den anderen Geschichten in ihrer Kategorie war.
Dabei fanden sie heraus, dass der Zugang zu generativer KI dazu führte, dass die resultierenden Geschichten näher am Durchschnitt ihrer Kategorie lagen. Mit anderen Worten: Sie waren sich ähnlicher und variierten weniger als Gruppe. Der Gesamtunterschied lag im Bereich von neun bis zehn Prozent, es sei also nicht so, dass die Geschichten alle Klone voneinander waren, schreibt TechCrunch.
Die Ergebnisse waren ausreichend, um einen warnenden Hinweis in den Schlussfolgerungen zu rechtfertigen:
«Diese Ergebnisse deuten zwar auf eine Zunahme der individuellen Kreativität hin, doch besteht die Gefahr, dass die kollektive Neuartigkeit verloren geht.
Bei einem allgemeinen Gleichgewicht stellt sich die interessante Frage, ob die durch KI verbesserten und inspirierten Geschichten in der Lage sein werden, eine ausreichende Variation bei den Ergebnissen zu erzeugen, zu denen sie führen.
Kurz gesagt, unsere Ergebnisse deuten darauf hin, dass trotz des Verstärkungseffekts, den generative KI auf die individuelle Kreativität hatte, Vorsicht geboten ist, wenn generative KI in größerem Umfang für kreative Aufgaben eingesetzt wird.»
Auch die Befürchtung in der bildenden Kunst und bei Webinhalten spiegelten sich hier wider, so TechCrunch. Nämlich dass die KI, wenn sie zu mehr KI führe und das, worauf sie trainiert wird, nur mehr von sich selbst stamme, in einem sich selbst verstärkenden Kreislauf der Fadheit enden könnte.
Da sich generative KI in jedes Medium einschleiche, seien es Studien wie diese, die als Gegengewicht zu Behauptungen über grenzenlose Kreativität oder neue Epochen von KI-generierten Filmen und Songs dienten.
**********************
Unterstützen Sie uns mit einem individuellen Betrag oder einem Spenden-Abo. Damit leisten Sie einen wichtigen Beitrag für unsere journalistische Unabhängigkeit. Wir existieren als Medium nur dank Ihnen, liebe Leserinnen und Leser. Vielen Dank!
Oder kaufen Sie unser Jahrbuch 2023 (mehr Infos hier) mit unseren besten Texten im Webshop: