Дослідники зі Stony Brook University та Columbia Law School провели експеримент , у якому ШІ-моделі навчалися стилю 50 відомих письменників, серед яких лауреати Хан Канг та Салман Рушді. Професійні автори і три основні ШІ-системи — GPT-4o, Claude 3.5 Sonnet і Gemini 1.5 Pro — створили тексти у стилі цих літераторів, а 159 учасників оцінювали уривки, не знаючи, хто їх написав.
Для базового порівняння використовували «in-context prompting», а для глибшого наслідування стилю застосували «fine-tuning» GPT-4o на двох книгах кожного автора. Читачі обирали, який текст кращий за стилем і якістю, маючи при цьому фрагмент оригінального твору для порівняння. Кожен уривок оцінювали кілька людей, щоб результати були надійними.
Результати показали, що після «fine-tuning» експерти у вісім разів частіше віддавали перевагу текстам ШІ за стилем і вдвічі частіше — за якістю письма. Майже всі такі уривки залишалися невиявленими сучасними інструментами для визначення ШІ-текстів. Кількість навчальних даних майже не впливала на здатність ШІ наслідувати стиль: авторів із двома книжками копіювали так само вдало, як і тих, хто має десятки видань.
Дослідники підрахували, що навчання ШІ на стилі одного автора коштує близько 81 долара, тоді як професійний імітатор взяв би за таку роботу понад 25 тисяч доларів. Вони зазначили, що базові тексти ШІ часто містять кліше і надмірну ввічливість, але цільове навчання ці проблеми майже усуває.


