Афоризм «публикуйся или умри» описывает весьма актуальную для научного мира проблему, которая заключается в постоянном давлении на учёных для постоянной публикации научных работ как для продвижения в академической карьере, так и для привлечения спонсоров. Как следствие, отчаявшиеся исследователи вынуждены производить мириады бесцельных и не поддающихся репликации научных работ или даже платить кому-то за их написание. Более того, множество таких «сочинений» публикуются в уважаемых научных изданиях, и недавнее исследование в исполнении нейропсихолога Бернхарда Забеля демонстрирует тревожную тенденцию – около 30% научных работ содержат откровенный плагиат или сфабрикованные данные.
Бернхард Забель и его коллеги разработали ИИ-модель, способную идентифицировать признаки плагиата или неподтверждённого фактами сочинительства в научных работах. Когда после продолжительной тренировки алгоритм научился находить «красные флаги» с точностью до 90%, учёные использовали его для анализа примерно 5000 исследований в сфере нейронауки и медицины, которые прошли рецензирование и были изданы в разнообразных научных журналах в 2020 году. По оценкам ИИ, до 34% нейронаучных и до 24% медицинских научных работ представляли собой «подделки». Оба значения существенно превышают любые прежние оценки специалистов. По словам Забеля, из-за специфики работы алгоритма ИИ мог увидеть признаки недобросовестных исследований даже в достойных работах, однако последующий пересмотр данных показал, что на каждую сотню «подозрительных» публикаций 63 исследования действительно оказывались поддельными.
Бернхард Забель руководит институтом медицинской психологии в Университете Отто фон Герике в Магдебурге, а также является редактором международного научного журнала «Restorative Neurology and Neuroscience». В работе с журналом он на собственном опыте убедился в растущем числе недобросовестно выполненных научных работ, однако результаты анализа исследований при помощи ИИ-алгоритма оказались шокирующими даже для него. По мнению Забеля и его коллег, большую роль в увеличении количества низкокачественных исследований играет деятельность так называемых «бумажных фабрик», которые создают и распространяют сфабрикованные или сплагиаченные научные работы. По некоторым данным, стоимость таких рукописей составляет от $1000 до $25000, однако никакие деньги не могут гарантировать высокого качества исполнения, и зачастую эти работы являются лишь условно приемлемыми для рецензирования.
Поскольку данная проблема всё ещё считается относительно незначительной – по отчасти устаревшим оценкам, 1 сфабрикованная работа приходится на тысячи полноценных исследований, научное сообщество только начинает пересматривать процедуры рецензирования и прочих способов проверки потенциальных публикаций. В действительности же, по словам Забеля, число недобросовестных исследований значительно выше ожидаемого: с 2010 по 2020 гг. в некоторых журналах их численность выросла в среднем на 12%. Более того, на фоне развития генеративных ИИ-технологий вроде ChatGPT их количество будет только увеличиваться. Самый высокий процент сфабрикованных публикаций наблюдается в КНР, рф, Турции, Египте и Индии. По мнению учёных, для сохранения репутации как научных изданий, так и многочисленных научных институций необходимо ускорить работу над созданием эффективных инструментов и методик идентификации низкокачественных исследований с признаками фабрикации, плагиата и кризиса репликации.