Ново откритие на всеки 37 часа или приключенията на ИИ в научното общество
Историята на уволнен професор химик, който продължава да е професор - просто на друго място
Испанският университет в Кордоба наскоро уволни един от най-плодотворните си и цитирани сътрудници - специалиста по катализа и колоидна химия Рафаел Луке. Той е работил в университета почти 15 години и за това време е публикувал над 700 научни статии. Само през тази година името му фигурира в списък от 58 статии - El Pais изчислява, че Луке е правил ново откритие средно на всеки 37 часа. Не е трудно да се предположи, че този скок в научната продуктивност се дължи на появата на бота ChatGPТ, който ученият признава, че е използвал "за подобряване на качеството на текстовете". Невронните мрежи обаче не създадоха, а по-скоро задълбочиха проблема с публикуването на т.нар. научен боклук, посочват ентусиастите на наукометриката. Сега, с появата на ChatGPT, за недобросъвестните учени е много по-лесно да произвеждат такива "боклуци" и много по-трудно да се разпознават.
Още по темата
Цитиранията на статиите са ключов показател за успех в съвременната система на наукометрията. Тя показва колко често работата на даден изследовател се цитира от колегите му. За да увеличат броя на цитиранията, учените трябва, първо, да публикуват статии често и второ, да го правят в много популярна област, която се развива активно (в случая на Рафаел Луке това например е "зелената химия"). Индексът на цитируемост на даден изследовател влияе не само върху личната му репутация и шансовете му да получи финансиране за своите изследвания, но и върху престижа на цялата институция, в която работи. Колкото повече цитирани изследователи работят в един университет, толкова по-висока е позицията му във всевъзможни класации.
Например благодарение на Рафаел Лука (както твърди самият той) Университетът в Кордоба се издига в престижната Шанхайска класация - световна академична класация на университетите. Въпреки това ръководството на института отстрани учения със забрана за работа за 13 години. Това може да изглежда като лична история на един човек, но всъщност историята показва в колко голям проблем се е превърнала надпреварата в цитирането в академичния свят в последно време.
Очевидно е, че публикуването на добра статия не е лесно. Понякога са необходими години за провеждане на изследвания. Съвременната система за оценка на резултатите в науката обаче е устроена така, че да публикуваш редовно е просто необходимо - иначе ще останеш без пари и лабораторията ти ще бъде закрита (оттук и популярната в академията поговорка publish or perish - "публикувай или загивай"). Затова много учени увеличават шансовете си за публикуване, като помагат на колегите си в техните изследвания - и в замяна получават авторство в техните статии. В това няма нищо лошо, стига да имате време. То обаче е ограничен ресурс, който винаги е в недостиг.
В крайна сметка надпреварата за публикуване доведе до процъфтяване на търговията с авторски материали - срещу заплащане авторите на вече завършена статия могат да ви включат в своята компания, преди да изпратят творбата за публикуване. При това можете да си купите не само авторство, но и линкове към работата си. Според "ловците на призраци" в областта на наукометрията Ник Уайз и Александър Магазинов статиите за такива "комерсиални" публикации се изготвят до голяма степен чрез копиране на откъси от вече публикувани статии или чрез използване на генератори на текст с изкуствен интелект.
С появата на ChatGPT последната задача е особено лесна: софтуерът може просто да бъде помолен да напише статията, като използва ключови думи. И Луке признава, че от декември 2022 г. активно използва инструмента "за подобряване на качеството на текстовете си". Но това не е първият път, в който Магазинов се опитва да го хване за ръката, за да докаже, че испанският химик е твърде запален по "подобряването".
ChatGPT не е първият, макар и най-усъвършенстван генератор на текстове, който може да се използва за писане на статии
Системи за автоматизирано генериране на текст се появиха много преди появата на ChatGTP и дори преди появата на архитектурата на трансформърите, която направи възможно това да се прави възможно най-ефективно. Още през 2015 г. в кратка статия в собствения си блог експертът по машинно обучение Андрей Карпати убедително показа, че дори много прости невронни мрежи могат да се използват за бързо генериране на доста убедителни текстове в различни жанрове, включително наподобяващи истински академични статии. Преди широкото разпространение на невронните мрежи подобни методи за генериране на "псевдонаучни глупости" бяха използвани от ентусиасти, които просто ги използваха като инструмент за разкриване на хищническата същност на нечистите списания и нечистите статии. Един от най-известните примери за такива научни провокации включва статията "Изкоренител: Алгоритъм за типичната унификация на точките за достъп и излишък". Още през 2005 г. тази безсмислена статия е генерирана от алгоритъма SCIgen (без да се използват невронни мрежи) и е приета като доклад на научна конференция, а след това автоматичният ѝ превод е публикуван от Михаил Гелфанд в руско списание за научни публикации на студенти и докторанти, което предизвиква невиждан скандал.
С появата на съвременните езикови модели обаче ситуацията се обърна. Сега генерираните текстове станаха толкова външно сходни с истинските статии, че поне теоретично могат да се използват не за провокация на нечистоплътни списания, а за заблуда на списания с относително добра репутация. За да уловят генерираните статии, Александър Магазинов и неговите колеги съмишленици предлагат набор от критерии.
Първият показател за генериран текст е наличието на "измислени" фрази - когато често срещано явление се назовава от програмата с други думи, за да се избегне директното заемане (защото програмите използват корпус от съществуващи такива при съставянето на нови текстове). Най-яркият пример за такава фраза е counterfeit consciousness вместо общо използваното artificial intelligence, буквално "поздправено съзнание" вместо "изкуствен интелект".
Вторият критерий е наличието на неуместни или дори несъществуващи цитати от други произведения в статията.
Последният критерий е използването на рисунки, които вече са се появили в други произведения, с леки промени.
И Магазинов открива всички тези критерии в статиите на Рафаел Лука. Една от статиите му от 2022 г., публикувана заедно с колеги от Иран, сглобява бинго от несъществуваща "вегетативна електронна микроскопия" и куп нерелевантни препратки, например водещи към статия за доставка на гени в клетките, въпреки че изречението с препратката описва антибактериалната активност на наночастици. В последния обзор, който е публикуван през април, една от илюстрациите е взета от по-стара статия на други автори, в леко променен вид, но заглавието - съвсем непокътнато - е преместено заедно с нея от източника. Не е известно кой от деветимата съавтори, работещи за осем различни организации, е допуснал този пропуск. Ник Уайз твърди, че е видял поне една от статиите на Луке в канал в Telegram, в който се предлага авторство срещу пари.
В последните си статии Луке вече не посочва университета в Кордоба като работно място, но все още има много университети, които са готови да приютят учения с висок рейтинг. Колкото повече цитирани специалисти работят в една организация, толкова по-висок е нейният собствен рейтинг. Именно по тази причина университетите в Саудитска Арабия, желаещи да се доберат до световния топ, са готови да плащат заплати на водещи западни учени, за да се появят поне за кратко на територията на университета, но по-важното е да посочват местните университети в статиите си.
Всъщност Рафаел Луке е официално отстранен за такова сътрудничество с Университета "Крал Сауд" в Рияд и същевременно с Московския университет на дружбата между народите. А също и за това, че е работил в Русия по едно и също време: едновременно научната си дейност в испанския институт и арабския университет той е бил професор в Руския университет на дружбата между народите. Ръководството на университета в Кордоба не вярва, че ученият е изобретил "времевърт", което му позволява да работи ползотворно с колеги от Саудитска Арабия и Русия в допълнение към постоянната си работа в Испания.
Луке не губи кураж - и след уволнението си той се води руско-еквадорски професор: освен че продължава да е сътрудник в не толкова взискателния РУДН, ученият си е намерил и нова длъжност в университета ECOTEC в Гуаякил, Еквадор.