Новое

Проверка итоговых студенческих работ на ИИ: как ReText.AI проанализировал 13 тысяч дипломов

626

Ни для кого уже не секрет, что при написании диплома студенты все чаще используют нейросети. За три года доля текста, имеющего машинные шаблоны, в выпускных квалификационных работах выросла в четыре раза!

Исследование, которое вызвало широкий резонанс в профессиональном и академическом сообществе, провела компания ReText.AI, проанализировав почти 13 тысяч дипломов за 13 лет. Сегодня авторы этой работы делятся методикой: как отличить текст, написанный человеком, от машинной генерации, почему документы анализировались по абзацам, а не целиком, и где проходит граница между помощью ИИ и подменой самостоятельной работы.

Что показала проверка текста на ИИ

Главный вывод исследования — после 2022 года AI-доля в выпускных работах начала заметно расти. По данным ReText.AI:

- AI-доля выросла с 9,9% в 2022 году до 42,3% в 2025 году;

- В 2025 году самые высокие значения чаще встречались в заключении — около 56%;

- Во введении AI-доля составила около 49%;

- В основной части показатель был ниже — около 41%;

- Доля работ, где почти нет признаков ИИ, снизилась: в 2022 году таких работ было около 70%, а в 2025 году — около 23%;

- При сохранении тренда в 2026 году AI-доля может выйти на диапазон 50–60% по корпусу.

Эти цифры показывают общий сдвиг: нейросети стали полноправной частью процесса подготовки, редактуры и структурирования материалов.

«Нас удивил не сам интерес к цифрам, а то, как быстро поменялся разговор. Еще год назад спорили, можно ли вообще использовать ИИ в дипломе. Сейчас и вузы, и студенты, и преподаватели спрашивают другое: как это правильно зафиксировать и где провести границу. Мы изначально делали исследование не для того, чтобы кого-то "поймать", а чтобы у этой дискуссии появилась опора в данных — и, судя по реакции, такой опоры действительно не хватало», — комментирует основательница ReText.AI Ольга Шкряба.

На чем базируется исследование

В исследовании использовались 12,9 тыс. выпускных квалификационных работ за период с 2013 по 2025 год. После подготовки и фильтрации в анализ вошло 590 млн символов. Для каждой работы рассчитывалась AI-доля — доля текста, которую детектор ИИ классифицировал как похожую на машинную генерацию или LLM-переработку. Средняя AI-доля по всему корпусу составила 14,7%, но важнее не среднее значение, а изменение по годам.

Подготовка текстов к проверке

Перед анализом тексты очищались от фрагментов, которые могли исказить результат. В проверку не включались: титульные листы, аннотации, оглавления, списки литературы, приложения, благодарности, отчеты по практике, подписи к рисункам и таблицам, обрывки формул, служебные и слишком короткие фрагменты. Для анализа брались только абзацы длиной от 500 символов. Короткие фразы часто не дают ИИ-детектору достаточно контекста и могут давать менее устойчивую оценку. Также исключались работы, где после очистки оставалось меньше 10 подходящих абзацев или слишком маленький объем основной части.

Почему анализировали абзацы, а не весь документ

Одна выпускная работа может состоять из очень разных фрагментов. Введение может быть написано шаблонно, основная часть — в более индивидуальной манере, а заключение — снова в стандартном академическом стиле. Если проверять весь документ целиком, эти различия сглаживаются. Поэтому каждый абзац проверялся отдельно. Так можно увидеть не только общий показатель по работе, но и распределение: какие части текста чаще получают метку AI, а какие выглядят более естественно для детектора.

Как работал ИИ-детектор

Для исследования использовался LLM-детектор, обученный отличать человеческие тексты от фрагментов, похожих на генерацию языковых моделей. Детектору подавался отдельный абзац, а на выходе модель определяла, относится ли фрагмент к человеческому тексту или к AI-генерации. Если абзац классифицировался как машинный текст, дополнительно фиксировалась предполагаемая группа модели-генератора. Детектор оценивает не историю создания документа, а языковые признаки: структуру, повторяемость, предсказуемость формулировок, академическую шаблонность и другие стилистические паттерны. Поэтому результаты исследования использовались только для агрегированной аналитики: по годам, разделам и группам текстов.

Как считалась AI-доля

Доля текста, классифицированного как AI, считалась по символам, а не по количеству абзацев. Метод расчета предельно прозрачен: число знаков в фрагментах, которые детектор отнес к ИИ, делят на суммарный объем всех проанализированных абзацев. Например, если после очистки в работе осталось 100 тыс. символов содержательного текста, а 25 тыс. символов пришлись на абзацы, которые детектор отнес к машинному тексту, AI-доля такой работы составляла 25%. Такой подход делает оценку устойчивее: длинные содержательные абзацы сильнее влияют на итоговый показатель, чем короткие фрагменты.

Чем проверка на ИИ отличается от антиплагиата

Антиплагиат обычно ищет совпадения с уже опубликованными источниками: сайтами, статьями, рефератами, базами работ. ИИ-детектор решает другую задачу: он оценивает, насколько текст похож на машинную генерацию или переработку. Поэтому эти проверки нельзя заменять друг другом. Текст может быть оригинальным с точки зрения заимствований, но выглядеть AI-подобным для детектора. И наоборот: текст может быть написан человеком, но содержать совпадения с источниками. В исследовании анализировались именно признаки ИИ-генерации и LLM-переработки, а не заимствования.

Ограничения методологии

У исследования есть несколько важных ограничений. ИИ-детектор не дает абсолютной оценки, он работает с вероятностными признаками генерации текста. Академический стиль сам по себе может повышать вероятность срабатывания, особенно во введениях, заключениях и фрагментах с типовыми формулировками. Детектор может по-разному реагировать на тексты разных языков и на тексты, прошедшие через перевод или редактуру. AI-доля не показывает, какую именно роль играла нейросеть: генерация с нуля, редактура, перевод, перефразирование или помощь с отдельными формулировками. Именно поэтому главная ценность исследования — не в отдельных процентах, а в сравнении периодов и крупных трендов.

Главный вывод

Исследование ReText.AI показало: после выхода нейросетей в широкий доступ в академических текстах заметно выросла доля фрагментов, которые ИИ-детектор классифицирует как похожие на машинную генерацию или переработку.

При этом результаты проверки важно читать аккуратно. Они показывают не «историю создания» конкретного текста, а языковые признаки, которые становятся заметными на большом корпусе. Главный вывод не в том, что нейросети «заменили» авторов, а в том, что они стали частью академического письма. Поэтому дальше важнее не спорить о самом факте использования ИИ, а выстраивать понятные правила: где нейросети допустимы как инструмент редактуры, как фиксировать их использование и как отличать помощь с текстом от подмены самостоятельной работы.

Другие новости Москвы

Сергей Собянин. Главное за день

Виктор Кордюков: Почему превращать воду в дистиллят так же опасно, как пить из лужи

Рейтинг лучших негосударственных образовательных учреждений России, 2026 год: Аналитический обзор

Like Party: Plan B – новый хит этого лета!

Рейтинг лучших негосударственных образовательных учреждений России, 2026 год: Аналитический обзор

Акция «А завтра была война» прошла на Северном речном вокзале Москвы

Новости Московской области

Сотрудники Каширского ОВО Росгвардии почтили память павших воинов

Сотрудники Каширского ОВО Росгвардии почтили память тех, кто пал на поле боя.

День открытых дверей в Росгвардии

В Подольске появится термальный курорт с дневной выручкой до 3,3 млн рублей

Один человек погиб в результате массового ДТП на трассе М-9 около Истры

СК России возбудил дело после нападения на фельдшера в Биробиджане

Как вызвать эвакуатор и не переплатить лишнего

Росгвардейцы задержали предполагаемого виновника в причинении вреда здоровью жителю областного центра

В Читу пришли бионические протезы ног

Отдельной дивизии оперативного назначения имени Ф.Э. Дзержинского войск национальной гвардии исполнилось 102 года (видео)

СОБР Росгвардии отработал беспарашютное десантирование в Томской области

В Красноярске телетрап сдал назад и оставил глубокий порез на самолете

Полиция арестовала в Южно-Сахалинске девушку за кражу 1,5 млн рублей

Выпускник программы «Время героев» занял пост в «дочке» «Газпрома» в Ставрополе

Space расширяет региональное присутствие: в Самаре открылся новый офис компании

Акция Росгвардии «На страже памяти» продолжается в Кабардино-Балкарии

В аэропорту Пензы ввели временные ограничения на прием и выпуск самолетов

Небо под контролем: пермская компания Цербер защищает бизнес и промышленность от атак БПЛА

Росимущество смогло найти покупателя еще одного актива «Макфы»

КФУ вошел в топ вузов России по количеству бюджетных мест

Отдельный батальон связи грозненского соединения Росгвардии отметил 26-ю годовщину со дня образования

Зеленский вернул Навроцкому Орден Белого Орла

Губернатор Анохин анонсировал программу Дня молодёжи в Смоленске

В аэропорту Тюмени введены ограничения на прием и выпуск самолетов

Совет Федерации одобрил возвращение Белгородского военного суда

В аэропорту Калуги ввели ограничения на полеты

В Абакане прошло пожарно-тактическое занятие с участием Росгвардии и МЧС

На Ямале спецназовцы Росгвардии прошли испытания на право ношения геральдического знака

РВВДКУ провело 145-й выпуск лейтенантов и 20-й выпуск прапорщиков

Клоунада в России: интерес снизился в 8 раз за четыре года

Митрошина после приговора заявила, что продолжит вести соцсети

О профессии кинолога Росгвардии рассказали журналистам в курганском ОМОН

Постпреды СНГ осудили нападение ВСУ на автобус под Брянском

Подозреваемый в нападении на людей в торговом центре в Краснодаре признал вину

Спектакль «Гора» Айдара Заббарова стал лауреатом премии «Золотая маска»

Взрывотехники Росгвардии обезвредили боеприпас, найденный во Владикавказе

В российской школьной программе может появиться новый предмет

Герой России генерал армии Виктор Золотов провел рабочую встречу с губернатором Курской области Александром Хинштейном

Росгвардейцы приняли участие в легкоатлетическом забеге в честь погибшего при исполнении служебных обязанностей ивановского милиционера Вячеслава Триханова

Во Владивостоке появились протезы на основе отечественного коленного модуля

В Йошкар-Оле начальник медицинской службы Росгвардии удостоен благодарности за вклад в развитие донорства

Другие новости сегодня