Добавить новость
Новое

Проверка итоговых студенческих работ на ИИ: как ReText.AI проанализировал 13 тысяч дипломов

Агентство «PRonline»
626
Проверка итоговых студенческих работ на ИИ: как ReText.AI проанализировал 13 тысяч дипломов

Ни для кого уже не секрет, что при написании диплома студенты все чаще используют нейросети. За три года доля текста, имеющего машинные шаблоны, в выпускных квалификационных работах выросла в четыре раза!

Исследование, которое вызвало широкий резонанс в профессиональном и академическом сообществе, провела компания ReText.AI, проанализировав почти 13 тысяч дипломов за 13 лет. Сегодня авторы этой работы делятся методикой: как отличить текст, написанный человеком, от машинной генерации, почему документы анализировались по абзацам, а не целиком, и где проходит граница между помощью ИИ и подменой самостоятельной работы.

Что показала проверка текста на ИИ

Главный вывод исследования — после 2022 года AI-доля в выпускных работах начала заметно расти. По данным ReText.AI:

- AI-доля выросла с 9,9% в 2022 году до 42,3% в 2025 году;

- В 2025 году самые высокие значения чаще встречались в заключении — около 56%;

- Во введении AI-доля составила около 49%;

- В основной части показатель был ниже — около 41%;

- Доля работ, где почти нет признаков ИИ, снизилась: в 2022 году таких работ было около 70%, а в 2025 году — около 23%;

- При сохранении тренда в 2026 году AI-доля может выйти на диапазон 50–60% по корпусу.

Эти цифры показывают общий сдвиг: нейросети стали полноправной частью процесса подготовки, редактуры и структурирования материалов.

«Нас удивил не сам интерес к цифрам, а то, как быстро поменялся разговор. Еще год назад спорили, можно ли вообще использовать ИИ в дипломе. Сейчас и вузы, и студенты, и преподаватели спрашивают другое: как это правильно зафиксировать и где провести границу. Мы изначально делали исследование не для того, чтобы кого-то "поймать", а чтобы у этой дискуссии появилась опора в данных — и, судя по реакции, такой опоры действительно не хватало», — комментирует основательница ReText.AI Ольга Шкряба. 

На чем базируется исследование

В исследовании использовались 12,9 тыс. выпускных квалификационных работ за период с 2013 по 2025 год. После подготовки и фильтрации в анализ вошло 590 млн символов. Для каждой работы рассчитывалась AI-доля — доля текста, которую детектор ИИ классифицировал как похожую на машинную генерацию или LLM-переработку. Средняя AI-доля по всему корпусу составила 14,7%, но важнее не среднее значение, а изменение по годам.

Подготовка текстов к проверке

Перед анализом тексты очищались от фрагментов, которые могли исказить результат. В проверку не включались: титульные листы, аннотации, оглавления, списки литературы, приложения, благодарности, отчеты по практике, подписи к рисункам и таблицам, обрывки формул, служебные и слишком короткие фрагменты. Для анализа брались только абзацы длиной от 500 символов. Короткие фразы часто не дают ИИ-детектору достаточно контекста и могут давать менее устойчивую оценку. Также исключались работы, где после очистки оставалось меньше 10 подходящих абзацев или слишком маленький объем основной части.

Почему анализировали абзацы, а не весь документ

Одна выпускная работа может состоять из очень разных фрагментов. Введение может быть написано шаблонно, основная часть — в более индивидуальной манере, а заключение — снова в стандартном академическом стиле. Если проверять весь документ целиком, эти различия сглаживаются. Поэтому каждый абзац проверялся отдельно. Так можно увидеть не только общий показатель по работе, но и распределение: какие части текста чаще получают метку AI, а какие выглядят более естественно для детектора.

Как работал ИИ-детектор

Для исследования использовался LLM-детектор, обученный отличать человеческие тексты от фрагментов, похожих на генерацию языковых моделей. Детектору подавался отдельный абзац, а на выходе модель определяла, относится ли фрагмент к человеческому тексту или к AI-генерации. Если абзац классифицировался как машинный текст, дополнительно фиксировалась предполагаемая группа модели-генератора. Детектор оценивает не историю создания документа, а языковые признаки: структуру, повторяемость, предсказуемость формулировок, академическую шаблонность и другие стилистические паттерны. Поэтому результаты исследования использовались только для агрегированной аналитики: по годам, разделам и группам текстов.

Как считалась AI-доля

Доля текста, классифицированного как AI, считалась по символам, а не по количеству абзацев. Метод расчета предельно прозрачен: число знаков в фрагментах, которые детектор отнес к ИИ, делят на суммарный объем всех проанализированных абзацев. Например, если после очистки в работе осталось 100 тыс. символов содержательного текста, а 25 тыс. символов пришлись на абзацы, которые детектор отнес к машинному тексту, AI-доля такой работы составляла 25%. Такой подход делает оценку устойчивее: длинные содержательные абзацы сильнее влияют на итоговый показатель, чем короткие фрагменты.

Чем проверка на ИИ отличается от антиплагиата

Антиплагиат обычно ищет совпадения с уже опубликованными источниками: сайтами, статьями, рефератами, базами работ. ИИ-детектор решает другую задачу: он оценивает, насколько текст похож на машинную генерацию или переработку. Поэтому эти проверки нельзя заменять друг другом. Текст может быть оригинальным с точки зрения заимствований, но выглядеть AI-подобным для детектора. И наоборот: текст может быть написан человеком, но содержать совпадения с источниками. В исследовании анализировались именно признаки ИИ-генерации и LLM-переработки, а не заимствования.

Ограничения методологии

У исследования есть несколько важных ограничений. ИИ-детектор не дает абсолютной оценки, он работает с вероятностными признаками генерации текста. Академический стиль сам по себе может повышать вероятность срабатывания, особенно во введениях, заключениях и фрагментах с типовыми формулировками. Детектор может по-разному реагировать на тексты разных языков и на тексты, прошедшие через перевод или редактуру. AI-доля не показывает, какую именно роль играла нейросеть: генерация с нуля, редактура, перевод, перефразирование или помощь с отдельными формулировками. Именно поэтому главная ценность исследования — не в отдельных процентах, а в сравнении периодов и крупных трендов.

Главный вывод

Исследование ReText.AI показало: после выхода нейросетей в широкий доступ в академических текстах заметно выросла доля фрагментов, которые ИИ-детектор классифицирует как похожие на машинную генерацию или переработку.

При этом результаты проверки важно читать аккуратно. Они показывают не «историю создания» конкретного текста, а языковые признаки, которые становятся заметными на большом корпусе. Главный вывод не в том, что нейросети «заменили» авторов, а в том, что они стали частью академического письма. Поэтому дальше важнее не спорить о самом факте использования ИИ, а выстраивать понятные правила: где нейросети допустимы как инструмент редактуры, как фиксировать их использование и как отличать помощь с текстом от подмены самостоятельной работы.

Этот материал опубликован пользователем сайта через форму добавления новостей.
Ответственность за содержание материала несет автор публикации. Точка зрения автора может не совпадать с позицией редакции.
Москва на Moscow.media
Музыкальные новости

Новости Москвы





Все новости Москвы на сегодня
Мэр Москвы Сергей Собянин



Rss.plus

Другие новости Москвы




Все новости часа на smi24.net

Новости Московской области


Москва на Moscow.media
Москва на Ria.city
Новости Крыма на Sevpoisk.ru

Другие города России