В данной работе проводится исследование проблемы влияния сгенерированных текстов на примере сферы онлайн-отзывов. В первой главе выполняется обзор предметной области. Во второй главе рассматривается проведение адаптированного теста Тьюринга, целью которого было оценить способность людей различать тексты, сгенерированные искусственным интеллектом и тексты, написанные человеком. В третьей главе рассматриваются методы машинного обучения, применяемые для решения задачи классификации текстов. В четвертой главе описывается создание модели на основе предобученной модели RuBERT. В пятой главе рассматривается реализация десктопного приложения для более удобной работы с полученной моделью.
СОДЕРЖАНИЕ
Введение ................................................................................................................... 7
Глава 1. Обзор предметной области ...................................................................... 9
1.1 Задача распознавания сгенерированных текстов ....................................................... 9
1.2 Машинное обучение .................................................................................................... 10
1.3 Тест Тьюринга и его применение для оценки искусственного интеллекта ........... 12
1.4 Обзор существующих исследований ......................................................................... 12
1.5 Выводы по главе .......................................................................................................... 14
Глава 2. Применение теста Тьюринга в задаче классификации текста ........... 15
2.1. Теоретические основы теста Тьюринга .......................................................................... 15
2.2. Методология проведения теста Тьюринга ..................................................................... 15
2.3. Анализ результатов теста Тьюринга............................................................................... 17
2.4 Выводы по главе ................................................................................................................ 20
Глава 3. Обзор методов машинного обучения в задаче распознавания сгенерированного текста ...................................................................................... 21
3.1 Сверточные нейронные сети ............................................................................................ 21
3.2 Рекуррентные нейронные сети ......................................................................................... 22
3.3 Трансформеры ................................................................................................................... 24
Глава 4. Модель RuBERT: реализация и анализ результатов ............................ 27
4.1 Инструменты разработки ............................................................................................ 27
4.2 Набор данных и их предобработка ............................................................................ 28
4.3 Реализация и обучение модели ........................................................................................ 31
4.4. Анализ результатов обучения ......................................................................................... 33
Глава 5. Десктопное приложение на Kotlin: Разработка и интеграция ............ 37
5.1. Проектирование и реализация приложения (IntelliJ IDEA, Kotlin) ............................. 37
5.2. Интеграция с моделью RuBERT через ngrok и REST API (серверная часть) ............. 40
5.3 Пользовательский интерфейс приложения ..................................................................... 42
Заключение ............................................................................................................. 45
Литература ............................................................................................................. 47
ЛИТЕРАТУРА
1.Классификация текстов: машинное обучение // Teletype. – URL: (дата обращения: 03.02.2024).
2.Обработка естественного языка // NEERC. – URL: (дата обращения: 03.02.2024).
3.Тест Тьюринга // GeekBrains. – URL: (дата обращения: 03.02.2024).
4.Is This Abstract Generated by AI? A Research Question // Papers With Code. – URL: (дата обращения: 14.11.2024).
5.Kovаcs, B. Тест Тьюринга - Исследование – 2024. – 12 апреля.
6.Рекуррентные нейронные сети (RNN): основы и применение // Skypro. – URL: / (дата обращения: 16.04.2025).
7.Девяткин П. OpenAI vs Google: «война миров», взгляд изнутри // Digital Communication Agency. –
всего 11 источников