Курсовая Витте по дисциплине "Машинное обучение и анализ данных". Тема - Применение ансамблевых методов для решения прикладной задачи анализа данных.
ВНИМАНИЕ! Работу можно использовать как образец для своей курсовой, так как она была зачтена преподавателем. Работа загружена в базу, поэтому оригинальности уже нет.
ОГЛАВЛЕНИЕ
1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ.. 6
1.2. Анализ и подготовка набора данных. 6
1.3. Обзор ансамблевых методов машинного обучения. 9
2. ПРОЕКТИРОВАНИЕ И РЕАЛИЗАЦИЯ.. 12
2.1. Выбор ансамблевого метода, создание и оптимизация гиперпараметров модели. 12
2.1.1 Выбор ансамблевого метода Random Forest 12
2.1.2 Создание базовой модели Random Forest 12
2.1.3 Оптимизация гиперпараметров модели Random Forest 13
2.2. Формирование обучающей и тестовой выборок, обучение модели. 14
2.2.1 Формирование обучающей и тестовой выборок. 14
2.3. Сравнение с другими ансамблевыми методами. 18
3.1. Расчёт эффективности модели до оптимизации гиперпараметров. 21
3.2. Расчёт эффективности модели после оптимизации гиперпараметров. 24
3.3. Анализ результатов оптимизации. 26
1. Документация fetch_20newsgroups [Электронный ресурс]. URL:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.fetch_20newsgroups.html (дата обращения: 15.05.2025).
2. Документация Random Forest Classifier [Электронный ресурс].URL:https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.
RandomForestClassifier.html(дата обращения: 15.05.2025).
3. Документация Gradient Boosting Classifier [Электронный ресурс].URL: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.
GradientBoostingClassifier.html(дата обращения: 15.05.2025).
4. Документация AdaBoost Classifier [Электронный ресурс].URL: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.
AdaBoostClassifier.html(дата обращения: 15.05.2025).
5. Антао Т. Биоинформатика с Python: книга рецептов: Современные библиотеки и приложения Python для решения реальных задач вычислительной биологии : практическое руководство— Москва : ДМК Пресс, 2023. — 345 с.
6. Целых А. Н., Драгныш Н. В., Котов Э. М. Принятие решений на основе методов машинного обучения : учебное пособие по курсам «Модели и методы инженерии знаний», «Методы анализа больших данных». —Ростов-на-Дону; Таганрог : Издательство Южного федерального университета, 2022. — 113 с.
7. Рашка Себастьян. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения. — Москва : ДМК Пресс, 2017. — 418 с.
8. Рашка Себастьян, Мирджалили Вахид. Python и машинное обучение. Машинное и глубокое обучение с использованием Python, scikit-learn и Tensor Flow 2. — Москва : Диалектика-Вильямс, 2021. — 848 с.
9. Шарден Б., Массарон Л., Боскетти А. Крупномасштабное машинное обучение вместе с Python : практическое руководство. — Москва : ДМК Пресс, 2018. — 360 с.
10. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных : учебник. — 2-е изд. — Москва :ДМК Пресс, 2023. — 401 с.
11. МэрфиК. П. Вероятностное машинное обучение. Дополнительные темы: предсказание, порождение, обнаружение, действие : практическое руководство. —Москва : ДМК Пресс, 2024. —768 с.