Место и время практики: РТУ МИРЭА, Базовая кафедра «Прикладное программирование», с 09 февраля 2024 г. по 30 мая 2024 г.
1
09.02.2024
Подготовительный этап, включающий в себя организационное собрание (Вводная лекция о порядке организации и прохождения производственной практики, инструктаж по технике безопасности)
2
14.03.2024
Выполнение задания по практике в соответствии с выданным заданием студента. (Мероприятия по сбору, обработке и структурированию данных по стоимости Квартир для разработки алгоритма множественной регрессии на основе языка Пайтон)
3
18.04.2024
Подготовка отчета и презентационного материала по практике (Оформление процесса и результатов работы и презентации в полном соответствии с требованиями на оформление учебных работ студентов)
4
30.05.2024
Защита отчета по производственной практике у руководителя практики. (Представление отчета и алгоритмов по практике к защите)
В этой работе были проанализированы и алгоритмически оформлены такие методы регрессионного анализа, как множественная линейная регрессия и метод случайных лесов, которые затем использовались для оценки стоимости аренды жилья. Также были рассмотрены техники кросс-валидации, регуляризации и стандартизации данных. Цель была достигнута путём обработки набора данных, разработки регрессионных моделей и их оценки с помощью кросс-валидации и соответствующих метрик.
Применение этих алгоритмов является ключевым в решении задач машинного обучения. В ходе тренировки моделей алгоритмы раскрывают закономерности, позволяющие определить наиболее значимые факторы для предсказаний.
Существует множество алгоритмов регрессионного анализа, и при их выборе важно учитывать преимущества и ограничения каждого из них, а также специфику задачи и объём тренировочных данных. Реализация этих методов требует глубоких познаний в областях статистики, математики и программирования.
Несмотря на сложность, регрессионный анализ находит применение в различных областях, от бизнеса и маркетинга до науки и медицины.
Введение 7
1. Теоретические основы машинного обучения с описанием методов множественной регрессии 9
1.1 Теоретическое описание регрессии 9
1.2 Теоретическое описание случайного леса принятия решений 10
1.3 Теоретическое описание гребневой регрессии 11
1.4 Теоретические основы кросс-валидации 12
2. Практическая реализация моделей множественной регрессии на примере датасета 14
2.1 Постановка задачи обработки массива данных (датасета) 14
2.2. Реализация задачи обработки массива данных (датасета) 15
2.3 Разведочный анализ данных 16
2.4 Конструирование признаков (Feature Engineering) 22
2.5 Тренировка и анализ модели множественной линейной регрессии 24
2.6 Тренировка и анализ модели гребневой регрессии 27
2.7 Тренировка и анализ модели случайного леса принятия решений 29
Заключение 31
Список используемых источников 32
1. Журавлев, А. Е. Компьютерный анализ. Практикум в среде Microsoft Excel / А. Е. Журавлев, А. В. Макшанов, Л. Н. Тындыкарь. — 2-е изд., стер. — Санкт-Петербург : Лань, 2023. — 280 с. — ISBN 978-5-507-47025-9. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/320774 (дата обращения: 07.05.2023). — Режим доступа: для авториз. пользователей.
2. Мишра, П. Объяснимые модели искусственного интеллекта на Python. Модель искусственного интеллекта. Объяснения с использованием библиотек, расширений и фреймворков на основе языка Python / П. Мишра ; перевод с английского С. В. Минца. — Москва : ДМК Пресс, 2022. — ISBN 978-5-93700-124-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/314894 (дата обращения: 10.05.2024). — Режим доступа: для авториз. пользователей. — С. 95.).
.....
17. Груздев, А. В. Изучаем Pandas / А. В. Груздев, М. Хейдт ; перевод с английского А. В. Груздева. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2019. — ISBN 978-5-97060-670-4. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131693 (дата обращения: 11.05.2024). — Режим доступа: для авториз. пользователей. — С. 529.