ПОЛНОЕ ЗАДАНИЕ В ДЕМО ФАЙЛЕ,
ЧАСТЬ ДЛЯ ПОИСКА ДУБЛИРУЮ НИЖЕ
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
федеральное государственное автономное образовательное учреждение
высшего образования
«Северный (Арктический) федеральный университет имени М.В. Ломоносова»
Высшая школа информационных технологий и автоматизированных систем
(наименование высшей школы / филиала / института / колледжа)
ЗАДАНИЕ НА КОНТРОЛЬНУЮ РАБОТУ
ппо
модулю «Машинное обучение и большие данные»
(наименование дисциплины)
студенту
ВШИТиАС
высшей школы
3
курса
351017/351018
группы
Фамилия Имя Отчество
(фамилия, имя, отчество студента)
09.03.02«Информационные системы и технологии»
(код и наименование направления подготовки/специальности)
ТЕМА:
Решение прикладной задачи с помощью алгоритмов кластеризации
ИСХОДНЫЕ ДАННЫЕ:
В рамках контрольной работы необходимо проанализировать данные и на основе анализа сделать практически полезные выводы, которые могут представлять продуктовую выгоду в предметной области.
Объем работы 15-20 страниц.
1. Описать предметную область и возникающую в ней проблему.
2. Найти датасет для кластеризации для решения описанной в п. 1 проблемы.
3. Применить 3 вида кластеризации к данным, подобрать гиерпараметры (обосновать, доказать выбор).
4. Попробуйте построить кластеризаццию по двум наиболее значимым признакам, визуализируйте результат кластеризации, подберите параметры (см. п.3).
5. Попытайтесь интерпретировать полученные кластеры в п. 3.
6. Для п. 3 и 4 оцените качество кластеризации, воспользуйтесь несколькими метриками (можно посмотреть https://scikit-learn.ru/clustering/#clustering-performance-evaluation)
7. Сделайте выводы по результатам кластеризации для решения проблемы, описанной в п.1.
В отчете расписать выполнение каждого пункта, в приложение добавить листинг кода.
Отчет должен состоять из титульного листа, листа задания, листа для замечаний, оглавления, введения, основной части, описывающей п. 1-7, заключения, списка использованных источников и приложения с листингом кода.
Руководитель работы
ассистент / доцент
Р.А. Воронцов / И.С. Васендина
(должность)
(подпись)
(инициалы, фамилия)
Архангельск 2023
Пояснение к выполнению Контрольной работы
В рамках контрольной работы необходимо выбрать набор данных для задачи кластеризации. При этом можно использовать набор данных с целевыми метками, которые при кластеризации необходимо удалить. Нельзя использовать типовые наборы данных, например, Iris, Fishes, BostonHouse.
Обратите внимание, что для наборов данных с целевой меткой и без целевых меток можно использовать разные метрики.