Цель работы: научиться пользоваться инструментальными средствами анализа данных
Задача: Произвести кластеризацию документов (можно использовать любые документы, сайты и т.д.)
Ход выполнения работы:
1)Подготовка данных
2*) Установка RapidMiner. Установка компонентов textProcessing (если Вы скачиваете самостоятельно программу RapidMiner, а не виртуальную машину. В программе, которая установлена на виртуальной машине, уже есть нужный компонент)
3) Использование компоненты- Process Dociment from files и различных фильтров (минимум-3).
4) Проведение кластеризации документов (документов должно быть минимум 20) разными методами (минимум - 2).
5) Оценить алгоритмы (точность, полнота, F-мера)
6) Анализ полученных результатов (полноценный анализ работы)
ОТЧЕТ:
Содержит скриншоты экрана каждого действия с комментариями, подсчеты метрик оценки алгоритмов, вывод по полученному результату
Гарантия на работу | 1 год |
Средний балл | 4.55 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |