Практическое задание по Теме 3 обобщает Цикл лабораторных работ, на выполнение которых отводится 8 час. (ЛБ9 – ЛБ12).
Продемонстрировать практическое использование инструментария платформы PolyAnalyst.
Исследование платформы PolyAnalyst предполагает выполнение следующих основных задач:
1. Архитектура и технические характеристики
– Анализ общей архитектуры PolyAnalyst и входящих в нее компонентов.
– Установка программы.
2. Сбор и интеграция данных
– Подключение к различным источникам данных (базы данных, файлы разных форматов, API, веб-источники).
– Возможность настройки инкрементальной загрузки данных (небольшими частями - инкрементами).
– Поддержка ETL-процессов с использованием инструментов PolyAnalyst.
– Создание хранилища данных с оптимизированной структурой для аналитических задач.
3. Предобработка данных
– Очистка данных от выбросов и аномалий.
– Заполнение пропущенных значений.
– Нормализация и стандартизация данных.
– Кодирование категориальных переменных.
– Выделение значимых признаков.
4. Построение моделей машинного обучения
– Разработка и обучение моделей классификации.
– Разработка и обучение моделей регрессии.
– Разработка и обучение моделей кластеризации.
– Возможность использования ансамблевых методов.
– Автоматический подбор гиперпараметров моделей.
5. Анализ текстовых данных
– Извлечение концепций и сущностей из текста.
– Категоризация текстовых документов.
– Анализ тональности текста.
– Построение семантических сетей.
– Визуализация результатов текстового анализа.
6. Визуализация и отчетность
– Создание интерактивных дашбордов.
– Генерация автоматических отчетов по расписанию.
– Экспорт результатов анализа в различные форматы.
– Настраиваемые визуализации для разных типов данных и задач.