Интеллектуальный анализ данных (дата-майнинг)

Раздел
Экономические дисциплины
Просмотров
45
Покупок
0
Антиплагиат
Не указан
Размещена
15 Янв в 23:45
ВУЗ
ТПУ
Курс
5 курс
Стоимость
400 ₽
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
docx
ИНДИВИДУАЛЬНОЕ ЗАДАНИЕ № 3 (1)
498.9 Кбайт
Описание

Задание 3

Практическое задание по Теме 3 обобщает Цикл лабораторных работ, на выполнение которых отводится 8 час. (ЛБ9 – ЛБ12).

Продемонстрировать практическое использование инструментария платформы PolyAnalyst. 

Исследование платформы PolyAnalyst предполагает выполнение следующих основных задач:

 1. Архитектура и технические характеристики

– Анализ общей архитектуры PolyAnalyst и входящих в нее компонентов.

– Установка программы.

 2. Сбор и интеграция данных

– Подключение к различным источникам данных (базы данных, файлы разных форматов, API, веб-источники).

– Возможность настройки инкрементальной загрузки данных (небольшими частями - инкрементами).

– Поддержка ETL-процессов с использованием инструментов PolyAnalyst.

– Создание хранилища данных с оптимизированной структурой для аналитических задач.

 3. Предобработка данных

– Очистка данных от выбросов и аномалий.

– Заполнение пропущенных значений.

– Нормализация и стандартизация данных.

– Кодирование категориальных переменных.

– Выделение значимых признаков.

 4. Построение моделей машинного обучения

– Разработка и обучение моделей классификации.

– Разработка и обучение моделей регрессии.

– Разработка и обучение моделей кластеризации.

– Возможность использования ансамблевых методов.

– Автоматический подбор гиперпараметров моделей.

 5. Анализ текстовых данных

– Извлечение концепций и сущностей из текста.

– Категоризация текстовых документов.

– Анализ тональности текста.

– Построение семантических сетей.

– Визуализация результатов текстового анализа.

 6. Визуализация и отчетность

– Создание интерактивных дашбордов.

– Генерация автоматических отчетов по расписанию.

– Экспорт результатов анализа в различные форматы.

– Настраиваемые визуализации для разных типов данных и задач.

Вам подходит эта работа?
Похожие работы
Другие работы автора
Прямой эфир