на тему: «Методы и модели извлечения знаний из данных информационно-коммуникационной среды»
Актуальность исследования. В течение последних десятилетий количество информации, которую необходимо собирать и анализировать для различных целей выросло в десятки тысяч раз. Современные хранилища данных должны накапливать и обрабатывать не просто сотни терабайтов, а скорее петабайты и эксабайты информации, появилось такое понятие, как «Big Data», а обычные хранилища данных постепенно уступают свои позиции облачным технологиям и «озерам» данных. Это обусловлено тем, что аккумулирование информации является одной из важнейших необходимостей современных бизнес-систем, так как это дает возможность в полной мере осмысливать их работу, что крайне важно для решения большого числа бизнес-задач. Сегодня данные являются важнейшим видом актива, который требует эффективного использования. В этом случае данные становятся инструментом, позволяющим анализировать сложившуюся ситуация и принимать обоснованные управленческие решения.
СОДЕРЖАНИЕ ВВЕДЕНИЕ.............................................................................................................. 4 РАЗДЕЛ 1 ТЕОРЕТИКО-МЕТОДИЧЕСКИЕ АСПЕКТЫ АНАЛИЗА ДАННЫХ ИНФОРМАЦИОННО-КОММУНИКАЦИОННОЙ СРЕДЫ......... 10 1.1 Сущность, характеристики и процессы анализа данных информационнокоммуникационной среды.................................................................................... 10 1.2 Методы анализа данных с учетом особенностей информационнокоммуникационной среды.................................................................................... 17 1.3 Концептуальный подход к извлечению знаний из данных информационно-коммуникационной среды....................................................... 25 Выводы по разделу 1. ............................................................................................ 41 РАЗДЕЛ 2 АНАЛИЗ ИНСТРУМЕНТОВ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ ДАННЫХ ИНФОРМАЦИОННО-КОММУНИКАЦИОННОЙ СРЕДЫ......... 42 2.1 Сравнительный анализ инструментов извлечения знаний из данных информационно-коммуникационной среды....................................................... 42 2.2 Систематизация знаний и данных по результатам использования инструментов платформ Google, Яндекс............................................................ 57 2.3 Модель обработки и хранения данных социальных сетей, поисковых систем и платформ ................................................................................................ 64 Выводы к разделу 2. .............................................................................................. 69 РАЗДЕЛ 3 ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ РЕЗУЛЬТАТОВ ИСПОЛЬЗОВАНИЯ МЕТОДОВ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ ДАННЫХ ... 70 3.1 Оценка возможностей использования полученных данных о потребителях в таргетированной рекламе .................................................................................. 70 3.2 Систематизации знаний об интернет-пользователях на основе использования инструментов кластерного анализа .......................................... 74 3.3 Оценка результатов разведывательного анализа для принятия маркетинговых решений в цифровой среде и разработки конфигурации для программной платформы ..................................................................................... 83 Выводы к разделу 3. .............................................................................................. 95 РАЗДЕЛ 4 ОХРАНА ТРУДА............................................................................... 97 ЗАКЛЮЧЕНИЕ ................................................................................................... 102 3 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ ......................................... 105 ПРИЛОЖЕНИЕ А Карта хронологии поисковых запросов пользователей Яндекс................................................................................................................... 110 ПРИЛОЖЕНИЕ Б Оценочная таблица парсеров............................................. 111 ПРИЛОЖЕНИЕ В Критерии формирования потоков данных для основных классов бизнес-задач и методов анализ............................................................ 113 ПРИЛОЖЕНИЕ Г Листинг программы разработки цифровой платформы по систематизации данных о клиентах .................................................................. 116