Название предмета : Большие данные
Уважаемые студенты!
Дисциплина «Большие данные» направлена на формирование у обучающихся знаний и навыков работы с масштабируемыми распределёнными системами обработки больших объёмов данных, а также применения методов анализа данных в области Data Science и машинного обучения. Курс включает изучение архитектур и технологий хранения (HDFS), вычислительных моделей (MapReduce), платформ обработки данных (Apache Spark), а также потоковых систем (Apache Kafka). Основное внимание уделяется освоению методов подготовки, хранения, обработки и анализа структурированных и неструктурированных данных больших объёмов.
В процессе обучения студенты познакомятся с ключевыми алгоритмами и технологиями, обеспечивающими эффективную обработку данных в распределённых системах, научатся применять статистические и математические методы анализа и реализовывать практические задачи с использованием соответствующих программных комплексов.
Рекомендуется изучать все материалы курса, включая лекции, методические указания и лабораторные задания. Контроль усвоения дисциплины осуществляется в форме экзамена и тестирования, что позволяет оценить как теоретическую подготовку, так и практические навыки.
Желаем успешного освоения дисциплины!
Лабораторная работа №1. Разворачивание Hadoop на кластере из одного узла (Virtual Box, Ubuntu)
Лабораторная работа №2 Запуск примеров MapReduce. Python & Hadoop
| Гарантия на работу | 1 год |
| Средний балл | 4.54 |
| Стоимость | Назначаете сами |
| Эксперт | Выбираете сами |
| Уникальность работы | от 70% |