Практическое задание по дисциплине «Введение в технологию Big Data

Открыт
Заказ
6943151
Раздел
Программирование
Предмет
Информатика
Антиплагиат
70% Антиплагиат.РУ (модуль - Интернет Free)
Срок сдачи
19 Дек в 16:55
Цена
Договорная цена
Блокировка
10 дней
Размещен
24 Ноя в 09:51
Просмотров
26
Описание работы

Практическое задание по дисциплине

«Введение в технологию Big Data (Часть 1)»

На основе полученной в ходе курса информации, выполните представленные нижеперечисленные задания, соблюдая в каждой задаче следующую последовательность ответа:

●       исходное условие задачи;

●       применяемые в ходе решения объекты конфигурации и тексты программ к ним;

●       промежуточные результаты;

●       выводы по полученным показателям.


Задача 1.

Создайте таблицу sales и загрузите структурированный набор данных в реляционную базу данных PostgreSQL и выполните несколько SQL-запросов для агрегации данных, которые представлены ниже.

Ссылка на скачивание PostgreSQL

Таблица sales, которая содержит следующие поля:

●     order_id – идентификатор заказа

●     order_date – дата заказа

●     customer_id – идентификатор клиента

●     country – страна клиента

●     product_category – категория товара

●     product_name – наименование товара

●     quantity – количество единиц товара

●     price_per_unit – цена за единицу

●     total_sales – общая сумма по заказу

●     payment_type – тип оплаты

●     order_status – статус заказа

Запросы:

1.    Подсчет общего количества заказов по каждой стране

2.    Подсчет общего дохода по каждой категории товаров

3.    Подсчет количества заказов по месяцам и годам

4.    Подсчет количества заказов по статусу

5.    Подсчет средней суммы заказа по странам

6.    Подсчет наиболее продаваемых товаров


Задача 2.

В данной задаче необходимо провести визуализацию данных с помощью Yandex DataLens. Это сервис для бизнес-аналитики. Сервис позволяет подключаться к различным источникам данных, строить визуализации, собирать дашборды и делиться полученными результатами.

Для работы с Yandex DataLens необходимо зарегистрировать почту на Yandex.

1. Перенесите таблицу SalesData, расположенную ниже, в файл Excel. Она нам понадобится для дальнейшей визуализации

2. Загрузите сервис Yandex DataLens.

3. Создайте подключение. Перейди на главную страницу DataLens, кликнуть по кнопке Создайте подключение. Подключение содержит информацию о параметрах доступа к источнику данных. Например, IP-адрес хоста БД, порт. На базе подключения вы можете создавать датасеты.

Необходимо выбрать файл и открыть в этом подключении ранее загруженный в память компьютера файл Excel, который мы подготовили заранее

4. Создайте датасет. Вверху открытого в данном подключении файла необходимо выбрать кнопку Создать датасет и нажать на нее. Далее нажать кнопку Сохранить.

Введите имя датасета (любое), нажмите Создать. После сохранения датасета нажмите Создать чарт.

5. Создайте первый чарт. Для визуализации разделения объема продаж по странам создайте чарт — столбчатую диаграмму. Добавьте на график названия стран. Для этого из раздела Измерения перетащите поле Country в секцию X. Добавьте на график объем продаж. Для этого из раздела Измерения перетащите поле Sales Amount в секцию Y. Также вы можете изменить цвета стран, перенеся поле Country в секцию Цвета (рис. 1). Нажмите Сохранить

Рисунок 1. Созданный чарт с распределением объема продаж по странам

Далее постройте графики самостоятельно.

Графики и визуализация:

1.    Столбчатый график: Сравнение категорий продуктов по объемам продаж.

2.    Линейный график: Динамика продаж по месяцам.

3.    Круговая диаграмма: Распределение доходов по категориям продуктов.


Задача 3.

Придумайте свой вариант исследования (визуализации) и продемонстрируйте его использую Yandex DataLens и данные из прошлой задачи. При желании можете добавить новый столбец в файл самостоятельно

 


 

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.54
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир