Ответы на тест. Имэс. Введение в технологии Big Data. Набрано 94% . 2330

Раздел
Программирование
Тип
Просмотров
40
Покупок
0
Антиплагиат
Не указан
Размещена
23 Фев в 21:53
ВУЗ
Не указан
Курс
Не указан
Стоимость
390 ₽
Демо-файлы   
1
png
47 из 50
2.5 Кбайт
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
docx
2330 Ответы Введение в технологии Big Data
217.4 Кбайт
Описание

В ФАЙЛЕ ПРИВЕДЕНЫ ВОПРОСЫ И ОТВЕТЫ С КОНКРЕТНЫХ ПОПЫТОК!!!

ВСЕ ВОПРОСЫ ПРИВЕДЕНЫ ЗДЕСЬ!!!!

ФАЙЛ С ОТВЕТАМИ БУДЕТ ДОСТУПЕН СРАЗУ ПОСЛЕ ПОКУПКИ!!

Оглавление

В ФАЙЛЕ ПРИВЕДЕНЫ ВОПРОСЫ И ОТВЕТЫ С КОНКРЕТНЫХ ПОПЫТОК!!!

ВСЕ ВОПРОСЫ ПРИВЕДЕНЫ ЗДЕСЬ!!!!

ФАЙЛ С ОТВЕТАМИ БУДЕТ ДОСТУПЕН СРАЗУ ПОСЛЕ ПОКУПКИ!!

Перетащите в выделенную область изображение, содержащее программу, которая создаёт представление и выполняет SQL-запрос для выполнения операции с данными через это представление.
Установите соответствие между компонентами Apache Hadoop и функциями, которые они выполняют.
MapReduce
HDFS
Расположите в хронологической последовательности этапы процесса обработки данных в Apache Spark.

Какие принципы лежат в основе работы Hadoop Distributed File System (HDFS)?
a.
Репликация данных и их распределенное хранение

b.
Обработка только структурированных данных

c.
Централизованное хранение данных

d.
Хранение данных только в одном формате

e.
Обработка данных в потоке реального времени
Какие принципы обеспечивают отказоустойчивость в Apache Spark?
a.
Централизованное хранение данных

b.
Работа с данными только в оперативной памяти

c.
Репликация данных и линейные вычисления с использованием графа

d.
Распределенные вычисления

e.
Использование кэширования данных
Какой подход обеспечивают масштабируемость при обработке Big Data?
a.
Цикличное масштабирование

b.
Безграничное масштабирование

c.
Вертикальное масштабирование

d.
Горизонтальное масштабирование

e.
Пропорциональное масштабирование
Какую задачу решает обработка данных в реальном времени?
a.
Устраняет задержки в обработке данных

b.
Приводит к уменьшению объема данных

c.
Оптимизирует алгоритмы сортировки

d.
Обеспечивает обработку данных в отложенном режиме

e.
Способствует обработке только структурированных данных
Какие принципы лежат в основе архитектуры Kappa?
a.
Только пакетная обработка данных

b.
Обработка данных только в виде потока в режиме реального времени

c.
Обработка данных только в оффлайн-режиме

d.
Параллельная обработка пакетов и потоков данных

e.
Только обработка данных в виде таблиц
Каковы функции Resource Manager в YARN?
a.
Преобразование данных в структурированную форму

b.
Распределение ресурсов и планирование задач

c.
Уменьшение объёма данных

d.
Репликация данных

e.
Масштабирование кластера
Какие принципы лежат в основе архитектуры Lambda?
a.
Только потоковая обработка данных

b.
Только обработка данных в реальном времени

c.
Только пакетная обработка данных

d.
Параллельная обработка пакетов и потоков данных

e.
Обработка данных только в оффлайн-режиме
Какой принцип работы лежит в основе технологии "колоночное хранение" в Big Data?
a.
Работа только с графическими данными

b.
Хранение данных в виде столбцов

c.
Анализ данных в офлайн-режиме

d.
Обработка данных в потоке реального времени

e.
Обработка только числовых данных
Какой принцип работы лежит в основе Node Federation в Hadoop?
a.
Обработка только числовых данных

b.
Обеспечение доступности и отказоустойчивости NameNode

c.
Работа только с графическими данными

d.
Работа только с резервными копиями данных

e.
Обработка данных в потоке реального времени
Какой принцип работы лежит в основе Apache Spark?
a.
Работа с файловой системой

b.
Обработка данных в несколько этапов

c.
Распределенная обработка данных в оперативной памяти

d.
Использование интеллектуальных алгоритмов

e.
Работа с графикой
Какие задачи могут решать методы машинного обучения в Big Data?
a.
Распределенное хранение данных

b.
Классификация и кластеризация данных

c.
Оптимизация алгоритмов сортировки

d.
Анализ связей изображений

e.
Генерация данных в реальном времени
Что представляет из себя DStream (Discretized Stream) в Apache Spark?
a.
Структура, включающая только только числовые данные

b.
Резервную копию данных

c.
Модератор данных в потоке реального времени

d.
Единый пакет данных

e.
Совокупность микропакетов данных
Что такое HDFS?
a.
Язык программирования

b.
Система управления базами данных

c.
Фреймворк для обработки потоков данных

d.
Распределенная файловая система Hadoop

e.
Интерфейс пользователя
Какие принципы обеспечивают отказоустойчивость в распределенных системах?
a.
Только централизованное хранение данных

b.
Работа только с резервными копиями данных

c.
Работа только с локальными данными

d.
Распределенное хранение данных и репликация

e.
Использование кэширования данных
Выберите пропущенные слова в приведённом ниже предложении.
RDD (Resilient Distributed Dataset) - это основная абстракция данных, представляющая собой распределенный объект данных.
Выберите пропущенные слова в приведённом ниже предложении.
Hadoop обеспечивает отказоустойчивость путем создания данных на нескольких DataNodes (узлах). Если один из узлов становится недоступным, данные все равно остаются доступны через их на других узлах.
В чём заключаются недостатки Apache Spark?
a.
низкая надёжность

b.
нестабильная работа со структурированными данными

c.
сравнительно более высокая стоимость

d.
низкая производительность

e.
требование значительных объёмов оперативной памяти
Какие языки программирования для написания приложений поддерживаются в Apache Spark?
a.
C++

b.
Java

c.
Python

d.
JavaSctipt

e.
C#

f.
PHP
Каковы преимущества алгоритма MapReduce?
a.
параллельная обработка
b.
обработка потоковых данных

c.
последовательная обработка

d.
отказоустойчивость

e.
быстродействие
Выберите пропущенные слова в приведённом ниже предложении.
DStream (Discretized Stream) в представляет собой высокоуровневый абстрактный API для работы с данными.
Выберите пропущенные слова в приведённом ниже предложении.
, такие как информация о размещении блоков и их размере, хранятся в Namenode. Эта информация необходима для последующего данных.

Расположите в хронологической последовательности этапы эволюции технологий работы с данными.

Перетащите в выделенную область изображение, содержащее программу, которая создаёт RDD с двумя разделами из коллекции данных.


Расположите в хронологической последовательности этапы процесса обработки данных в Apache Hadoop.

Установите соответствие между компонентами YARN и выполняемыми ими функциями.
Node Manager
Resource Manager
Application Master
Какой API в Apache Spark предоставляет возможности для работы с графами?
a.
Spark MLlib

b.
Spark SQL

c.
Spark Core

d.
Spark GraphX

e.
Spark Streaming


В ФАЙЛЕ ПРИВЕДЕНЫ ВОПРОСЫ И ОТВЕТЫ С КОНКРЕТНЫХ ПОПЫТОК!!!

ВСЕ ВОПРОСЫ ПРИВЕДЕНЫ ЗДЕСЬ!!!!

ФАЙЛ С ОТВЕТАМИ БУДЕТ ДОСТУПЕН СРАЗУ ПОСЛЕ ПОКУПКИ!!

Список литературы

В ФАЙЛЕ ПРИВЕДЕНЫ ВОПРОСЫ И ОТВЕТЫ С КОНКРЕТНЫХ ПОПЫТОК!!!

ВСЕ ВОПРОСЫ ПРИВЕДЕНЫ ЗДЕСЬ!!!!

ФАЙЛ С ОТВЕТАМИ БУДЕТ ДОСТУПЕН СРАЗУ ПОСЛЕ ПОКУПКИ!!

Вам подходит эта работа?
Похожие работы
Прямой эфир