Ответы на тест / ВШЭ / Подготовка к НЭ по Анализу данных. Начальный уровень / 26 вопросов / Тренировочный вариант 2

Раздел
Экономические дисциплины
Предмет
Тип
Просмотров
49
Покупок
0
Антиплагиат
Не указан
Размещена
17 Июл в 16:04
ВУЗ
ВШЭ
Курс
Не указан
Стоимость
195 ₽
Демо-файлы   
2
docx
Демо - ВШЭ - Подготовка к НЭ по Анализу данных. Начальный уровень
70.5 Кбайт
jpg
Оценка - ВШЭ - Подготовка к НЭ по Анализу данных. Начальный уровень
111 Кбайт
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
pdf
Ответы(1) - ВШЭ - Подготовка к НЭ по Анализу данных. Начальный уровень
1.3 Мбайт 195 ₽
Описание

В файле собраны ответы к тесту из курса ВШЭ / Подготовка к НЭ по Анализу данных. Начальный уровень.

ПОИСК ВОПРОСА ПО ТЕКСТУ (Ctrl + F).

Результаты сдачи представлены на скрине.

После покупки Вы получите файл, где будет 26 вопросов с ответами. Верный ответ выделен по тексту.

В демо-файлах представлен скрин с результатами тестирования, а также пример, как выделены ответы.

Все набрано в Word, можно искать с помощью поиска.

Ниже список вопросов, которые представлены в файле.

Также Вы можете посмотреть другие мои готовые работы у меня на странице по ссылке:

ГОТОВЫЕ РАБОТЫ

Оглавление

Тренировочный вариант 2

Вопрос 1

Ниже приведена диаграмма рассеяния для переменных "масса цветка в граммах" и "длина ростка в сантиметрах". Выберите е утверждение.

Лишь один экземпляр имеет длину ростка менее 15 см

Не существует экземпляра с массой более 35 граммов и длиной ростка более 20 см

Ни один экземпляр не имеет длины ростка более 28 см

Большинство экземпляров имеют массу от 27 до 40 граммов

Вопрос 2

На графике ниже приведена месячная производственная динамика трёх компаний. Предположим, что время является дискретной величиной. Выберите верные утверждения.

В какой-то момент времени все три компании производили одинаковое количество продукции

Компания 2 производила стабильно меньше, чем компания 1

Компания 1 произвела наибольшее количество продукции среди других компаний в месяц 3

В восьмой месяц компания 3 производила больше, чем компания 2

Вопрос 3

Аналитик Максим хочет визуализировать выборку по двум переменным, а затем нанести на рисунок линию регрессии, оценённую по этой выборке. Какой тип графика подойдёт для этого больше всего?

Скрипичный график

Диаграмма рассеяния

Гистограмма

Столбчатая диаграмма

Вопрос 4

Исследователь Иван собрал данные по численности трёх популяций кальмаров в некотором регионе за 12 лет. Эти данные приведены в таблице ниже.

             Популяция 1    Популяция 2    Популяция 3

Среднее           2002    5401    3048

Медиана          2005    3001    4000

Стандартное отклонение        30         402       350

Выберите е утверждение.

В какой-то год количество кальмаров из популяции 2 было аномально высоким

Если рассматривать промежуток в 9 лет, то среднее и медиана численности кальмаров в популяции 1 обязательно совпадут

В какой-то год количество кальмаров из популяции 3 было аномально высоким

Наибольший разброс имеют наблюдения из популяции 1

Вопрос 5

Аналитик Сергей занимается исследованием флоры городских парков. Определите тип переменных, с которыми он работает.

Наличие в парке водоёма       

Категория качества воды в фонтанах парка  

Площадь парка            

Количество деревьев 

Цвет, в который покрашены фонари в парке

Вопрос 6

На рисунке ниже изображена диаграмма рассеяния некоторых переменных. Выберите верные утверждения.

По этой выборке нельзя построить линию регрессии

В выборке имеется как минимум 1 выброс

Выбросы оказывают большое влияние на медиану переменной 2

Выбросы оказывают малое влияние на среднее значение переменной 1

Вопрос 7

Какой переменной может соответствовать гистограмма, приведённая на рисунке ниже?

Заявляемый срок службы батареи (в годах)

Количество минут тренировки профессионального спортсмена, занимающегося бегом

Количество голубей в Москве за XX век (в единицах)

Экспорт России за 2002-2018 годы (в тыс. рублей)

Вопрос 8

Предположим, что рост взрослой собаки породы лабрадор-ретривер в см имеет нормальное распределение. Выберите все верные утверждения.

Мода роста взрослой собаки породы лабрадор-ретривер равна 57.5 см

Средний рост взрослой собаки породы лабрадор-ретривер равен 56 см

Медиана роста взрослой собаки породы лабрадор-ретривер равна 56 см

Примерно 13.6% взрослых собак породы лабрадор-ретривер имеют рост больше 56.5 см

Вопрос 9

Исследователь Ангелина занимается изучением рынка квартир России за 2002-2010 годы. Какая из собранных ею выборок будет более репрезентативной, чем другие?

Данные о квартирах, проданных с 2002 по 2010 годы в Москве и Московской области

Данные о квартирах, проданных в 2005 году

Данные о квартирах, проданных в 2005 году в Москве

Данные о квартирах, проданных с 2002 по 2010 годы в Москве

Вопрос 10

На рисунке ниже изображена диаграмма рассеяния переменных Xи Y

 Выберите е утверждение.

 a. Между переменными Xи Yсуществует слабая положительная линейная взаимосвязь

 b. Коэффициент корреляции между переменными Xи Yблизок к 0

 c. Между переменными Xи Yсуществует сильная положительная линейная взаимосвязь

 d. Коэффициент корреляции между переменными Xи Yблизок к 1

Вопрос 11

Аналитик Сергей исследует зависимость ВВП некоторой страны от уровня безработицы в этой стране. Оказалось, что выборочный коэффициент корреляции между этими величинами, полученный на некоторой выборке, равен -0.4. Выберите е утверждение.

Причина низкого ВВП – высокий уровень безработицы

Между ВВП и уровнем безработицы существует отрицательная линейная взаимосвязь

Причина высокого ВВП – низкий уровень безработицы

При увеличении уровня безработицы ВВП, скорее всего, увеличится

Вопрос 12

Исследователь Александра изучает факторы, влияющие на численность популяции жирафов. Какую переменную она может использовать в качестве признака (регрессора, независимой)?

Количество жирафов в популяции

Ареал обитания

Отношение количества жирафов в популяции в текущем году к количеству жирафов в популяции в прошлом году

Оценка коэффициента перед переменной "ареал обитания"

Вопрос 13

Исследователь Степан изучает факторы, влияющие на численность популяции куниц. Чем в данном случае будет являться переменная "Количество куниц в популяции"?

Наблюдение (объект)

Зависимая (целевая) переменная

Параметр модели

Признак (регрессор)

Вопрос 14

Исследователь Геннадий оценил парную регрессию (константа и неконстантный регрессор) по 2 наблюдениям. Выберите е утверждение.

Если добавить третье наблюдение, то среднеквадратичная ошибка обязательно будет равна 0

Среднеквадратичную ошибку в этом случае нельзя рассчитать

Среднеквадратичная ошибка в этом случае меньше нуля

Среднеквадратичная ошибка в данном случае равна 0

Вопрос 15

Исследователь Владимир в течение 100 дней собирал данные о переменных Y

, X и Z. После этого он оценил следующую линейную регрессию:

Yi=500−124Xi+0Zi,где Yi, Xi и Zi – значения переменных Y, X и Z для наблюдения i

Выберите е утверждение об интерпретации этой линейной модели.

 При увеличении переменной Xпри прочих равных переменная Zтакже увеличится

 В соответствии с моделью, переменная Zне оказывает влияния на переменную Y

 При увеличении переменной Xпри прочих равных переменная Yтакже увеличится

 При увеличении переменной Yпри прочих равных переменная Zтакже увеличится

Вопрос 16

Исследователь Сергей построил линейную модель для предсказания стоимости загородного дома по выборке из 5 наблюдений. Ниже приведены истинные значения стоимость (Y

) и предсказания модели Сергея (Z):

Y=[201,400,402,387,512]

Z=[180,389,400,387,589]

Определим ошибку модели Сергея как усреднённую сумму квадратов разностей между истинными и предсказанными значениями:

Ошибка = 15((Y1−Z1)2+…+(Y5−Z5)2)

Вычислите значение ошибки для модели Сергея. Ответ округлите до сотых.

Пример ответа: 100.80

Вопрос 17

Исследователь Жанна занимается изучением флоры хвойных лесов. Она собрала следующую выборку:

Высота дерева (м): [24, 30, 38, 57, 40]

Закодированное наименование дерева (1 – ель, 2 – сосна, 3 – лиственница): [1, 2, 3, 2, 1]

Диаметр кроны (м): [3, 3.5, 4.8, 2.9, 3.2]

Выберите две характеристики, между которыми возможно корректно рассчитать интерпретируемый выборочный коэффициент корреляции Пирсона, и вычислите этот коэффициент по приведённым данным. Ответ округлите до сотых.

Пример ответа: 0.12

Вопрос 18

Исследователь Василий хочет оценить зависимость стоимость квартиры (в миллионах рублей) в некотором городе от расстояния до ближайшего метро (в м). Для этого он построил следующую линейную регрессию:

Стоимость=w^0+w^1×Расстояние

Для оценки модели Василий использует данные по четырём квартирам, представленные в таблице ниже.

Квартира         Стоимость       Расстояние

Кв 1     4.1        300.2

Кв 2     8.9        101.2

Кв 3     5.0        820

Кв 4     5.8        300.1

Используя приведённые данные, ответьте на вопросы ниже. Необходимые формулы приведены в дополнительных материалах.

1.          Рассчитайте сумму квадратов отклонений от среднего для расстояния

2.          Рассчитайте сумму произведений отклонений от среднего стоимости и расстояния.

3.          Вычислите оценку коэффициента w^1

• .

• Вычислите оценку коэффициента w^0

4.          .

В ответ выпишите оценку коэффициента w^1

, округлённую до тысячных.

Пример ответа: 102.433

Вопрос 19

Для выполнения этого задания выберите файл, с которым вам будет удобнее работать, и загрузите его на компьютер (файлы идентичны по содержанию). Для того, чтобы загрузить файл, нажмите правой кнопкой мыши на ссылку и выберите "Сохранить файл по ссылке..." или "Открыть ссылку в новой вкладке..."

b4.csv

b4.xslx

В файле приведены данные по времени подготовки в часах (X)

и полученным баллам за экзамен по анатомии (Y) студентов некоторого учебного заведения. Будем считать, что обе величины являются непрерывными. Постройте график зависимости Y от X

.

Выберите е утверждение.

 Визуально в выборке есть хотя бы один выброс

 Наибольшее значение Xсоставляет более 10

 Наибольшее значение Y

составляет более 200

 Переменные связаны положительной линейной взаимосвязью

Вопрос 20

Найдите моду переменной M2 и наименьшее значение переменной M3. В ответ выпишите частное найденных чисел (мода / наим. знач.), округлённое до сотых.

Пример ответа: -1345.59

Ответ:

Вопрос 21

Определите наиболее часто встречающееся значение переменной time. Скопируйте в ответ это выражение. Если таких значений несколько, скопируйте любое из них.

Пример ответа: 11:12 AM

Вопрос 22

Добавьте в таблицу новый признак coded, который будет представлять собой кодированные значения переменной M2. Кодировку проведите следующим образом: если значение M2 строго меньше среднего этой переменной – 0, в противном случае – 1. Выведите медиану переменной coded. Ответ округлите до сотых.

Пример ответа: 1.00

Вопрос 23

Определите, какой график изображён на рисунке ниже.

Диаграмма рассеяния переменных М2 и time

Диаграмма рассеяния переменных М2 и М3

Диаграмма рассеяния переменных М1 и М2

Диаграмма рассеяния переменных М1 и М3

Вопрос 24

Будем считать, что выбросами считаются наблюдения, которые отличаются от среднего значения переменной на 1.5 стандартных отклонения и более. Определите количество выбросов для переменной M2.

Пример ответа: 10.00

Вопрос 25

Постройте сводную таблицу, по строкам которой расположено время, по столбцам – переменные M2 и M3, а в ячейках – средние по переменным M2 и M3 для каждого времени. Выпишите время, для которого разность по модулю между средними переменных M2 и M3 является наименьшей.

Пример ответа: 12:48 PM

Вопрос 26

Найдите переменную, которая имеет наибольшую по модулю корреляцию с переменной M2 (не включая саму M2). Помните о том, что в набор данных была добавлена переменная coded. В ответ выпишите модуль полученного значения корреляции.

Пример ответа: 0.98

 

Список литературы

Тренировочный вариант 2

Вопрос 1

Ниже приведена диаграмма рассеяния для переменных "масса цветка в граммах" и "длина ростка в сантиметрах". Выберите е утверждение.

Лишь один экземпляр имеет длину ростка менее 15 см

Не существует экземпляра с массой более 35 граммов и длиной ростка более 20 см

Ни один экземпляр не имеет длины ростка более 28 см

Большинство экземпляров имеют массу от 27 до 40 граммов

Вопрос 2

На графике ниже приведена месячная производственная динамика трёх компаний. Предположим, что время является дискретной величиной. Выберите верные утверждения.

В какой-то момент времени все три компании производили одинаковое количество продукции

Компания 2 производила стабильно меньше, чем компания 1

Компания 1 произвела наибольшее количество продукции среди других компаний в месяц 3

В восьмой месяц компания 3 производила больше, чем компания 2

Вопрос 3

Аналитик Максим хочет визуализировать выборку по двум переменным, а затем нанести на рисунок линию регрессии, оценённую по этой выборке. Какой тип графика подойдёт для этого больше всего?

Скрипичный график

Диаграмма рассеяния

Гистограмма

Столбчатая диаграмма

Вопрос 4

Исследователь Иван собрал данные по численности трёх популяций кальмаров в некотором регионе за 12 лет. Эти данные приведены в таблице ниже.

             Популяция 1    Популяция 2    Популяция 3

Среднее           2002    5401    3048

Медиана          2005    3001    4000

Стандартное отклонение        30         402       350

Выберите е утверждение.

В какой-то год количество кальмаров из популяции 2 было аномально высоким

Если рассматривать промежуток в 9 лет, то среднее и медиана численности кальмаров в популяции 1 обязательно совпадут

В какой-то год количество кальмаров из популяции 3 было аномально высоким

Наибольший разброс имеют наблюдения из популяции 1

Вопрос 5

Аналитик Сергей занимается исследованием флоры городских парков. Определите тип переменных, с которыми он работает.

Наличие в парке водоёма       

Категория качества воды в фонтанах парка  

Площадь парка            

Количество деревьев 

Цвет, в который покрашены фонари в парке

Вопрос 6

На рисунке ниже изображена диаграмма рассеяния некоторых переменных. Выберите верные утверждения.

По этой выборке нельзя построить линию регрессии

В выборке имеется как минимум 1 выброс

Выбросы оказывают большое влияние на медиану переменной 2

Выбросы оказывают малое влияние на среднее значение переменной 1

Вопрос 7

Какой переменной может соответствовать гистограмма, приведённая на рисунке ниже?

Заявляемый срок службы батареи (в годах)

Количество минут тренировки профессионального спортсмена, занимающегося бегом

Количество голубей в Москве за XX век (в единицах)

Экспорт России за 2002-2018 годы (в тыс. рублей)

Вопрос 8

Предположим, что рост взрослой собаки породы лабрадор-ретривер в см имеет нормальное распределение. Выберите все верные утверждения.

Мода роста взрослой собаки породы лабрадор-ретривер равна 57.5 см

Средний рост взрослой собаки породы лабрадор-ретривер равен 56 см

Медиана роста взрослой собаки породы лабрадор-ретривер равна 56 см

Примерно 13.6% взрослых собак породы лабрадор-ретривер имеют рост больше 56.5 см

Вопрос 9

Исследователь Ангелина занимается изучением рынка квартир России за 2002-2010 годы. Какая из собранных ею выборок будет более репрезентативной, чем другие?

Данные о квартирах, проданных с 2002 по 2010 годы в Москве и Московской области

Данные о квартирах, проданных в 2005 году

Данные о квартирах, проданных в 2005 году в Москве

Данные о квартирах, проданных с 2002 по 2010 годы в Москве

Вопрос 10

На рисунке ниже изображена диаграмма рассеяния переменных Xи Y

 Выберите е утверждение.

 a. Между переменными Xи Yсуществует слабая положительная линейная взаимосвязь

 b. Коэффициент корреляции между переменными Xи Yблизок к 0

 c. Между переменными Xи Yсуществует сильная положительная линейная взаимосвязь

 d. Коэффициент корреляции между переменными Xи Yблизок к 1

Вопрос 11

Аналитик Сергей исследует зависимость ВВП некоторой страны от уровня безработицы в этой стране. Оказалось, что выборочный коэффициент корреляции между этими величинами, полученный на некоторой выборке, равен -0.4. Выберите е утверждение.

Причина низкого ВВП – высокий уровень безработицы

Между ВВП и уровнем безработицы существует отрицательная линейная взаимосвязь

Причина высокого ВВП – низкий уровень безработицы

При увеличении уровня безработицы ВВП, скорее всего, увеличится

Вопрос 12

Исследователь Александра изучает факторы, влияющие на численность популяции жирафов. Какую переменную она может использовать в качестве признака (регрессора, независимой)?

Количество жирафов в популяции

Ареал обитания

Отношение количества жирафов в популяции в текущем году к количеству жирафов в популяции в прошлом году

Оценка коэффициента перед переменной "ареал обитания"

Вопрос 13

Исследователь Степан изучает факторы, влияющие на численность популяции куниц. Чем в данном случае будет являться переменная "Количество куниц в популяции"?

Наблюдение (объект)

Зависимая (целевая) переменная

Параметр модели

Признак (регрессор)

Вопрос 14

Исследователь Геннадий оценил парную регрессию (константа и неконстантный регрессор) по 2 наблюдениям. Выберите е утверждение.

Если добавить третье наблюдение, то среднеквадратичная ошибка обязательно будет равна 0

Среднеквадратичную ошибку в этом случае нельзя рассчитать

Среднеквадратичная ошибка в этом случае меньше нуля

Среднеквадратичная ошибка в данном случае равна 0

Вопрос 15

Исследователь Владимир в течение 100 дней собирал данные о переменных Y

, X и Z. После этого он оценил следующую линейную регрессию:

Yi=500−124Xi+0Zi,где Yi, Xi и Zi – значения переменных Y, X и Z для наблюдения i

Выберите е утверждение об интерпретации этой линейной модели.

 При увеличении переменной Xпри прочих равных переменная Zтакже увеличится

 В соответствии с моделью, переменная Zне оказывает влияния на переменную Y

 При увеличении переменной Xпри прочих равных переменная Yтакже увеличится

 При увеличении переменной Yпри прочих равных переменная Zтакже увеличится

Вопрос 16

Исследователь Сергей построил линейную модель для предсказания стоимости загородного дома по выборке из 5 наблюдений. Ниже приведены истинные значения стоимость (Y

) и предсказания модели Сергея (Z):

Y=[201,400,402,387,512]

Z=[180,389,400,387,589]

Определим ошибку модели Сергея как усреднённую сумму квадратов разностей между истинными и предсказанными значениями:

Ошибка = 15((Y1−Z1)2+…+(Y5−Z5)2)

Вычислите значение ошибки для модели Сергея. Ответ округлите до сотых.

Пример ответа: 100.80

Вопрос 17

Исследователь Жанна занимается изучением флоры хвойных лесов. Она собрала следующую выборку:

Высота дерева (м): [24, 30, 38, 57, 40]

Закодированное наименование дерева (1 – ель, 2 – сосна, 3 – лиственница): [1, 2, 3, 2, 1]

Диаметр кроны (м): [3, 3.5, 4.8, 2.9, 3.2]

Выберите две характеристики, между которыми возможно корректно рассчитать интерпретируемый выборочный коэффициент корреляции Пирсона, и вычислите этот коэффициент по приведённым данным. Ответ округлите до сотых.

Пример ответа: 0.12

Вопрос 18

Исследователь Василий хочет оценить зависимость стоимость квартиры (в миллионах рублей) в некотором городе от расстояния до ближайшего метро (в м). Для этого он построил следующую линейную регрессию:

Стоимость=w^0+w^1×Расстояние

Для оценки модели Василий использует данные по четырём квартирам, представленные в таблице ниже.

Квартира         Стоимость       Расстояние

Кв 1     4.1        300.2

Кв 2     8.9        101.2

Кв 3     5.0        820

Кв 4     5.8        300.1

Используя приведённые данные, ответьте на вопросы ниже. Необходимые формулы приведены в дополнительных материалах.

1.          Рассчитайте сумму квадратов отклонений от среднего для расстояния

2.          Рассчитайте сумму произведений отклонений от среднего стоимости и расстояния.

3.          Вычислите оценку коэффициента w^1

• .

• Вычислите оценку коэффициента w^0

4.          .

В ответ выпишите оценку коэффициента w^1

, округлённую до тысячных.

Пример ответа: 102.433

Вопрос 19

Для выполнения этого задания выберите файл, с которым вам будет удобнее работать, и загрузите его на компьютер (файлы идентичны по содержанию). Для того, чтобы загрузить файл, нажмите правой кнопкой мыши на ссылку и выберите "Сохранить файл по ссылке..." или "Открыть ссылку в новой вкладке..."

b4.csv

b4.xslx

В файле приведены данные по времени подготовки в часах (X)

и полученным баллам за экзамен по анатомии (Y) студентов некоторого учебного заведения. Будем считать, что обе величины являются непрерывными. Постройте график зависимости Y от X

.

Выберите е утверждение.

 Визуально в выборке есть хотя бы один выброс

 Наибольшее значение Xсоставляет более 10

 Наибольшее значение Y

составляет более 200

 Переменные связаны положительной линейной взаимосвязью

Вопрос 20

Найдите моду переменной M2 и наименьшее значение переменной M3. В ответ выпишите частное найденных чисел (мода / наим. знач.), округлённое до сотых.

Пример ответа: -1345.59

Ответ:

Вопрос 21

Определите наиболее часто встречающееся значение переменной time. Скопируйте в ответ это выражение. Если таких значений несколько, скопируйте любое из них.

Пример ответа: 11:12 AM

Вопрос 22

Добавьте в таблицу новый признак coded, который будет представлять собой кодированные значения переменной M2. Кодировку проведите следующим образом: если значение M2 строго меньше среднего этой переменной – 0, в противном случае – 1. Выведите медиану переменной coded. Ответ округлите до сотых.

Пример ответа: 1.00

Вопрос 23

Определите, какой график изображён на рисунке ниже.

Диаграмма рассеяния переменных М2 и time

Диаграмма рассеяния переменных М2 и М3

Диаграмма рассеяния переменных М1 и М2

Диаграмма рассеяния переменных М1 и М3

Вопрос 24

Будем считать, что выбросами считаются наблюдения, которые отличаются от среднего значения переменной на 1.5 стандартных отклонения и более. Определите количество выбросов для переменной M2.

Пример ответа: 10.00

Вопрос 25

Постройте сводную таблицу, по строкам которой расположено время, по столбцам – переменные M2 и M3, а в ячейках – средние по переменным M2 и M3 для каждого времени. Выпишите время, для которого разность по модулю между средними переменных M2 и M3 является наименьшей.

Пример ответа: 12:48 PM

Вопрос 26

Найдите переменную, которая имеет наибольшую по модулю корреляцию с переменной M2 (не включая саму M2). Помните о том, что в набор данных была добавлена переменная coded. В ответ выпишите модуль полученного значения корреляции.

Пример ответа: 0.98

 

Вам подходит эта работа?
Похожие работы
Другое
Контрольная работа Контрольная
9 Окт в 21:28
4 +4
0 покупок
Другое
Презентация Презентация
3 Окт в 13:40
15 +1
0 покупок
Другое
Реферат Реферат
10 Сен в 15:09
22 +1
0 покупок
Другие работы автора
Web-программирование
Тест Тест
8 Окт в 15:23
12 +2
0 покупок
АСУ - Автоматизированные системы управления
Тест Тест
7 Окт в 15:47
10 +2
0 покупок
Темы журнала
Показать ещё
Прямой эфир