В файле собраны ответы к тесту из курса ВШЭ / Подготовка к НЭ по Анализу данных. Начальный уровень.
ПОИСК ВОПРОСА ПО ТЕКСТУ (Ctrl + F).
Результаты сдачи представлены на скрине.
После покупки Вы получите файл, где будет 26 вопросов с ответами. Верный ответ выделен по тексту.
В демо-файлах представлен скрин с результатом тестирования, а также пример, как выделены ответы.
Все набрано в Word, можно искать с помощью поиска.
Ниже список вопросов, которые представлены в файле.
Также Вы можете посмотреть другие мои готовые работы у меня на странице по ссылке:
Тренировочный вариант 1
Вопрос 1
На графике изображена динамика численности популяции кроликов в некоторой области. Выберите е утверждение.
С 1991 по 1992 годы популяция увеличилась больше, чем на 1 млн особей
Наибольшей численности популяция достигла в 1993 году
С 1993 по 1994 годы численность популяции увеличилась
Ни в один год численность популяции не была меньше 3.25 миллионов особей
Вопрос 2
На рисунке ниже изображена динамика средней дневной температуры за 6 дней в трёх странах. Выберите верные утверждения.
В день 6 температура в стране 1 была больше 30 градусов Цельсия
В одной из стран температура была всегда стабильно больше, чем в двух других
В третий день температура в стране 1 была больше, чем в двух других странах
В день 4 значения температуры в странах 2 и 3 были равны
Вопрос 3
Аналитик Валерий хочет визуализировать динамику изменения осадков за последний месяц. Какой тип графика меньше всего подойдёт для этого?
Диаграмма рассеяния
Ящик с усами
Столбчатая диаграмма
Линейный график
Вопрос 4
Исследователь Виктория собрала данные по численности трёх популяций жирафов в некотором регионе за 10 лет. Эти данные приведены в таблице ниже.
Популяция 1 Популяция 2 Популяция 3
Среднее 3812 7890 1002
Медиана 4901 10001 1002
Стандартное отклонение 302 500 40
Выберите е утверждение.
В какой-то год количество жирафов из популяции 3 было аномально высоким
В произвольно выбранный год популяция 1 обязательно будет насчитывать больше особей, чем популяция 3
В какой-то год количество жирафов из популяции 1 было аномально низким
В какой-то год количество жирафов из популяции 2 было аномально высоким
Вопрос 5
Экономист Дарья занимается исследованием рынка квартир. Определите тип переменных, с которыми она работает.
Количество комнат в квартире
Класс квартиры (от 1 до 5)
Факт наличия станции метро в радиусе 700 м
Цвет дома
Цена квартиры
Вопрос 6
На рисунке ниже изображена диаграмма рассеяния некоторых переменных. Выберите верные утверждения.
Выбросы оказывают сильное влияние на среднее значение переменной 1
Выбросы оказывают сильное влияние на среднее значение переменной 2
По данной выборке можно построить линию регрессии
В данных, скорее всего, нет выбросов
Вопрос 7
Какой переменной может соответствовать гистограмма, изображённая на рисунке ниже?
Количество созвездий, видимых на ночном небе в Москве в августе
Количество литров воды, которое выпивает в день пятилетний ребёнок
Рост сотрудников некоторой организации
Количество струн на музыкальных инструментах в некоторой консерватории
Вопрос 8
Предположим, что рост взрослой собаки породы золотистый ретривер в см имеет нормальное распределение. Выберите все верные утверждения.
2.1% взрослых собак породы золотистый ретривер имеют рост более 58 см
Медиана роста взрослой собаки породы золотистый ретривер равна 59 см
Примерно 0.1% взрослых собак породы золотистый ретривер имеют рост менее 53 см
Примерно 68.2% взрослых собак породы золотистый ретривер имеют рост от 55 до 57 см
Вопрос 9
Исследователь Дмитрий занимается изучением популяции африканских слонов. Какая из собранных им выборок будет более репрезентативной, чем другие?
Данные о популяции африканских слонов, собранные в случайных точках Африки
Данные о популяции индийских слонов
Данные о популяции индийских слонов, собранные в 2002 году
Данные о популяции африканских слонов, собранные в Конго
Вопрос 10
На рисунке ниже изображена диаграмма рассеяния переменных Xи Y
Выберите е утверждение.
Между переменными Xи Yсуществует сильная положительная линейная взаимосвязь
Между переменными Xи Yсуществует сильная положительная нелинейная взаимосвязь
Между переменными Xи Yсуществует сильная отрицательная линейная взаимосвязь
Между переменными Xи Yсуществует сильная отрицательная нелинейная взаимосвязь
Вопрос 11
Аналитик Степан исследует зависимость ВВП некоторой страны от величины экспорта этой страны. Оказалось, что выборочный коэффициент корреляции между этими величинами, полученный на некоторой выборке, равен 0.7. Выберите е утверждение.
При увеличении экспорта, скорее всего, произойдёт увеличение ВВП
Между экспортом и ВВП существует сильная отрицательная линейная взаимосвязь
Между экспортом и ВВП не существует нелинейной взаимосвязи
При увеличении ВВП величина экспорта обязана уменьшиться
Вопрос 12
Исследователь Евгения изучает факторы, влияющие на успеваемость студентов. Какую переменную она может использовать в качестве целевой (зависимой)?
Средняя продолжительность сна студента
Время прогулок в парках
Оценка студента за курс "Теория вероятностей"
Количество книг, купленных студентом за прошлый год
Вопрос 13
Исследователь Семён изучает факторы, влияющие на температуру воздуха. Чем в данном случае будет являться переменная "Уровень осадков"?
Целевая (зависимая) переменная
Признак (регрессор)
Объект (наблюдение)
Параметр модели
Вопрос 14
Исследователь Георгий построил линейную регрессию по 150 наблюдениям. Выберите е утверждение.
Среднеквадратичная ошибка в модели Георгия не может превышать 150
Среднеквадратичная ошибка в модели Георгия обязательно больше нуля
Среднеквадратичная ошибка в модели Георгия может быть больше 100
Среднеквадратичная ошибка в модели Георгия может быть отрицательной
Вопрос 15
Исследователь Борис в течение 365 дней собирал данные о переменных Y, X и Z
После этого он оценил следующую линейную регрессию:
Yi=120+Xi+15Zi
,где Yi, Xi и Zi – значения переменных Y, X и Z для наблюдения i
Выберите е утверждение об интерпретации этой линейной модели.
При увеличении переменной X, при прочих равных переменная Yне изменится
При увеличении переменной Z, при прочих равных переменная Yтакже увеличится
При увеличении переменной Z, при прочих равных переменная Yуменьшится
При увеличении переменной Z, при прочих равных переменная Xтакже увеличится
Вопрос 16
Исследователь Василий построил линейную модель для предсказания стоимости квартиры по выборке из 5 наблюдений. Ниже приведены истинные значения стоимость (Y
) и предсказания модели Василия (Z):
Y=[105,100,240,220,102]
Z=[100,101,287,200,100]
Определим ошибку модели Василия как усреднённую сумму квадратов разностей между истинными и предсказанными значениями:
Ошибка = 15((Y1−Z1)2+…+(Y5−Z5)2)
Вычислите значение ошибки для модели Василия. Ответ округлите до сотых.
Пример ответа: 100.90
Вопрос 17
Исследователь Ксения занимается изучением флоры хвойных лесов. Она собрала следующую выборку:
Высота дерева (м): [30, 45, 41, 60, 52]
Закодированное наименование дерева (1 – ель, 2 – сосна, 3 – лиственница): [1, 1, 1, 2, 2]
Диаметр ствола (м): [1.5, 2, 1.9, 1.2, 1.5]
Выберите две характеристики, между которыми возможно корректно рассчитать интерпретируемый выборочный коэффициент корреляции Пирсона, и вычислите этот коэффициент по приведённым данным. Ответ округлите до сотых.
Пример ответа: 0.12
Вопрос 18
Исследователь Василий хочет оценить зависимость стоимость квартиры (в миллионах рублей) в некотором городе от расстояния до ближайшего метро (в м). Для этого он построил следующую линейную регрессию:
Стоимость=w^0+w^1×Расстояние
Для оценки модели Василий использует данные по четырём квартирам, представленные в таблице ниже.
Квартира Стоимость Расстояние
Кв 1 3.5 1020
Кв 2 7.2 300
Кв 3 4.8 900
Кв 4 4.1 700
Используя приведённые данные, ответьте на вопросы ниже. Необходимые формулы приведены в дополнительных материалах.
1. Рассчитайте сумму квадратов отклонений от среднего для расстояния
2. Рассчитайте сумму произведений отклонений от среднего стоимости и расстояния.
3. Вычислите оценку коэффициента w^1• .
• Вычислите оценку коэффициента w^0
4. .
В ответ выпишите оценку коэффициента w^0, округлённую до сотых.
Пример ответа: 102.43
Вопрос 19
Для выполнения этого задания выберите файл, с которым вам будет удобнее работать, и загрузите его на компьютер (файлы идентичны по содержанию). Для того, чтобы загрузить файл, нажмите правой кнопкой мыши на ссылку и выберите "Сохранить файл по ссылке..." или "Открыть ссылку в новой вкладке..."
b4.csv
b4.xslx
В файле приведены данные по времени подготовки в часах (X)
и полученным баллам за экзамен по анатомии (Y) студентов некоторого учебного заведения. Будем считать, что обе величины являются непрерывными. Постройте график зависимости Y от X.
Выберите е утверждение.
Между переменными Xи Yотсутствует линейная взаимосвязь
Между переменными Xи Yсуществует отрицательная линейная взаимосвязь
Между переменными Xи Yсуществует положительная линейная взаимосвязь
При прочих равных, при увеличении переменной Xпеременная Yне изменится
Вопрос 20
Найдите медиану переменной M1 и наибольшее значение переменной M2. В ответ выпишите произведение найденных чисел, округлённое до сотых.
Пример ответа: -1345.59
Вопрос 21
Определите наиболее часто встречающееся значение переменной time. Скопируйте в ответ это выражение.
Пример ответа: 11:12 AM
Вопрос 22
Добавьте в таблицу новый признак coded, который будет представлять собой кодированные значения переменной M1. Кодировку проведите следующим образом: если значение M1 строго меньше медианы этой переменной – 0, в противном случае – 1. Выведите среднее значение переменной coded.
Пример ответа: 12.14
Вопрос 23
Определите, какой график изображён на рисунке ниже.
Диаграмма рассеяния переменных М2 и М1
Диаграмма рассеяния переменных М3 и М1
Диаграмма рассеяния переменных time и М1
Диаграмма рассеяния переменных time и М2
Вопрос 24
Будем считать, что выбросами считаются наблюдения, которые отличаются от среднего значения переменной на 1.5 стандартных отклонения и более. Определите количество выбросов для переменной M1.
Пример ответа: 10.00
Вопрос 25
Постройте сводную таблицу, по строкам которой расположено время, по столбцам – переменные M1 и M2, а в ячейках – средние по переменным M1 и M2 для каждого времени. Выпишите время, для которого разность по модулю между средними переменных M1 и M2 является наименьшей.
Пример ответа: 12:48 PM
Вопрос 26
Найдите переменную, которая имеет наибольшую по модулю корреляцию с переменной M1 (не включая саму M1). Помните о том, что в набор данных была добавлена переменная coded. В ответ выпишите модуль полученного значения корреляции.
Пример ответа: 0.98
Тренировочный вариант 1
Вопрос 1
На графике изображена динамика численности популяции кроликов в некоторой области. Выберите е утверждение.
С 1991 по 1992 годы популяция увеличилась больше, чем на 1 млн особей
Наибольшей численности популяция достигла в 1993 году
С 1993 по 1994 годы численность популяции увеличилась
Ни в один год численность популяции не была меньше 3.25 миллионов особей
Вопрос 2
На рисунке ниже изображена динамика средней дневной температуры за 6 дней в трёх странах. Выберите верные утверждения.
В день 6 температура в стране 1 была больше 30 градусов Цельсия
В одной из стран температура была всегда стабильно больше, чем в двух других
В третий день температура в стране 1 была больше, чем в двух других странах
В день 4 значения температуры в странах 2 и 3 были равны
Вопрос 3
Аналитик Валерий хочет визуализировать динамику изменения осадков за последний месяц. Какой тип графика меньше всего подойдёт для этого?
Диаграмма рассеяния
Ящик с усами
Столбчатая диаграмма
Линейный график
Вопрос 4
Исследователь Виктория собрала данные по численности трёх популяций жирафов в некотором регионе за 10 лет. Эти данные приведены в таблице ниже.
Популяция 1 Популяция 2 Популяция 3
Среднее 3812 7890 1002
Медиана 4901 10001 1002
Стандартное отклонение 302 500 40
Выберите е утверждение.
В какой-то год количество жирафов из популяции 3 было аномально высоким
В произвольно выбранный год популяция 1 обязательно будет насчитывать больше особей, чем популяция 3
В какой-то год количество жирафов из популяции 1 было аномально низким
В какой-то год количество жирафов из популяции 2 было аномально высоким
Вопрос 5
Экономист Дарья занимается исследованием рынка квартир. Определите тип переменных, с которыми она работает.
Количество комнат в квартире
Класс квартиры (от 1 до 5)
Факт наличия станции метро в радиусе 700 м
Цвет дома
Цена квартиры
Вопрос 6
На рисунке ниже изображена диаграмма рассеяния некоторых переменных. Выберите верные утверждения.
Выбросы оказывают сильное влияние на среднее значение переменной 1
Выбросы оказывают сильное влияние на среднее значение переменной 2
По данной выборке можно построить линию регрессии
В данных, скорее всего, нет выбросов
Вопрос 7
Какой переменной может соответствовать гистограмма, изображённая на рисунке ниже?
Количество созвездий, видимых на ночном небе в Москве в августе
Количество литров воды, которое выпивает в день пятилетний ребёнок
Рост сотрудников некоторой организации
Количество струн на музыкальных инструментах в некоторой консерватории
Вопрос 8
Предположим, что рост взрослой собаки породы золотистый ретривер в см имеет нормальное распределение. Выберите все верные утверждения.
2.1% взрослых собак породы золотистый ретривер имеют рост более 58 см
Медиана роста взрослой собаки породы золотистый ретривер равна 59 см
Примерно 0.1% взрослых собак породы золотистый ретривер имеют рост менее 53 см
Примерно 68.2% взрослых собак породы золотистый ретривер имеют рост от 55 до 57 см
Вопрос 9
Исследователь Дмитрий занимается изучением популяции африканских слонов. Какая из собранных им выборок будет более репрезентативной, чем другие?
Данные о популяции африканских слонов, собранные в случайных точках Африки
Данные о популяции индийских слонов
Данные о популяции индийских слонов, собранные в 2002 году
Данные о популяции африканских слонов, собранные в Конго
Вопрос 10
На рисунке ниже изображена диаграмма рассеяния переменных Xи Y
Выберите е утверждение.
Между переменными Xи Yсуществует сильная положительная линейная взаимосвязь
Между переменными Xи Yсуществует сильная положительная нелинейная взаимосвязь
Между переменными Xи Yсуществует сильная отрицательная линейная взаимосвязь
Между переменными Xи Yсуществует сильная отрицательная нелинейная взаимосвязь
Вопрос 11
Аналитик Степан исследует зависимость ВВП некоторой страны от величины экспорта этой страны. Оказалось, что выборочный коэффициент корреляции между этими величинами, полученный на некоторой выборке, равен 0.7. Выберите е утверждение.
При увеличении экспорта, скорее всего, произойдёт увеличение ВВП
Между экспортом и ВВП существует сильная отрицательная линейная взаимосвязь
Между экспортом и ВВП не существует нелинейной взаимосвязи
При увеличении ВВП величина экспорта обязана уменьшиться
Вопрос 12
Исследователь Евгения изучает факторы, влияющие на успеваемость студентов. Какую переменную она может использовать в качестве целевой (зависимой)?
Средняя продолжительность сна студента
Время прогулок в парках
Оценка студента за курс "Теория вероятностей"
Количество книг, купленных студентом за прошлый год
Вопрос 13
Исследователь Семён изучает факторы, влияющие на температуру воздуха. Чем в данном случае будет являться переменная "Уровень осадков"?
Целевая (зависимая) переменная
Признак (регрессор)
Объект (наблюдение)
Параметр модели
Вопрос 14
Исследователь Георгий построил линейную регрессию по 150 наблюдениям. Выберите е утверждение.
Среднеквадратичная ошибка в модели Георгия не может превышать 150
Среднеквадратичная ошибка в модели Георгия обязательно больше нуля
Среднеквадратичная ошибка в модели Георгия может быть больше 100
Среднеквадратичная ошибка в модели Георгия может быть отрицательной
Вопрос 15
Исследователь Борис в течение 365 дней собирал данные о переменных Y, X и Z
После этого он оценил следующую линейную регрессию:
Yi=120+Xi+15Zi
,где Yi, Xi и Zi – значения переменных Y, X и Z для наблюдения i
Выберите е утверждение об интерпретации этой линейной модели.
При увеличении переменной X, при прочих равных переменная Yне изменится
При увеличении переменной Z, при прочих равных переменная Yтакже увеличится
При увеличении переменной Z, при прочих равных переменная Yуменьшится
При увеличении переменной Z, при прочих равных переменная Xтакже увеличится
Вопрос 16
Исследователь Василий построил линейную модель для предсказания стоимости квартиры по выборке из 5 наблюдений. Ниже приведены истинные значения стоимость (Y
) и предсказания модели Василия (Z):
Y=[105,100,240,220,102]
Z=[100,101,287,200,100]
Определим ошибку модели Василия как усреднённую сумму квадратов разностей между истинными и предсказанными значениями:
Ошибка = 15((Y1−Z1)2+…+(Y5−Z5)2)
Вычислите значение ошибки для модели Василия. Ответ округлите до сотых.
Пример ответа: 100.90
Вопрос 17
Исследователь Ксения занимается изучением флоры хвойных лесов. Она собрала следующую выборку:
Высота дерева (м): [30, 45, 41, 60, 52]
Закодированное наименование дерева (1 – ель, 2 – сосна, 3 – лиственница): [1, 1, 1, 2, 2]
Диаметр ствола (м): [1.5, 2, 1.9, 1.2, 1.5]
Выберите две характеристики, между которыми возможно корректно рассчитать интерпретируемый выборочный коэффициент корреляции Пирсона, и вычислите этот коэффициент по приведённым данным. Ответ округлите до сотых.
Пример ответа: 0.12
Вопрос 18
Исследователь Василий хочет оценить зависимость стоимость квартиры (в миллионах рублей) в некотором городе от расстояния до ближайшего метро (в м). Для этого он построил следующую линейную регрессию:
Стоимость=w^0+w^1×Расстояние
Для оценки модели Василий использует данные по четырём квартирам, представленные в таблице ниже.
Квартира Стоимость Расстояние
Кв 1 3.5 1020
Кв 2 7.2 300
Кв 3 4.8 900
Кв 4 4.1 700
Используя приведённые данные, ответьте на вопросы ниже. Необходимые формулы приведены в дополнительных материалах.
1. Рассчитайте сумму квадратов отклонений от среднего для расстояния
2. Рассчитайте сумму произведений отклонений от среднего стоимости и расстояния.
3. Вычислите оценку коэффициента w^1• .
• Вычислите оценку коэффициента w^0
4. .
В ответ выпишите оценку коэффициента w^0, округлённую до сотых.
Пример ответа: 102.43
Вопрос 19
Для выполнения этого задания выберите файл, с которым вам будет удобнее работать, и загрузите его на компьютер (файлы идентичны по содержанию). Для того, чтобы загрузить файл, нажмите правой кнопкой мыши на ссылку и выберите "Сохранить файл по ссылке..." или "Открыть ссылку в новой вкладке..."
b4.csv
b4.xslx
В файле приведены данные по времени подготовки в часах (X)
и полученным баллам за экзамен по анатомии (Y) студентов некоторого учебного заведения. Будем считать, что обе величины являются непрерывными. Постройте график зависимости Y от X.
Выберите е утверждение.
Между переменными Xи Yотсутствует линейная взаимосвязь
Между переменными Xи Yсуществует отрицательная линейная взаимосвязь
Между переменными Xи Yсуществует положительная линейная взаимосвязь
При прочих равных, при увеличении переменной Xпеременная Yне изменится
Вопрос 20
Найдите медиану переменной M1 и наибольшее значение переменной M2. В ответ выпишите произведение найденных чисел, округлённое до сотых.
Пример ответа: -1345.59
Вопрос 21
Определите наиболее часто встречающееся значение переменной time. Скопируйте в ответ это выражение.
Пример ответа: 11:12 AM
Вопрос 22
Добавьте в таблицу новый признак coded, который будет представлять собой кодированные значения переменной M1. Кодировку проведите следующим образом: если значение M1 строго меньше медианы этой переменной – 0, в противном случае – 1. Выведите среднее значение переменной coded.
Пример ответа: 12.14
Вопрос 23
Определите, какой график изображён на рисунке ниже.
Диаграмма рассеяния переменных М2 и М1
Диаграмма рассеяния переменных М3 и М1
Диаграмма рассеяния переменных time и М1
Диаграмма рассеяния переменных time и М2
Вопрос 24
Будем считать, что выбросами считаются наблюдения, которые отличаются от среднего значения переменной на 1.5 стандартных отклонения и более. Определите количество выбросов для переменной M1.
Пример ответа: 10.00
Вопрос 25
Постройте сводную таблицу, по строкам которой расположено время, по столбцам – переменные M1 и M2, а в ячейках – средние по переменным M1 и M2 для каждого времени. Выпишите время, для которого разность по модулю между средними переменных M1 и M2 является наименьшей.
Пример ответа: 12:48 PM
Вопрос 26
Найдите переменную, которая имеет наибольшую по модулю корреляцию с переменной M1 (не включая саму M1). Помните о том, что в набор данных была добавлена переменная coded. В ответ выпишите модуль полученного значения корреляции.
Пример ответа: 0.98