В файле собраны ответы к тестам из курса ВШЭ / Культура работы с данными.
ПОИСК ВОПРОСА ПО ТЕКСТУ (Ctrl + F).
Под каждым вопросом правильный ответ (смотрите демо-файл).
После покупки Вы получите файл, где будет 50 вопросов с ответами. Верный ответ выделен по тексту.
В демо-файлах представлен пример, как выделены ответы.
Все набрано в Word, можно искать с помощью поиска.
Ниже список вопросов, которые представлены в файле.
Также Вы можете посмотреть другие мои готовые работы у меня на странице по ссылке:
Тема 3: Генеральная совокупность и выборка. Частотные таблицы и распределения
Вопрос 1
Какой тип графика из перечисленных наиболее удобен для описания распределения переменной appearances? Выберите один верный ответ.
Выберите один или несколько ответов:
Линейный график
График построить нельзя
Гистограмма
Столбчатая диаграмма
Вопрос 2
Укажите, ли следующее утверждение: переменную name можно изобразить на интерпретируемом графике.
Выберите один ответ:
Вопрос 3
По переменной align была построена частотная таблица. Укажите, какие ошибки были допущены в таблице. Чтобы проверить ее, постройте таблицу сами, используя удобную вам программу. Выберите один верный ответ.
Добрый персонаж Злой персонаж Нейтральный персонаж
4636 6720 2 тыс.
Выберите один или несколько ответов:
указано количество нейтральных персонажей, их должно быть 2208
указано количество злых персонажей, их должно быть 672
указано количество нейтральных персонажей, оно должно быть записано так: 2000
посчитано количество добрых персонажей, их должно быть 6725
Вопрос 4
Определите три наиболее часто встречающих цвета глаз персонажей, выберите из данных только их и заполните частотную таблицу по переменной eye. В вариантах ответов представлены числа, которые могут быть записаны в таблицу. Выберите один верный ответ.
Выберите один или несколько ответов:
1.9 тыс.; 1.8 тыс.; 0.6 тыс.
1962; 1924; 613
1962; 1954; 613
1962; 1924; 600
Вопрос 5
Укажите, ли следующее утверждение: у мужских персонажей чаще всего встречаются темно-карие глаза.
Выберите один ответ:
Вопрос 6
Постройте частотную таблицу для персонажей женского пола по переменной eye. У скольких из них золотые глаза? Введите ответ в виде целого числа.
Вопрос 7
Сколько раз появлялся добрый персонаж с пурпурными глазами? Введите ответ в виде целого числа.
Вопрос 8
Были выбраны самые часто встречающиеся цвета глаз персонажей. Далее, только по этим данным, построена столбчатая диаграмма. Что можно сказать, основываясь только на графике? Выберите один верный ответ.
Выберите один или несколько ответов:
Голубые глаза свойственны добрым персонажам, поэтому встречаются чаще
Добрых персонажей любят больше, чем остальных
Добрых персонажей больше, чем злых
Красные глаза чаще всего встречаются у злых персонажей
Вопрос 9
Укажите, ли следующее утверждение: больше всего персонажей в первый раз появилось в 1993 году.
Выберите один ответ:
Вопрос 10
Сколько процентов (от общего числа персонажей) составляют мужские персонажи, которые появлялись больше 100 раз? В ответ запишите число (процент от 0 до 100), округлите до целого.
Тема 4: Описательные статистики: меры центральной тенденции и разброса
Вопрос 1
Какова мода по переменной eye? Выберите один верный ответ.
Выберите один или несколько ответов:
Голубые глаза
Темно-карие глаза
Моду определить нельзя
Зеленые глаза
Вопрос 2
Укажите, ли следующее утверждение: для переменной eye можно определить медиану.
Выберите один ответ:
Вопрос 3
Вам представлены утверждения о мерах центральной тенденции (среднее арифметическое, мода, медиана) для переменной appearances. Какое из них ? Выберите один верный ответ.
Выберите один или несколько ответов:
Для переменной appearances можно рассчитать медиану, моду и среднее арифметическое.
Для переменной appearances можно определить моду, но нельзя посчитать медиану.
Для переменной appearances можно посчитать только медиану.
Для переменной appearances можно определить моду, но нельзя посчитать среднее значение.
Для переменной appearances нельзя рассчитать меры центральной тенденции.
Вопрос 4
Укажите, ли следующее утверждение: мода по переменной hair для женских персонажей равна моде по переменной hair для мужских персонажей.
Выберите один ответ:
Вопрос 5
Вам представлены утверждения о мерах разброса (размах и межквартильных размах) для переменной hair. Какое из них ? Выберите один верный ответ.
Выберите один или несколько ответов:
Для переменной hair можно определить размах, но нельзя посчитать межквартильный размах.
Для переменной hair можно посчитать обе меры разброса.
Для переменной hair невозможно определить размах, но можно посчитать межквартильный размах.
Для переменной hair невозможно посчитать обе меры разброса.
Вопрос 6
Выберите только злых персонажей и определите медиану по переменной appearances. Введите ответ в виде целого числа.
Вопрос 7
Найдите дисперсию по переменной appearances. Помните, что мы работаем с генеральной совокупностью. В ответ запишите число, округлите до целого.
Вопрос 8
Найдите моду по переменной first_appearance. Введите ответ в виде целого числа.
Вопрос 9
Укажите, ли следующее утверждение: если убрать первые пятьсот наблюдений в наших данных, то мода по переменной eye не изменится.
Выберите один ответ:
Вопрос 10
Определите моду по переменной hair, затем выберите только тех персонажей, цвет волос которых соответствует найденной моде. По имеющемуся подмассиву данных по переменной appearances рассчитайте стандартное отклонение. Помните, что мы работаем с генеральной совокупностью. В ответ запишите число, округлите до целого.
Тема 5: Z-оценка. Выбросы
Вопрос 1
Сколько пропущенных значений в переменной appearances? Выберите один верный ответ.
Выберите один или несколько ответов:
1096
6609
815
15280
Вопрос 2
Укажите, ли следующее утверждение: наибольший межквартильный размах по переменной appearances будет для злых персонажей. Вам понадобятся данные по типу персонажа (переменная align), удалите пропущенные значения по столбцу appearances и посчитайте требуемую меру разброса.
Выберите один ответ:
Вопрос 3
Сколько выбросов встречается по переменной appearances? Работайте с исходными данными, предварительно удалите пропущенные значения по столбцу appearances, используйте для нахождения выбросов межквартильный размах. Выберите один верный ответ.
Выберите один или несколько ответов:
7
18.5
1938
13342
Вопрос 4
Укажите, ли следующее утверждение: наибольшее количество выбросов по переменной appearances наблюдается у добрых персонажей.
Выберите один ответ:
Вопрос 5
Создайте новую переменную, которая будет представлять собой прологарифмированную переменную appearances. Сколько выбросов получится по новой переменной? Работайте с исходными данными, предварительно удалите пропущенные значения по новому столбцу, используйте для нахождения выбросов три среднеквадратичных отклонения от среднего. Введите ответ в виде целого числа
Вопрос 6
Сколько выбросов получится по переменной appearancs? Работайте с исходными данными, предварительно удалите пропущенные значения по столбцу appearances, используйте для нахождения выбросов три среднеквадратичных отклонения от среднего. Введите ответ в виде целого числа.
Вопрос 7
Сколько выбросов получится по переменной appearancs, если выбраны только женские персонажи? Работайте с исходными данными, выберите женских персонажей, удалите пропущенные значения по столбцу appearancs, используйте для нахождения выбросов z-оценку и три среднеквадратичных отклонения от среднего. Введите ответ в виде целого числа.
Вопрос 8
Сравните среднее значение по переменной appearancs в двух датафреймах — без выбросов, определенных по межквартильному размаху, и без выбросов, определенных по среднеквадратичному отклонению от среднего. Будем считать, что границы датафреймов без выбросов содержат значения верхних и нижних границ, определенных по межквартильному размаху или среднеквадратичному отклонению от среднего. В ответ запишите число (наибольшее среднее из двух), округлите до целого.
Вопрос 9
Укажите, ли следующее утверждение: в датафрейме для добрых женских персонажей мода по переменной hair не изменится, если удалить выбросы по переменной appearances. Работайте с исходными данными, предварительно удалите пропущенные значения по столбцу appearances, используйте для нахождения выбросов межквартильный размах
Выберите один ответ:
Модой для указанных данных по переменной hair являются черные волосы. Если убрать выбросы по переменной appearances (получается точно 200 наблюдений), то мода все рано не изменится.
Вопрос 10
Выберите только злых персонажей. Сравните медиану по переменной appearances в двух датафреймах — с выбросами и без выбросов, определенных по межквартильному размаху. В ответ запишите число (наибольшее среднее из двух), округлите до целого.
Тема 6: Корреляция
Вопрос 1
Сгруппируйте датафрейм по переменной tourneyid, затем определите тип взаимосвязи между средними значениями переменных winnerscore и winnernewrating. Выберите один верный ответ.
Выберите один или несколько ответов:
Связь умеренная обратная
Связь заметная обратная
Связь слабая прямая
Помните, что чем ближе коэффициент корреляции по модулю к 1, тем сильнее связь. Границы для определения связи можно определять так: слабая — от 0.1 до 0.3; умеренная — от 0.3 до 0.5; заметная — от 0.5 до 0.7; высокая — от 0.7 до 0.9; весьма высокая (сильная) — от 0.9 до 1.
Связь сильная прямая
Вопрос 2
Укажите, ли следующее утверждение: очки, набранные победителем, напрямую и сильно зависят от очков, набранных проигравшим. Сгруппируйте датафрейм по переменной tourneyid и посмотрите на средние значения интересующих нас переменных.
Выберите один ответ:
Коэффициент корреляции в таком случае равен 0.978, что свидетельствует об очень сильной прямой связи.
Вопрос 3
Между какими переменными можно найти интерпретируемый коэффициент корреляции? Выберите один верный ответ.
Выберите один или несколько ответов:
gameid и tie
winnerid и loserid
winnerpos и loserpos
Место проигравшего зависит от места, которое занял победитель.
loserid и loserpos
Ваш ответ верный.
Вопрос 4
Что можно сказать по графику о взаимосвязи переменных winnerscore и winnernewrating? Выберите один верный ответ.
Выберите один или несколько ответов:
Связь умеренная прямая
Связи практически нет
Связь сильная прямая
Связь сильная обратная
В таком случае была бы видна четкая зависимость между значениями переменных.
Вопрос 5
Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями переменных winnernewrating и losernewrating. Введите ответ в виде десятичной дроби, округлите до двух знаков после запятой (например, 0.23); если связь обратная, не забудьте указать минус перед числом.
Вопрос 6
Выберите только первые раунды турнира, сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между переменными winnerscore и loserscore. Введите ответ в виде десятичной дроби, до двух знаков после запятой (например, 0.29); если связь обратная, не забудьте указать минус перед числом.
Вопрос 7
Укажите, ли следующее утверждение: переменная tie не влияет на характер взаимосвязи между переменными winnernewrating и losernewrating. Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями указанных переменных.
Выберите один ответ:
Если tie = 0, то коэффициент корреляции между указанными переменными равен 0.97; в противном случае (tie = 1) — 0.92. В обоих случаях связь прямая и очень сильная.
Вопрос 8
Выберите самого часто встречающегося победителя (столбец winnername). Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями переменных winnerscore и winneroldrating. Введите ответ в виде десятичной дроби, округлите до двух знаков после запятой; если связь обратная, не забудьте указать минус перед числом.
Вопрос 9
Укажите, ли следующее утверждение: характер взаимосвязи (прямая или обратная) между средними значениями переменных winnerscore и winneroldrating для победителя по имени Lester Schonbrun не отличается для такого же показателя для победителя по имени Stuart Goldman. Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями указанных переменных.
Выберите один ответ:
Первое значение мы посчитали в предыдущем задании, оно равно 0.04. Точно также рассчитываем коэффициент корреляции для нашего второго победителя и получаем -0.49 (связь обратная, умеренная). Делаем вывод, что характер взаимосвязи отличается: в первом случае она прямая, во втором — обратная.
Вопрос 10
Выберите данные только за 4376 турнир (переменная tourneyid). Рассчитайте коэффициент корреляции между переменными winnerscore и loserscore. Введите ответ в виде десятичной дроби, округлите до двух знаков после запятой; если связь обратная, не забудьте указать минус перед числом.
Тема 7: Введение в визуализацию данных
Вопрос 1
Какой график лучше всех подойдет для визуализации тренда суммарного количества всех рассмотренных дел за каждый год? Выберите один верный ответ.
Выберите один или несколько ответов:
Гистограмма
Линейный график
Линейным графиком удобнее представлять данные, которые изменяются с течением времени.
График рассеяния
Столбчатая диаграмма
Вопрос 2
Укажите, ли следующее утверждение: для визуализации суммарного количества дел по каждой категории (переменная Category) подойдет столбчатая диаграмма.
Выберите один ответ:
Столбчатые диаграммы лучше всего подходят для работы именно с категориальными переменными.
Вопрос 3
Выберите только те наблюдения, где все судьи голосовали одинаково. Постройте столбчатую диаграмму для суммарного количества заседаний по каждой категории и определите, каких заседаний и в какой категории дел больше — тех, где судьи голосовали либерально, или тех, где голоса были консервативны. Выберите один верный ответ.
Выберите один или несколько ответов:
В категории Title VII больше заседаний, где судьи голосовали консервативно, в категории Immigration, наоборот, — либерально.
В обеих категориях больше заседаний, где судьи голосовали консервативно.
В категории Title VII всего 500 заседаний с консервативными голосами судей и 59 с либеральными, а в категории Immigration — 328 и 47 соответственно.
В категории Title VII больше заседаний, где судьи голосовали либерально, в категории Immigration, наоборот, — консервативно.
В обеих категориях больше заседаний, где судьи голосовали либерально.
Вопрос 4
Выберите заседания только за 2016 год. Постройте линейный график и определите, в каких месяцах наблюдались пиковые значения по числу заседаний. Будьте внимательны — даты записаны в формате месяц/день/год. Выберите один верный ответ.
Выберите один или несколько ответов:
январь и апрель
В январе было проведено наибольшее число заседаний — 11, в апреле был второй пик — 9.
март и декабрь
январь и март
май и июнь
Вопрос 5
Укажите, ли следующее утверждение: для переменных, обозначающих число заседаний и их категорию, можно построить интерпретируемую диаграмму рассеяния.
Выберите один ответ:
Такой тип графика подходит для визуализации зависимости одной количественной переменной от другой.
Вопрос 6
Используя исходные данные, определите среднее число заседаний за каждый сезон (зима, весна, лето, осень). Постройте столбчатую диаграмму, определите месяц с наибольшим показателем. Будьте внимательны — даты записаны в формате месяц/день/год. Введите ответ в виде слова (например, осень).
Вопрос 7
Выберите только заседания по категории иммиграции. Постройте столбчатую диаграмму по суммарному числу заседаний, на котором присутствовал каждый судья. В ответ запишите имя судьи, который принимал участие в наибольшем количестве заседаний (например, Holmes).
Вопрос 8
Определите, какие дела (переменная Title) рассматривались чаще всего. Постройте столбчатую диаграмму по суммарному числу таких заседаний, на котором присутствовал каждый судья. В ответ запишите имя судьи, который принимал участие в наибольшем количестве заседаний (например, Holmes).
Вопрос 9
Обратите внимание на то, как в каждом деле голосовали судьи. Постройте столбчатую диаграмму и определите, каких решений, принятых большинством (2 и более) голосов, больше. Укажите, ли следующее утверждение: решений, где большинство судей голосовало консервативно, больше.
Выберите один ответ:
Для решения задачи мы можем создать новую переменную, которая будет показывать сумму голосов судей. Если сумма равна 1 или меньше, значит, что большинство голосовало консервативно (0), в противном случае — либерально (1). Далее можно построить столбчатую диаграмму по полученным данным и увидеть, что в большинстве заседаний (840) судьи большинством голосов принимали консервативное решение.
Вопрос 10
Выберите только те заседания, в которых участвовал судья Lucero. Постройте линейный график и определите, в каком году он участвовал в заседаниях меньше всего. Будьте внимательны — даты записаны в формате месяц/день/год. В ответ запишите целое число (например, 2016).
Тема 3: Генеральная совокупность и выборка. Частотные таблицы и распределения
Вопрос 1
Какой тип графика из перечисленных наиболее удобен для описания распределения переменной appearances? Выберите один верный ответ.
Выберите один или несколько ответов:
Линейный график
График построить нельзя
Гистограмма
Столбчатая диаграмма
Вопрос 2
Укажите, ли следующее утверждение: переменную name можно изобразить на интерпретируемом графике.
Выберите один ответ:
Вопрос 3
По переменной align была построена частотная таблица. Укажите, какие ошибки были допущены в таблице. Чтобы проверить ее, постройте таблицу сами, используя удобную вам программу. Выберите один верный ответ.
Добрый персонаж Злой персонаж Нейтральный персонаж
4636 6720 2 тыс.
Выберите один или несколько ответов:
указано количество нейтральных персонажей, их должно быть 2208
указано количество злых персонажей, их должно быть 672
указано количество нейтральных персонажей, оно должно быть записано так: 2000
посчитано количество добрых персонажей, их должно быть 6725
Вопрос 4
Определите три наиболее часто встречающих цвета глаз персонажей, выберите из данных только их и заполните частотную таблицу по переменной eye. В вариантах ответов представлены числа, которые могут быть записаны в таблицу. Выберите один верный ответ.
Выберите один или несколько ответов:
1.9 тыс.; 1.8 тыс.; 0.6 тыс.
1962; 1924; 613
1962; 1954; 613
1962; 1924; 600
Вопрос 5
Укажите, ли следующее утверждение: у мужских персонажей чаще всего встречаются темно-карие глаза.
Выберите один ответ:
Вопрос 6
Постройте частотную таблицу для персонажей женского пола по переменной eye. У скольких из них золотые глаза? Введите ответ в виде целого числа.
Вопрос 7
Сколько раз появлялся добрый персонаж с пурпурными глазами? Введите ответ в виде целого числа.
Вопрос 8
Были выбраны самые часто встречающиеся цвета глаз персонажей. Далее, только по этим данным, построена столбчатая диаграмма. Что можно сказать, основываясь только на графике? Выберите один верный ответ.
Выберите один или несколько ответов:
Голубые глаза свойственны добрым персонажам, поэтому встречаются чаще
Добрых персонажей любят больше, чем остальных
Добрых персонажей больше, чем злых
Красные глаза чаще всего встречаются у злых персонажей
Вопрос 9
Укажите, ли следующее утверждение: больше всего персонажей в первый раз появилось в 1993 году.
Выберите один ответ:
Вопрос 10
Сколько процентов (от общего числа персонажей) составляют мужские персонажи, которые появлялись больше 100 раз? В ответ запишите число (процент от 0 до 100), округлите до целого.
Тема 4: Описательные статистики: меры центральной тенденции и разброса
Вопрос 1
Какова мода по переменной eye? Выберите один верный ответ.
Выберите один или несколько ответов:
Голубые глаза
Темно-карие глаза
Моду определить нельзя
Зеленые глаза
Вопрос 2
Укажите, ли следующее утверждение: для переменной eye можно определить медиану.
Выберите один ответ:
Вопрос 3
Вам представлены утверждения о мерах центральной тенденции (среднее арифметическое, мода, медиана) для переменной appearances. Какое из них ? Выберите один верный ответ.
Выберите один или несколько ответов:
Для переменной appearances можно рассчитать медиану, моду и среднее арифметическое.
Для переменной appearances можно определить моду, но нельзя посчитать медиану.
Для переменной appearances можно посчитать только медиану.
Для переменной appearances можно определить моду, но нельзя посчитать среднее значение.
Для переменной appearances нельзя рассчитать меры центральной тенденции.
Вопрос 4
Укажите, ли следующее утверждение: мода по переменной hair для женских персонажей равна моде по переменной hair для мужских персонажей.
Выберите один ответ:
Вопрос 5
Вам представлены утверждения о мерах разброса (размах и межквартильных размах) для переменной hair. Какое из них ? Выберите один верный ответ.
Выберите один или несколько ответов:
Для переменной hair можно определить размах, но нельзя посчитать межквартильный размах.
Для переменной hair можно посчитать обе меры разброса.
Для переменной hair невозможно определить размах, но можно посчитать межквартильный размах.
Для переменной hair невозможно посчитать обе меры разброса.
Вопрос 6
Выберите только злых персонажей и определите медиану по переменной appearances. Введите ответ в виде целого числа.
Вопрос 7
Найдите дисперсию по переменной appearances. Помните, что мы работаем с генеральной совокупностью. В ответ запишите число, округлите до целого.
Вопрос 8
Найдите моду по переменной first_appearance. Введите ответ в виде целого числа.
Вопрос 9
Укажите, ли следующее утверждение: если убрать первые пятьсот наблюдений в наших данных, то мода по переменной eye не изменится.
Выберите один ответ:
Вопрос 10
Определите моду по переменной hair, затем выберите только тех персонажей, цвет волос которых соответствует найденной моде. По имеющемуся подмассиву данных по переменной appearances рассчитайте стандартное отклонение. Помните, что мы работаем с генеральной совокупностью. В ответ запишите число, округлите до целого.
Тема 5: Z-оценка. Выбросы
Вопрос 1
Сколько пропущенных значений в переменной appearances? Выберите один верный ответ.
Выберите один или несколько ответов:
1096
6609
815
15280
Вопрос 2
Укажите, ли следующее утверждение: наибольший межквартильный размах по переменной appearances будет для злых персонажей. Вам понадобятся данные по типу персонажа (переменная align), удалите пропущенные значения по столбцу appearances и посчитайте требуемую меру разброса.
Выберите один ответ:
Вопрос 3
Сколько выбросов встречается по переменной appearances? Работайте с исходными данными, предварительно удалите пропущенные значения по столбцу appearances, используйте для нахождения выбросов межквартильный размах. Выберите один верный ответ.
Выберите один или несколько ответов:
7
18.5
1938
13342
Вопрос 4
Укажите, ли следующее утверждение: наибольшее количество выбросов по переменной appearances наблюдается у добрых персонажей.
Выберите один ответ:
Вопрос 5
Создайте новую переменную, которая будет представлять собой прологарифмированную переменную appearances. Сколько выбросов получится по новой переменной? Работайте с исходными данными, предварительно удалите пропущенные значения по новому столбцу, используйте для нахождения выбросов три среднеквадратичных отклонения от среднего. Введите ответ в виде целого числа
Вопрос 6
Сколько выбросов получится по переменной appearancs? Работайте с исходными данными, предварительно удалите пропущенные значения по столбцу appearances, используйте для нахождения выбросов три среднеквадратичных отклонения от среднего. Введите ответ в виде целого числа.
Вопрос 7
Сколько выбросов получится по переменной appearancs, если выбраны только женские персонажи? Работайте с исходными данными, выберите женских персонажей, удалите пропущенные значения по столбцу appearancs, используйте для нахождения выбросов z-оценку и три среднеквадратичных отклонения от среднего. Введите ответ в виде целого числа.
Вопрос 8
Сравните среднее значение по переменной appearancs в двух датафреймах — без выбросов, определенных по межквартильному размаху, и без выбросов, определенных по среднеквадратичному отклонению от среднего. Будем считать, что границы датафреймов без выбросов содержат значения верхних и нижних границ, определенных по межквартильному размаху или среднеквадратичному отклонению от среднего. В ответ запишите число (наибольшее среднее из двух), округлите до целого.
Вопрос 9
Укажите, ли следующее утверждение: в датафрейме для добрых женских персонажей мода по переменной hair не изменится, если удалить выбросы по переменной appearances. Работайте с исходными данными, предварительно удалите пропущенные значения по столбцу appearances, используйте для нахождения выбросов межквартильный размах
Выберите один ответ:
Модой для указанных данных по переменной hair являются черные волосы. Если убрать выбросы по переменной appearances (получается точно 200 наблюдений), то мода все рано не изменится.
Вопрос 10
Выберите только злых персонажей. Сравните медиану по переменной appearances в двух датафреймах — с выбросами и без выбросов, определенных по межквартильному размаху. В ответ запишите число (наибольшее среднее из двух), округлите до целого.
Тема 6: Корреляция
Вопрос 1
Сгруппируйте датафрейм по переменной tourneyid, затем определите тип взаимосвязи между средними значениями переменных winnerscore и winnernewrating. Выберите один верный ответ.
Выберите один или несколько ответов:
Связь умеренная обратная
Связь заметная обратная
Связь слабая прямая
Помните, что чем ближе коэффициент корреляции по модулю к 1, тем сильнее связь. Границы для определения связи можно определять так: слабая — от 0.1 до 0.3; умеренная — от 0.3 до 0.5; заметная — от 0.5 до 0.7; высокая — от 0.7 до 0.9; весьма высокая (сильная) — от 0.9 до 1.
Связь сильная прямая
Вопрос 2
Укажите, ли следующее утверждение: очки, набранные победителем, напрямую и сильно зависят от очков, набранных проигравшим. Сгруппируйте датафрейм по переменной tourneyid и посмотрите на средние значения интересующих нас переменных.
Выберите один ответ:
Коэффициент корреляции в таком случае равен 0.978, что свидетельствует об очень сильной прямой связи.
Вопрос 3
Между какими переменными можно найти интерпретируемый коэффициент корреляции? Выберите один верный ответ.
Выберите один или несколько ответов:
gameid и tie
winnerid и loserid
winnerpos и loserpos
Место проигравшего зависит от места, которое занял победитель.
loserid и loserpos
Ваш ответ верный.
Вопрос 4
Что можно сказать по графику о взаимосвязи переменных winnerscore и winnernewrating? Выберите один верный ответ.
Выберите один или несколько ответов:
Связь умеренная прямая
Связи практически нет
Связь сильная прямая
Связь сильная обратная
В таком случае была бы видна четкая зависимость между значениями переменных.
Вопрос 5
Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями переменных winnernewrating и losernewrating. Введите ответ в виде десятичной дроби, округлите до двух знаков после запятой (например, 0.23); если связь обратная, не забудьте указать минус перед числом.
Вопрос 6
Выберите только первые раунды турнира, сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между переменными winnerscore и loserscore. Введите ответ в виде десятичной дроби, до двух знаков после запятой (например, 0.29); если связь обратная, не забудьте указать минус перед числом.
Вопрос 7
Укажите, ли следующее утверждение: переменная tie не влияет на характер взаимосвязи между переменными winnernewrating и losernewrating. Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями указанных переменных.
Выберите один ответ:
Если tie = 0, то коэффициент корреляции между указанными переменными равен 0.97; в противном случае (tie = 1) — 0.92. В обоих случаях связь прямая и очень сильная.
Вопрос 8
Выберите самого часто встречающегося победителя (столбец winnername). Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями переменных winnerscore и winneroldrating. Введите ответ в виде десятичной дроби, округлите до двух знаков после запятой; если связь обратная, не забудьте указать минус перед числом.
Вопрос 9
Укажите, ли следующее утверждение: характер взаимосвязи (прямая или обратная) между средними значениями переменных winnerscore и winneroldrating для победителя по имени Lester Schonbrun не отличается для такого же показателя для победителя по имени Stuart Goldman. Сгруппируйте датафрейм по переменной tourneyid, затем рассчитайте коэффициент корреляции между средними значениями указанных переменных.
Выберите один ответ:
Первое значение мы посчитали в предыдущем задании, оно равно 0.04. Точно также рассчитываем коэффициент корреляции для нашего второго победителя и получаем -0.49 (связь обратная, умеренная). Делаем вывод, что характер взаимосвязи отличается: в первом случае она прямая, во втором — обратная.
Вопрос 10
Выберите данные только за 4376 турнир (переменная tourneyid). Рассчитайте коэффициент корреляции между переменными winnerscore и loserscore. Введите ответ в виде десятичной дроби, округлите до двух знаков после запятой; если связь обратная, не забудьте указать минус перед числом.
Тема 7: Введение в визуализацию данных
Вопрос 1
Какой график лучше всех подойдет для визуализации тренда суммарного количества всех рассмотренных дел за каждый год? Выберите один верный ответ.
Выберите один или несколько ответов:
Гистограмма
Линейный график
Линейным графиком удобнее представлять данные, которые изменяются с течением времени.
График рассеяния
Столбчатая диаграмма
Вопрос 2
Укажите, ли следующее утверждение: для визуализации суммарного количества дел по каждой категории (переменная Category) подойдет столбчатая диаграмма.
Выберите один ответ:
Столбчатые диаграммы лучше всего подходят для работы именно с категориальными переменными.
Вопрос 3
Выберите только те наблюдения, где все судьи голосовали одинаково. Постройте столбчатую диаграмму для суммарного количества заседаний по каждой категории и определите, каких заседаний и в какой категории дел больше — тех, где судьи голосовали либерально, или тех, где голоса были консервативны. Выберите один верный ответ.
Выберите один или несколько ответов:
В категории Title VII больше заседаний, где судьи голосовали консервативно, в категории Immigration, наоборот, — либерально.
В обеих категориях больше заседаний, где судьи голосовали консервативно.
В категории Title VII всего 500 заседаний с консервативными голосами судей и 59 с либеральными, а в категории Immigration — 328 и 47 соответственно.
В категории Title VII больше заседаний, где судьи голосовали либерально, в категории Immigration, наоборот, — консервативно.
В обеих категориях больше заседаний, где судьи голосовали либерально.
Вопрос 4
Выберите заседания только за 2016 год. Постройте линейный график и определите, в каких месяцах наблюдались пиковые значения по числу заседаний. Будьте внимательны — даты записаны в формате месяц/день/год. Выберите один верный ответ.
Выберите один или несколько ответов:
январь и апрель
В январе было проведено наибольшее число заседаний — 11, в апреле был второй пик — 9.
март и декабрь
январь и март
май и июнь
Вопрос 5
Укажите, ли следующее утверждение: для переменных, обозначающих число заседаний и их категорию, можно построить интерпретируемую диаграмму рассеяния.
Выберите один ответ:
Такой тип графика подходит для визуализации зависимости одной количественной переменной от другой.
Вопрос 6
Используя исходные данные, определите среднее число заседаний за каждый сезон (зима, весна, лето, осень). Постройте столбчатую диаграмму, определите месяц с наибольшим показателем. Будьте внимательны — даты записаны в формате месяц/день/год. Введите ответ в виде слова (например, осень).
Вопрос 7
Выберите только заседания по категории иммиграции. Постройте столбчатую диаграмму по суммарному числу заседаний, на котором присутствовал каждый судья. В ответ запишите имя судьи, который принимал участие в наибольшем количестве заседаний (например, Holmes).
Вопрос 8
Определите, какие дела (переменная Title) рассматривались чаще всего. Постройте столбчатую диаграмму по суммарному числу таких заседаний, на котором присутствовал каждый судья. В ответ запишите имя судьи, который принимал участие в наибольшем количестве заседаний (например, Holmes).
Вопрос 9
Обратите внимание на то, как в каждом деле голосовали судьи. Постройте столбчатую диаграмму и определите, каких решений, принятых большинством (2 и более) голосов, больше. Укажите, ли следующее утверждение: решений, где большинство судей голосовало консервативно, больше.
Выберите один ответ:
Для решения задачи мы можем создать новую переменную, которая будет показывать сумму голосов судей. Если сумма равна 1 или меньше, значит, что большинство голосовало консервативно (0), в противном случае — либерально (1). Далее можно построить столбчатую диаграмму по полученным данным и увидеть, что в большинстве заседаний (840) судьи большинством голосов принимали консервативное решение.
Вопрос 10
Выберите только те заседания, в которых участвовал судья Lucero. Постройте линейный график и определите, в каком году он участвовал в заседаниях меньше всего. Будьте внимательны — даты записаны в формате месяц/день/год. В ответ запишите целое число (например, 2016).