Тольяттинский государственный университет (Росдистант), ТГУ. Введение в анализ данных (9566, 12243). Итоговый тест. Ответы на вопросы.
Для Росдистант имеются и другие готовые работы. Пишем уникальные работы под заказ. Помогаем с прохождением онлайн-тестов. Пишите, пожалуйста, в личку (Евгений).
ИТОГОВЫЙ ТЕСТ (в базе более 70 вопросов)
Какое значение имеет коэффициент идеальной положительной корреляции?
Выберите один ответ:
0
100 %
1
–1
При нанесении на график большинство значений …, и график сужается по мере удаления от центра.
Выберите один ответ:
группируются вокруг центральной области
группируются вдалеке от центральной области
группируются вне зависимости от центральной области
не приближаются к центральной области
Какие четыре основных типа вероятностной выборки применяются в эмпирических исследованиях при сборе данных?
Выберите один или несколько ответов:
Простая случайная
Стратифицированная
Кластерная
Систематическая
Невероятностная
Укажите типичную модель кластеров, выстраиваемую на основе уровней иерархии.
Выберите один ответ:
Модель распределения
Центроидная модель
Иерархическая кластеризация
Модель подключения
... излагает прогнозы о результатах проведенного исследования.
Выберите один ответ:
Задача
Вопрос
Гипотеза
Цель
Эмпирическое правило 68-95-99,7 показывает, что … значений находятся в пределах двух стандартных отклонений от среднего значения.
Выберите один ответ:
около 95 %
около 68 %
50 %
около 99,7 %
Какой показатель определяется путем вычитания значения Q1 из значения Q3?
Выберите один ответ:
Стандартное отклонение
Межквартильный диапазон
Межквартильная дисперсия
Доверительный интервал
Как называется значение, которое находится точно в середине набора данных при его упорядочении?
Выберите один ответ:
Медиана
Среднее
Дисперсия
Мода
Какая диаграмма используется для сравнения нескольких квантованных диаграмм (графический метод представляет, какие переменные в данных имеют более высокие значения, а какие – более низкие), а также для сравнения классификации и рядов наряду с пропорциональным представлением?
Выберите один ответ:
Диаграмма площади
Линейная диаграмма
Радиолокационная диаграмма
Гистограмма
При каком виде распределения данных работает эмпирическое правило 68-95-99,7?
Выберите один ответ:
При нормальном распределении
При биноминальном распределении
При биполярном распределении
При ненормальном распределении
Какой процесс включает в себя обнаружение и устранение потенциальных несоответствий или ошибок данных для улучшения качества данных?
Выберите один ответ:
Очистка данных
Актуализация данных
Проверка данных
Обоснование данных
Гипотеза должна быть …, то есть необходимо, чтобы ее можно было поддержать или опровергнуть с помощью научных методов исследования.
Выберите один ответ:
простой
адекватной
проверяемой
сложной
Эмпирическое правило 68-95-99,7 показывает, что около 99,7 % значений находятся в пределах … от среднего значения.
Выберите один ответ:
двух стандартных отклонений
четырех стандартных отклонений
одного стандартного отклонения
трех стандартных отклонений
В каком распределении среднее, медиана и мода абсолютно одинаковы?
Выберите один ответ:
В комплексном нормальном распределении
В стандартном биноминальном распределении
В комплексном биноминальном распределении
В стандартном нормальном распределении
Поскольку медиана использует только одно или два значения из середины набора данных, на нее … экстремальные выбросы или несимметричные распределения баллов.
Выберите один ответ:
переходят
не влияют
воздействуют
влияют
Каким должен быть коэффициент корреляции при обнаружении очень сильной отрицательной корреляции?
Выберите один ответ:
От –0,7 до –1
От 0,3 до 0,5
От 0 до 1
От –0,3 до 0,5
Какая величина стандартного отклонения приводит к узкой кривой?
Выберите один ответ:
Максимальная
Выпадающая
Небольшая
Средняя
Коэффициент корреляции Пирсона обычно используется для оценки линейной зависимости между двумя ... переменными.
Выберите один ответ:
графическими
качественными
номинальными
количественными
На каком этапе работы с гипотезой проводится вычисление того, насколько вероятно, что паттерн или связь между переменными могли возникнуть случайно?
Выберите один ответ:
Формулировка гипотезы
Проверка гипотез
Проведение предварительного исследования
Постановка вопроса
Фактический список лиц, из которых будет составлена выборка, – это
Выберите один ответ:
критерий отбора респондентов
основание массива данных
основа выборки
основа генеральной совокупности
При сравнении средних значений скольких групп может использоваться T-тест?
Выберите один ответ:
Четырех
Трех
Двух
Одной
Выберите один из действенных способов минимизации ошибки выборки.
Выберите один ответ:
Введение дополнительных критериев отбора выборки (единиц наблюдения)
Найм дополнительных интервьюеров
Увеличение объема выборки (количества единиц наблюдения)
Снижение величины выборки (количества единиц наблюдения)
Какова формула расчета коэффициента детерминации?
Выберите один ответ:
r ґ 3
Цr
r2
∑r
К какому виду кривой приводит большое стандартное отклонение?
Выберите один ответ:
К сокращенной
К узкой
К сжатой
К широкой
Как называется выборка, построенная и организованная таким образом, чтобы обеспечить возможность каждого элемента генеральной совокупности попасть в выборочную?
Выберите один ответ:
Неслучайная выборка
Случайная выборка
Рассредоточенная выборка
Организованная выборка
Что именно должна включать в себя основа простой случайной выборки?
Выберите один ответ:
Критерий отбора единиц наблюдения
Шаг отбора единиц наблюдения
Массив эмпирических данных
Всех представителей генеральной совокупности
В чем заключается требование множественной линейной регрессии к данным, называемое линейностью?
Выберите один ответ:
Данные следуют нормальному распределению
Наблюдения в наборе данных должны быть собраны с использованием статистически достоверных методов, и между переменными нет скрытых связей
Линия, проведенная через точки данных, является прямой линией, а не кривой или каким-либо фактором группировки
Размер погрешности в прогнозе существенно не изменяется по значениям независимой переменной
Каким должен быть коэффициент корреляции при обнаружении умеренной положительной корреляции?
Выберите один ответ:
От 0,3 до 0,5
От –0,3 до 0,5
От 0 до 1
От –0,7 до –1
Как называется требование множественной линейной регрессии к данным, заключающееся в том, что размер погрешности в прогнозе существенно не изменяется по значениям независимой переменной?
Выберите один ответ:
Линейность
Независимость наблюдений
Однородность дисперсии
Нормальность
Какой вид факторного анализа следует использовать, когда необходимо разработать гипотезу о взаимосвязи между переменными?
Выберите один ответ:
Оценивающий факторный анализ
Подтверждающий факторный анализ
Статистический факторный анализ
Исследовательский факторный анализ
Существует два метода верхнего уровня для поиска иерархических кластеров:
Выберите один или несколько ответов:
иерархическая кластеризация
агломеративная кластеризация
разделяющая кластеризация
рандомизированная кластеризация
В ассиметричных распределениях одна сторона имеет более растянутый и длинный хвост с … количеством очков на одном конце, чем на другом.
Выберите один ответ:
большим
средним
меньшим
максимальным
Что предполагает невероятностная выборка?
Выберите один ответ:
Стратифицированный отбор для обеспечения репрезентативности
Неслучайный отбор на основе удобства или других критериев, что позволяет легко собирать данные
Квотный отбор на основе ключевых критериев, что позволяет легко анализировать данные
Случайный отбор на основе удобства или других критериев, что позволяет легко структурировать данные
Для каких данных мода может не быть полезной мерой центральной тенденции?
Выберите один ответ:
Номинальных
Количественных
Качественных
Порядковых
Эмпирическое правило 68-95-99,7 показывает, что … значений находятся в пределах одного стандартного отклонения от среднего значения.
Выберите один ответ:
50 %
около 68 %
около 95 %
около 99,7 %
При представлении результатов t-теста три наиболее важные значения необходимо включить в отчет. Это t-значение, p-значение и
Выберите один ответ:
дисперсия
степени свободы
среднеквадратическое распределение
коэффициент осцилляции
Что такое линейная регрессия?
Выберите один ответ:
Регрессионная модель, которая использует корень из дисперсии для описания отношений между переменными
Регрессионная модель, которая использует прямую линию для описания отношений между переменными
Регрессионная модель, которая использует квадрат дисперсии для описания отношений между переменными
Регрессионная модель, которая использует графический метод для описания отношений между переменными
Что показывает изменчивость?
Выберите один ответ:
Где находится большинство точек
Изменчивость зависит от выбросов и не дает никакой информации о распределении значений
Какая половина данных содержит половину значений
Насколько данные далеки друг от друга
Какие данные позволяет измерить порядковый уровень измерения?
Выберите один ответ:
Город рождения, религия, этнос, марка автомобилей, семейное положение
Высота, возраст, вес, температура (по Кельвину)
Топ-5 олимпийских медалистов, знание языка (например, начальный, средний, свободный), вопросы типа вопросов шкалы Лайкерта (очень недовольные или очень довольные)
Результаты тестов (например, IQ или экзамены), температура (по Цельсию)
Укажите тип корреляции в случае, когда одна переменная изменяется, а другая переменная изменяется в противоположном направлении.
Выберите один ответ:
Нулевая корреляция
Идеальная отрицательная корреляция
Идеальная положительная корреляция
Абсолютная корреляция
Укажите типичную модель кластеров, где DBSCAN и OPTICS определяют кластеры как связанные плотные области в пространстве данных.
Выберите один ответ:
Модель подключения
Модель подпространств
Графовая модель
Модель плотности
Укажите наиболее информативный показатель центральной тенденции для искаженных распределений или распределений с выбросами.
Выберите один ответ:
Квартиль
Мода
Медиана
Среднее
Меры изменчивости представлены
Выберите один или несколько ответов:
диапазоном (размахом)
модой
стандартным отклонением
дисперсией
Что предполагает строгое секционирование кластеров?
Выберите один ответ:
Каждый объект принадлежит нескольким кластерам
Объекты больше связаны с соседними объектами, чем с объектами, находящимися дальше
Каждый объект принадлежит только одному кластеру
Объекты, принадлежащие дочернему кластеру, также принадлежат родительскому кластеру
Какую форму принимают данные в нормальном распределении при нанесении их на график?
Выберите один ответ:
Трапеции
Овала
Параллелепипеда
Колокола
Какой процесс автоматически разбивает набор данных на группы на основе их сходства?
Выберите один ответ:
Группировка
Кластеризация
Факторинг
Корреляция
Как называются переменные, которыми манипулируют, чтобы повлиять на результат эксперимента.
Выберите один ответ:
Управляющие переменные
Зависимые переменные
Независимые переменные
Ключевые переменные
Корреляционные исследования используют количественные методы для изучения … между переменными.
Выберите один ответ:
дисперсии
причинно-следственных отношений
отношений и связей
среднеквадратического интервала
В каких распределениях одна сторона имеет более растянутый и длинный хвост с меньшим количеством очков на одном конце, чем на другом?
Выберите один ответ:
В нормальных
В симметричных
В биполярных
В ассиметричных
Для обнаружения выбросов можно использовать несколько методов. Укажите три из них.
Выберите один или несколько ответов:
Сортировка значений от низких до высоких и проверка минимальных и максимальных значений
Использование статистических процедур для определения экстремальных значений
Визуализация данных в квадратном графике (ящик с усами) и поиск выбросов
Вычисление коэффициентов корреляции для определение ее силы и направленности
Как записывается нулевая гипотеза?
Выберите один ответ:
H1
Нет особой записи для нулевой гипотезы
Ha
H0
Что предполагает строгое секционирование кластеров с выбросами?
Выберите один ответ:
Каждый объект либо принадлежит кластеру, либо нет
Объекты больше связаны с соседними объектами, чем с объектами, находящимися дальше
Объекты, которые не могут принадлежать ни к одному кластеру, считаются выбросами
Объекты, принадлежащие дочернему кластеру, также принадлежат родительскому кластеру
Какой показатель указывает на величину корреляции: чем он больше, тем сильнее корреляция?
Выберите один ответ:
Знак коэффициента корреляции
Формула коэффициента корреляции
Абсолютное значение коэффициента корреляции
Относительное значение коэффициента корреляции
Какой коэффициент детерминации означает, что лишь небольшая часть изменчивости одной переменной объясняется ее отношением к другой переменной, отношения с другими переменными с бо́льшей вероятностью объясняют дисперсию переменной?
Выберите один ответ:
Высокий
Оптимальный
Нормальный
Низкий
Как называется тип кластеризации, при котором объекты могут принадлежать более чем одному кластеру; обычно с участием жестких кластеров?
Выберите один ответ:
Сложная кластеризация
Кластеризация с несколькими представлениями
Простая кластеризация
Слабая кластеризация
Как называется группа с небольшими расстояниями между членами кластера, плотными областями пространства данных, интервалами или определенными распределениями?
Выберите один ответ:
Фокус-группа
Фактор
Общность
Кластер
Как записывается альтернативная гипотеза?
Выберите один ответ:
H1
H0
H
Нет особой записи для альтернативной гипотезы
Какая выборка в точности повторяет пропорции дифференциации генеральной совокупности?
Выберите один ответ:
Репрезентативная выборка
Неслучайная выборка
Случайная выборка
Качественная выборка
Как называется значение, ниже которого лежит 25 % распределения выборочной совокупности?
Выберите один ответ:
Квартиль Q3
Квартиль Q1
Квартиль Q4
Квартиль Q2
Чтобы было просто собрать эмпирические данные по генеральной совокупности, необходимо, чтобы она обладала тремя характеристиками: доступная, компактная и
Выберите один ответ:
рассредоточенная
массивная
небольшая
закрытая
Как можно определить факторный анализ?
Выберите один ответ:
Метод, который используется для оценки переменных в имеющемся наборе эмпирических данных
Метод, который используется для преобразования переменных
Метод, который используется для уменьшения большого количества переменных в меньшее количество факторов
Метод, который используется для увеличения количества переменных в бо́льшее количество факторов
Истинные выбросы всегда должны быть
Выберите один ответ:
удалены
продублированы
сохранены
отмечены
Что предполагает вероятностная выборка?
Выберите один ответ:
Ключевой представитель генеральной совокупности имеет шанс быть выбранным
Каждый представитель генеральной совокупности имеет шанс быть выбранным
Выборка формируется на основе вероятных квот генеральной совокупности
Все представители генеральной совокупности попадают в выборку
Как называется тип кластеризации, при которой объекты, принадлежащие дочернему кластеру, также принадлежат родительскому кластеру?
Выберите один ответ:
Сложная кластеризация
Иерархическая кластеризация
Альтернативная кластеризация
Нечеткая кластеризация
Иерархическая кластеризация опирается на поиск иерархии кластеров, которая напоминает древовидную структуру, называемую
Выберите один ответ:
графом
гистограммой
деревом принятия решений
дендрограммой
Как называется способ использования прогностического анализа, который генерируется прогностической моделью, включающей в себя все данные, относящиеся к кредитоспособности человека?
Выберите один ответ:
Обнаружение мошенничества
Совершенствование операций
Снижение риска
Оптимизация маркетинговых кампаний
Какой вид анализа данных помогает определить, существует ли какая-либо связь между набором переменных и ведет ли эта связь к процедурам кластеризации и классификации?
Выберите один ответ:
Анализ временных рядов
Дискриминантный анализ
Описательный анализ
Дисперсионный анализ
Факторный анализ
Какой вид анализа помогает найти уравнение для линии наилучшего соответствия, которое можно использовать для прогнозирования значения одной переменной с учетом значения для другой переменной?
Выберите один ответ:
Регрессионный анализ
Графический анализ
Статистический анализ
Корреляционный анализ
Различные типы коэффициентов корреляционного анализа подходят для различных данных в зависимости от … и распределения.
Выберите один ответ:
уровней измерения
количества респондетов
репрезентативности выборки
валидности выборки
Нулевая гипотеза – это позиция по умолчанию, согласно которой
Выберите один ответ:
между переменными устойчивая отрицательная связь
между переменными устойчивая положительная связь
между переменными обнаружена связь
между переменными нет никакой связи
Если в середине набора данных есть два числа, их … равно медиане.
Выберите один ответ:
экстремальное значение
максимальное значение
среднее значение
минимальное значение
При каком процессе происходит просмотр данных, анализ, обнаружение, изменение или удаление так называемых «грязных» данных, или «шума»?
Выберите один ответ:
В процессе очистки данных
В процессе обоснования данных
В процессе актуализации данных
В процессе проверки данных
Наиболее общими способами использования прогностического анализа являются те, которые помогают компаниям привлекать, удерживать и развивать своих наиболее прибыльных клиентов, а также помогают в определении предпочтений клиентов или выбора покупок, продвигая возможности перекрестных продаж. Как называется этот способ?
Выберите один ответ:
Оптимизация маркетинговых кампаний
Совершенствование операций
Обнаружение мошенничества
Снижение риска
Что такое среднее арифметическое набора данных?
Выберите один ответ:
Значение, которое находится точно в середине набора данных при его упорядочении
Значение, которое находится посредством деления на сумму общего числа значений
Значение, которое находится точно посередине, когда все данные массива упорядочены по алфавиту
Значение, которое находится посредством деления на общее число значений суммы всех значений
Чем в кластерном анализе характеризуются модели подписанных графов?
Выберите один ответ:
Подмножество узлов в графе, такое, что каждые два узла в подмножестве соединены ребром, можно рассматривать как прототипную форму кластера
Кластеры моделируются как с членами кластера, так и с соответствующими атрибутами
Каждый путь в знаковом графе имеет знак от произведения знаков по краям; более слабая «аксиома кластерности» дает результаты с более чем двумя кластерами или подграфами только с положительными ребрами
Алгоритм k-средних представляет каждый кластер одним средним вектором
На каком этапе необходимо убедиться, что сформулированная гипотеза специфична и проверяема?
Выберите один ответ:
Уточнение гипотезы
Формулировка гипотезы
Проведение предварительного исследования
Постановка вопроса
Укажите три возможных ограничения ввода эмпирических данных в массив.
Выберите один или несколько ответов:
Идеологические ограничения
Ограничения диапазона
Ограничения типа данных
Обязательные ограничения
Как называется способ использования прогностического анализа, который предусматривает нахождение шаблонов и предотвращение преступного поведения?
Выберите один ответ:
Оптимизация маркетинговых кампаний
Снижение риска
Обнаружение мошенничества
Совершенствование операций
Какой вид факторного анализа следует использовать для проверки степени, в которой опрос фактически измеряет то, для измерения чего он предназначен?
Выберите один ответ:
Статистический факторный анализ
Оценивающий факторный анализ
Подтверждающий факторный анализ
Исследовательский факторный анализ
... показывает, что можно с большой долей уверенности относить сделанные на выборочной совокупности выводы ко всей генеральной совокупности или подобным совокупностям.
Выберите один ответ:
Низкая внешняя валидность
Высокая внешняя дисперсия
Высокая внешняя валидность
Низкая внешняя дисперсия
Как называется коэффициент корреляции для переменной и фактора?
Выберите один ответ:
Факторные величины
Факторные коэффициенты
Факторные требования
Факторная нагрузка
Что именно показывает эмпирическое правило 68-95-99,7?
Выберите один ответ:
Где в случае ненормального распределения лежит большинство значений
Где в случае биноминального распределения лежит большинство значений
Где в случае правильного распределения лежит большинство значений
Где в случае нормального распределения лежит большинство значений
Стандартную ошибку можно уменьшить, увеличив размер
Выберите один ответ:
выборки
генеральной совокупности
шага отбора единиц наблюдения
доверительного интервала
Что показывает стандартная погрешность среднего?
Выберите один ответ:
Насколько отличается среднее значение генеральной совокупности от обычного значения выборки
Насколько отличается минимальное значение генеральной совокупности от среднего значения выборки
Насколько отличается среднее значение генеральной совокупности от среднего значения выборки
Насколько отличается максимальное значение генеральной совокупности от среднего значения выборки
Гипотеза предполагает связь между двумя или более переменными. Как называются эти переменные?
Выберите один или несколько ответов:
Ключевая переменная
Независимая переменная
Зависимая переменная
Основная переменная
Какой коэффициент используется в регрессионных моделях для измерения того, какая часть дисперсии одной переменной объясняется дисперсией другой переменной?
Выберите один ответ:
Коэффициент репрезентации
Коэффициент модуляции
Коэффициент детерминации
Коэффициент регрессии