[Росдистант]Введение в анализ данных.Практические задания Росдистант ТГУ 2025г.(Вариант 9)

Раздел
Программирование
Просмотров
3
Покупок
0
Антиплагиат
Не указан
Размещена
27 Ноя в 03:50
ВУЗ
Росдистант ТГУ
Курс
Не указан
Стоимость
750 ₽
Демо-файлы   
2
png
Отметка
30 Кбайт
docx
Учебные задания проверяемые вручную
767.4 Кбайт
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
zip
УчЗадания1-6_варИ
438.8 Кбайт 750 ₽
Описание

Сдано в 2025году. Оценка 55,0 / 55,0

Вариант 9 (Трудоспособное население г. Москва в 2021 году) Начальная буква фамилии студента И


Оглавление

Практическое задание 1

Тема 2. Генеральная и выборочная совокупности, их значение в анализе данных

Задание:

1.    Рассчитать объем и состав квотной пропорциональной выборки для генеральной совокупности по варианту (табл. 1, 2).

2.    Результат решения задачи представить в файле под именем «Фамилия_И.О._Задание_4.docx» или «Фамилия_И.О._Задание_4. xlsx».

Таблица 2

Варианты заданий

№ варианта

Генеральная совокупность

Доверительный интервал

Ошибка выборки

1

Трудоспособное население г. Москва в 2021 году

95

4

2

Трудоспособное население Московской области в 2021 году

95

5

3

Трудоспособное население г. Самара в 2021 году

95

3

4

Трудоспособное население Самарской области в 2021 году

95

4

5

Трудоспособное население г. Москва в 2021 году

85

5

6

Трудоспособное население Московской области в 2021 году

85

3

7

Трудоспособное население г. Самара в 2021 году

85

4

8

Трудоспособное население Самарской области в 2021 году

85

5

9

Трудоспособное население г. Москва в 2021 году

97

3

10

Трудоспособное население Московской области в 2021 году

97

4

 

Рекомендации по выполнению задания

1. Предварительно следует ознакомиться с текстом учебника по данной теме, а также изучить рекомендуемую литературу.

2. Используйте статистические данные, имеющиеся на сайте Федеральной службы государственной статистики (https://rosstat.gov.ru).

3. Рассчитайте необходимый размер выборочной совокупности, исходя из размера генеральной совокупности и заявленных показателей доверительного интервала и ошибки выборки.

4. Разделите генеральную совокупность на квоты в соответствии с полом (мужской, женский) и возрастом (18–25 лет, 26–35 лет, 36–45 лет, 46–55 лет, 56–79 лет). Вычислите доли (процент) каждой квоты.

5. В соответствии с определенными долями каждой половозрастной квоты вычислите конкретное количество людей по каждой квоте, которых необходимо опросить.


 

Практическое задание 2

Тема 5. Описательная статистика и показатели изменчивости вариации

Задание:

1.    Используя предложенный массив данных в файле «Массив данных для задания 3», рассчитать следующие статистические показатели:

a)    размах вариации;

b)   межквартильный диапазон;

c)    стандартное отклонение;

d)   дисперсию;

e)    коэффициент вариации;

f)     коэффициент осцилляции;

g)   моду;

h)   медиану;

i)      среднее арифметическое.

2.                Показать процесс расчета каждого статистического показателя.

3.                Дать интерпретацию каждого получившегося значения статистического показателя.

4.                Результат решения задачи представить в файле под именем «Фамилия_И.О._Задание_4.docx» или «Фамилия_И.О._Задание_4. xlsx».

Рекомендации по выполнению задания

1. Используйте только те статистические данные, которые предоставлены в отдельном файле задания.

2. Постройте статистическую таблицу, учитывая все требования, указанные в тексте учебника и рекомендуемой литературе.

3. Заполните ячейки таблицы.

4. Произведите необходимые вычисления.

5. Результаты вычислений занесите в таблицу.

6. Сделайте интерпретацию полученных показателей и их значений.


Образец выполнения задания 2

№ п/п

Показатель

Значение показателя

Интерпретация показателя

Переменная 1 «Возраст респондентов»

1.1

Минимальное

16

Минимальный возраст респондентов – 16 лет

1.2

Максимальное

47

Максимальный возраст респондентов – 47 лет

1.3

Размах вариации

31

Разница между самым младшим и старшим респондентом составляет 31 год

1.4

Мода

18

Самый часто встречающийся ответ – 18 лет

1.5

Медиана

20

Половина респондентов, принявших участие в исследовании, младше 20 лет, другая половина – старше 20 лет

1.6

Среднее арифметическое

21

Средний возраст респондентов – 21 год

1.7

Дисперсия

29

Разброс данных вокруг средней арифметической составляет 29 лет

1.8

Стандартное отклонение

5,38

Отклонение от среднего значения составляет 5 лет. Примерно 68 % ответов дали респонденты с 16 до 26 лет

1.9

Коэффициент вариации

25,28

Совокупность является однородной

Переменная 2 «Удовлетворенность благоустройством городской среды»

2.1

Минимальное

0

Минимальное значение 0

2.2

Максимальное

5

Максимальное значение 5

2.3

Размах вариации

5

Разница между минимальным и максимальным значениями составляет 31 год

2.4

Мода

1

Самый часто встречающийся ответ – 1

2.5

Медиана

3

Половина ответов – до значения 3, другая половина – после значения 3

2.6

Среднее арифметическое

3

Среднее значение – 3

2.7

Стандартное отклонение

2

Разброс данных вокруг средней арифметической составляет 2

2.8

Дисперсия

3

Отклонение от среднего значения составляет 3. Примерно 68 % ответов – от значения 1 до значения 5

2.9

Коэффициент вариации

64,72

Совокупность неоднородна

 


 

Практическое задание 3

Тема 6. Понятие и процедура корреляционного анализа. Коэффициенты корреляции и результаты корреляционного анализа

Задание:

1.                В предложенном файле с массивом эмпирических данных рассчитать коэффициенты корреляции.

2.                Интерпретировать получившиеся результаты.

3.                Результат решения задачи представить в файле под именем «Фамилия_И.О._Задание_4.docx» или «Фамилия_И.О._Задание_4. xlsx».

 

Рекомендации по выполнению задания

1. Предварительно следует ознакомиться с текстом учебника по данной теме, а также изучить рекомендуемую литературу.

2. В ячейке, в которой необходимо указать коэффициент корреляции, ставим знак «=». Затем нажимаем треугольник рядом с пунктом меню «Формулы»


3. В открывшемся окне выбираем категорию «Статистические» и функцию «КОРРЕЛ»


4. Выбираем массивы данных для расчета коэффициента корреляции.

Массив 1 – это данные исследуемой переменной (зависимой). В примере – вариант ответа «Онлайн-оплата счетов».

Массив 2 – это независимая переменная. В примере – пол респондента.


5. Вычисляем коэффициент корреляции (кнопка ОК или Enter на клавиатуре).


6. Повторяем пункты 1–3 для всех зависимых переменных.


7. Интерпретируем полученный результат.


Практическое задание 4


Тема 8. Особенности и преимущества факторного анализа


Задание:


1.                Решить задачу. Провести факторный анализ прибыли предприятия от реализации одного вида продукции.

Исходные данные


Показатели


План


Факт


Объем реализации продукции, шт.

20 000

16 000

Цена реализации, ден. ед.

170

200

Себестоимость продукции, ден. ед.

140

150


 

2.                Результат решения задачи представить в файле под именем «Фамилия_И.О._Задание_4.docx» или «Фамилия_И.О._Задание_4. xlsx».

 

Рекомендации по выполнению задания

1. Предварительно следует ознакомиться с текстом учебника по данной теме, а также изучить рекомендуемую литературу.

2. Для расчета прибыли необходимо понимать, что это разница между выручкой и себестоимостью, что можно представить как произведение объема производства на разницу между ценой и себестоимостью одной единицы товара. Рассчитываем прибыль как по плану, так и по факту.

3. Вычислить разницу между фактической и плановой прибылью.

4. Провести анализ факторов, приведших к разнице между фактической и плановой прибылью. Обратите внимание, что в данном случае указано три фактора: объем реализации продукции, цена реализации и себестоимость продукции.

5. Оценить значимость каждого фактора.


 

Практическое задание 5

Тема 9. Понятие, сфера применения и алгоритм проведения кластерного анализа

Задание:

1.                Постройте дендрограмму, иллюстрирующую результаты иерархического кластерного анализа. Тема кластерного анализа, а также данные для кластерного анализа подбираются студентом самостоятельно. Дендрограмма должна содержать не менее пяти уровней иерархии.

2.                Результат решения задачи представить в файле под именем «Фамилия_И.О._Задание_4.docx» или «Фамилия_И.О._Задание_4. xlsx».

 

Рекомендации по выполнению задания

1. Предварительно следует ознакомиться с текстом учебника по данной теме, а также изучить рекомендуемую литературу.

2. Подберите тему для проведения иерархического кластерного анализа. Лучше всего, если данная тема будет коррелировать с вашей профессиональной деятельностью или направлением подготовки в вузе.

3. Последовательно выделяйте группы из кластеров верхнего уровня, формируя кластеры более низкого уровня.

4. Опишите и интерпретируйте полученный результат: сколько уровней в итоге получилось, какой основной кластер, сколько групп и т. д.


 

Практическое задание 6

Тема 10. Методы проверки гипотез о взаимосвязи переменных

Задание:

1.    Создать документ и сохранить его под именем Фамилия_И.О._Задание_6.xlsx.

2.    Используя данные в приведенных ниже таблицах, постройте различные виды диаграмм:

·       круговую;

·       точечную;

·       столбчатую;

·       ленточную.

 

Что нового появилось в вашей жизни в период пандемии? / Пол

№ п/п

Варианты ответов

Укажите ваш пол

Всего

муж.

жен.

1

Онлайн-оплата счетов

28

32

60

2

Заказ продуктов на дом

28

28

56

3

Доставка еды из ресторанов или кафе

34

34

68

4

Онлайн-покупка бытовых товаров, одежды, лекарств и т. д.

16

58

74

5

Опыт дистанционной работы/учебы

70

148

218

6

Домашние тренировки

36

78

114

7

Видеоконференции с родственниками, друзьями, коллегами

34

74

108

8

Появилось новое хобби

22

44

66

9

Ничего

1

3

4

10

Психологические трудности

0

2

2

11

Сложности на работе

1

1

2

Всего

124

 

208

 

332

 

 

3.    Убедитесь, что диаграммы содержат все необходимые элементы графического представления данных: заголовок, подписи данных, названия осей и т. д.

4.    Используя данные в приведенных ниже таблицах, постройте «ящик с усами» для указанной переменной.

Что нового появилось в вашей жизни в период пандемии?

№ п/п

Варианты ответов

Ответы

Процент наблюдений

N

%

1

Онлайн-оплата счетов

60

7,8 %

18,1 %

2

Заказ продуктов на дом

56

7,3 %

16,9 %

3

Доставка еды из ресторанов или кафе

68

8,8 %

20,5 %

4

Онлайн-покупка бытовых товаров, одежды, лекарств и т. д.

74

9,6 %

22,3 %

5

Опыт дистанционной работы/учебы

218

28,2 %

65,7 %

6

Домашние тренировки

114

14,8 %

34,3 %

7

Видеоконференции с родственниками, друзьями, коллегами

108

14,0 %

32,5 %

8

Появилось новое хобби

66

8,5 %

19,9 %

9

Ничего

4

0,5 %

1,2 %

10

Психологические трудности

2

0,3 %

0,6 %

11

Сложности на работе

2

0,3 %

0,6 %

Всего

772

100,0 %

232,5 %

 


Рекомендации по выполнению задания

1. Используйте только те статистические данные, которые предоставлены в задании.

2. Убедитесь, что в построенных диаграммах присутствует либо легенда, либо подписи данных.

3. При построении диаграмм учитывайте все требования к ним, указанные в тексте учебника и рекомендуемой литературе.

4. Правильно оформите подписи к каждой диаграмме.


Образец выполнения задания 6


Рис. 1. Распределение ответов респондентов на вопрос об удовлетворенности благоустройством города (круговая диаграмма)

 


Рис. 2. Гендерное распределение ответов респондентов на вопрос об удовлетворенности благоустройством города (точечная диаграмма)

 


Рис. 3. Гендерное распределение ответов респондентов на вопрос об удовлетворенности благоустройством города (столбчатая диаграмма)

 


Рис. 4. Распределение по возрастным группам ответов респондентов на вопрос об удовлетворенности благоустройством города (ленточная диаграмма)

 


Рис. 5. Распределение ответов респондентов на вопрос об удовлетворенности благоустройством города («ящик с усами»)

Вам подходит эта работа?
Похожие работы
Темы журнала
Показать ещё
Прямой эфир