Проблемные задачи (начальный уровень)

Раздел
Программирование
Предмет
Просмотров
181
Покупок
0
Антиплагиат
Не указан
Размещена
25 Мар в 16:15
ВУЗ
Не указан
Курс
Не указан
Стоимость
300 ₽
Демо-файлы   
1
jpg
DEMO
136.5 Кбайт
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
zip
Проблемные задачи Insurance
541.3 Кбайт 300 ₽
Описание

Задание

  1. Загрузите набор данных. Выведите голову таблицы (метод head), информацию о наборе данных (метод info). Подготовьте описание набора данных в указанном виде (см. рисунок ниже). Для перевода англоязычных названий можно использовать онлайн-переводчики. При наличии нескольких вариантов перевода выбирать подходящий исходя из здравого смысла.
  2. Подготовьте набор данных для последующего анализа. Для этого выполните следующие действия: Поскольку большинство наборов данных хранятся в упорядоченном виде, перед началом анализа перемешайте наборы. Выясните, имеются ли пропуски данных в каких-либо столбцах. При наличии удалите эти столбцы или заполните пропущенные значения. Проанализируйте распределение числовых переменных, а также порядковых категориальных признаков. Используйте графики и статистические функции. Выясните, есть ли выбросы и аномальные значения. При необходимости удалите их. Постройте матрицу корреляции. Напишите выводы по каждому этапу подготовки данных.
  3. Выберите столбцы Х и у для решения задачи линейной регрессии (поиска зависимости у от Х). Обоснуйте свой выбор. Разбейте выборку на обучающую и тестовую, размер тестовой выборки должен составлять 20-30% от всех данных. Обучите модель линейной регрессии на обучающей выборке и выполните предсказание y в зависимости от Х на тестовой выборке.
  4. Проверьте точность работы модели. Для этого выберите подходящие метрики сравнения реальных и предсказанных значений и вычислите значения этих метрик. Постройте график, на котором отображаются реальные значения и линия регрессии (см. рисунок ниже). Сделайте вывод.
  5. Оформите решение, добавив текстовые пояснения перед каждой ячейкой и выводы в конце каждого этапа работы.

В работе используется датасет insurance со следующими признаками:

Количество записей: 1338

Количество параметров (столбцов): 7

Описание параметров (столбцов):

1. age: int64: возраст

2. sex: object: пол

3. bmi: float64: индекс массы тела

4. children: int64: количество детей

5. smoker: object: курение (да/нет)

6. region: object: регион

7. charges: float64: медицинские расходы оплачиваемые страховкой

В архиве находится ipynb файл с кодом и результатами работы (подходит как для Google Colab, так и для Jupyter Notebook), а также результаты в виде PDF файла этого блокнота и используемый набор данных

Если Вам нужные любые подобные работы, то можете просто написать мне)

Вам подходит эта работа?
Похожие работы
Python
Контрольная работа Контрольная
3 Окт в 07:42
16 +1
0 покупок
Python
Контрольная работа Контрольная
2 Сен в 09:16
35 +1
0 покупок
Python
Контрольная работа Контрольная
1 Сен в 19:00
35 +1
0 покупок
Python
Курсовая работа Курсовая
28 Июл в 21:21
51 +1
0 покупок
Другие работы автора
Анализ и прогнозирование
Задача Задача
11 Апр в 09:36
102 +1
1 покупка
Сетевые технологии
Лабораторная работа Лабораторная
9 Апр в 21:29
119 +1
1 покупка
Python
Контрольная работа Контрольная
30 Мар в 21:26
188 +2
4 покупки
Python
Контрольная работа Контрольная
29 Мар в 10:31
185 +1
0 покупок
Информационные технологии
Задача Задача
29 Мар в 07:47
216 +1
2 покупки
Методы защиты информации
Задача Задача
28 Мар в 04:19
167
0 покупок
Теория кодирования
Контрольная работа Контрольная
26 Мар в 13:37
163 +1
0 покупок
Теория информации
Задача Задача
26 Мар в 08:23
180 +1
0 покупок
Сетевые технологии
Контрольная работа Контрольная
26 Мар в 07:57
171 +1
0 покупок
Теория информации
Курсовая работа Курсовая
26 Мар в 07:27
174 +1
0 покупок
Теория информации
Курсовая работа Курсовая
26 Мар в 07:16
138 +1
0 покупок
Python
Отчет по практике Практика
26 Мар в 06:44
229 +2
3 покупки
Криптография
Лабораторная работа Лабораторная
25 Мар в 17:48
163
0 покупок
Искусственный интеллект
Контрольная работа Контрольная
25 Мар в 17:27
172 +1
0 покупок
Теория информации
Задача Задача
25 Мар в 17:15
186 +1
0 покупок
Криптография
Лабораторная работа Лабораторная
25 Мар в 16:46
91 +1
0 покупок
Криптография
Лабораторная работа Лабораторная
25 Мар в 16:40
170 +1
0 покупок
Искусственный интеллект
Лабораторная работа Лабораторная
24 Мар в 16:26
177 +1
0 покупок
Криптография
РГР РГР
24 Мар в 16:14
161 +1
0 покупок
Искусственный интеллект
Контрольная работа Контрольная
24 Мар в 16:04
142 +1
0 покупок
Темы журнала
Показать ещё
Прямой эфир