Основы разведочного анализа данных и предиктивного моделирования

Отменен
Заказ
6881984
Раздел
Программирование
Предмет
Базы данных
Антиплагиат
Не указан
Срок сдачи
23 Окт в 22:00
Цена
Договорная цена
Блокировка
10 дней
Размещен
17 Окт в 18:37
Просмотров
19
Описание работы

Полное описание - файл ПДФ

I. Описание Кейс-задания

Вы работаете в аналитическом отделе Банка «Звезда Пальмиры». В банке за

последнее время была обнаружена тенденция к оттоку клиентов. Вам поручили

разобраться с этой проблемой. Через неделю у вас назначена встреча с Директором

департамента банка по работе с клиентами, и вам необходимо к ней подготовиться.

Вам предоставили для анализа клиентскую базу исследуемого Банка (csv\xlsx -

файл). Помимо электронных таблиц у вас есть возможность воспользоваться

библиотеками Python или ML-студией Orange DM.

Необходимо подготовить аналитический отчет, содержащий результаты

проведенного исследования, а также выводы и рекомендации для руководства Банка.

II. Ожидаемые результаты

 Результат 1. Диагностический экспресс-анализ процесса оттока

клиентов Банка, выполненный на основе предоставленного датасета без

использования каких-либо инструментов, кроме MS Excel.

 Сформулировать основной вопрос исследования как бизнес-задачи – ответы

на какие вопросы ожидает услышать руководство в вашем отчете;

 Сформулировать гипотезы исследования – ваше видение причин оттока;

 Представить портрет клиента в разбивке по категориям;

 Уточнить бизнес-требования к задаче с точки зрения показателей, которые

предстоит найти и рассчитать (скорость оттока в регионе, посещаемость

банковского приложения за период, и т.п.);

 Подбор бизнес-показателей, связанных с оттоком – из открытого доступа.

 Результат 2. Дополнительный разведочный анализ данных по

оттоку (EDA) с использованием визуального и частотного анализа,

описательных статистик и т.п. Возможные инструменты – Orange ML

Studio, MS Excel, библиотеки Python.

 Сформулировать требования к данным (датасету), которые необходимо

выполнить для получения достоверных ответов к Результату 1 (каких данных

не хватает, какие данные можно рассчитать на основе имеющихся, какие

данные нуждаются в чистке или обогащении);

 Выполнить необходимые расчеты, построить описательные статистики,

подтверждающие высказанные ранее гипотезы; Предложить «Quick Win» План по снижению оттока (что можно сделать уже

сейчас);

 Какие ИС Банка могли бы быть вовлечены в улучшение пользовательского

опыта и почему.

 Результат 3. Разработка предиктивной модели оттока клиентов на

основе предоставленного датасета, прошедшего необходимое

улучшение (чистку, обогащение), и доступных методов машинного

обучения (регрессия, решающие деревья). Возможные инструменты –

Orange ML Studio, MS Excel, библиотеки Python. Визуальное

представление предиктивной модели должно быть показано в виде

workflow -диаграммы студии Orange.

 Выбрать и обосновать 1-2 метода прогнозирования оттока, которые подойдут

для представленного датасета;

 Воспользоваться студией Orange (или библиотеками Python) для построения

предиктивной модели оттока и выполнить все необходимые шаги для

построения и валидации модели (Подготовка данных и гипотез – Выбор

метода моделирования – Построение цепочки виджетов – Оценка качества

модели – Интерпретация результатов);

 Все значимые результаты подтверждаются скриншотами, которые

подписываются как рисунки и комментируются.

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.54
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир