Основы машинного обучения
Проект: предсказание токсичности соединений
Данный проект посвящен предсказанию токсичности соединений с использованием данных о их химических свойствах.
Для успешной реализации данной задачи вам необходимо выполнить следующие этапы:
1. Анализ данных: на этом этапе необходимо провести детальный анализ имеющихся данных, изучить их структуру, определить типы признаков, выявить возможные выбросы и аномалии.
Также важно провести визуализацию данных для наглядного представления результатов анализа.
2. Предобработка данных: после анализа данных необходимо выполнить предобработку для улучшения качества модели.
3. Обучение модели: на этом этапе необходимо обучить модель на обучающих данных и провалидировать ее для оценки качества. В качестве метрики качества модели предлагается использовать RMSE.
4. Тестирование модели: после успешного обучения и валидации модели необходимо протестировать ее на тестовом наборе данных и оценить ее производительность.
Ноутбук с задачей
Данные для задачи в приложение к задаче
train.csv – данные для обучения
test_only_smiles.csv – данные для предсказания
Критерии оценивания
Максимум за проект можно получить 100 баллов.
Ниже представлены критерии на которые будет обращать внимание эксперт при просмотре вашей работы.
Качество анализа данных 20 баллов
Качество визуализации данных 25 баллов
Качество предобработки данных 25 баллов
Качество кода в ноутбуке 10 баллов
Итоговое качество модели и скор на тестовых данных 30 баллов
| Гарантия на работу | 1 год |
| Средний балл | 4.54 |
| Стоимость | Назначаете сами |
| Эксперт | Выбираете сами |
| Уникальность работы | от 70% |