Необходимо сделать 2 части работы. Первая:
Введение
Современные системы компьютерного зрения широко применяются для анализа изображений в различных областях: от спутникового мониторинга до автономного вождения. В рамках данной работы вам предлагается решить задачу классификации природных и городских ландшафтов с использованием нейросетевой архитектуры. В качестве базы используется датасет Intel Image Classification, содержащий более 25,000 цветных изображений, распределённых по 6 классам: buildings, forest, glacier, mountain, sea, street.
🎯 Цель работы
Разработать и обучить модель глубокого обучения, способную точно классифицировать изображения по типу местности, применяя подходы, изученные в курсе.
🛠️ Этапы выполнения
Анализ и загрузка датасета.
Предобработка данных: масштабирование изображений, аугментация, разделение на обучающую, валидационную и тестовую выборки.
Разработка модели: выбор архитектуры (например, CNN), настройка гиперпараметров.
Обучение модели: реализация цикла обучения, сохранение модели.
Оценка модели: расчёт метрик, визуализация результатов (confusion matrix, accuracy/loss curves).
Финальный отчёт: описание процесса, результатов, трудностей и выводов.
.
📏 Метрики оценки модели
Accuracy (точность классификации): ≥ 85% на тестовой выборке.
F1-score: по каждому классу — не ниже 0.80.
Confusion Matrix: адекватная интерпретация ошибок модели.
Loss: анализ функции потерь и её снижение в процессе обучения.
Визуализация результатов: графики точности и потерь по эпохам, примеры верных и ошибочных предсказаний.
✅ Требования к сдаче
Код проекта (в Jupyter Notebook или другом формате).
Отчёт (PDF или презентация), содержащий:
описание всех этапов работы,
графики, таблицы, примеры классификаций,
выводы и предложения по улучшению модели.
📌 Рекомендации по выполнению итоговой работы
Чтобы ваша работа была не только технически корректной, но и профессионально оформленной, следуйте следующим рекомендациям:
🧰 Подготовка данных
Балансировка классов: Проверьте, равномерно ли распределены классы. При необходимости — используйте методы oversampling или class weights.
Аугментация: Применяйте случайные трансформации (повороты, зеркалирование, яркость), чтобы улучшить обобщающую способность модели.
Разделение данных: Разделите датасет на training (70%), validation (15%) и test (15%). Это обеспечит корректную проверку модели.
🧠 Модель
Начните с простой архитектуры (например, 3–4 сверточных слоя), затем попробуйте более сложные подходы (ResNet, MobileNet, EfficientNet).
Используйте Dropout и BatchNormalization для борьбы с переобучением.
Применяйте EarlyStopping и ReduceLROnPlateau для контроля процесса обучения.
📊 Анализ метрик
Accuracy — не единственная метрика: обязательно анализируйте precision, recall и f1-score для каждого класса.
Постройте confusion matrix и объясните, какие классы модель путает и почему.
Используйте графики (matplotlib, seaborn) для визуализации обучения (loss и accuracy по эпохам).
🧾 Оформление отчёта
Объясняйте каждое ваше решение: почему выбрали именно эту модель, этот размер batch и learning rate.
Приводите скриншоты примеров правильной и ошибочной классификации.
Дайте рекомендации по улучшению модели, даже если достигли хороших метрик.
🚀 Продвинутое (по желанию)
Проведите эксперименты с transfer learning — возьмите предобученную модель (например, VGG16, ResNet50) и дообучите на вашем датасете.
Попробуйте разные функции активации и оптимизаторы (Adam, SGD, RMSProp).
Вторая:
Имеется дипломная работа с темой проектирование и разработка информационной системы для записи в груминг-салон. Необходимо дополнить данную дипломную работу так, чтобы в ней также была часть из области Data Science. Тему работы можем обсудить.
| Гарантия на работу | 1 год |
| Средний балл | 4.54 |
| Стоимость | Назначаете сами |
| Эксперт | Выбираете сами |
| Уникальность работы | от 70% |