Сбор данных для моделеи? обучения с учителем - реляционная форма данных, понятие чистых данных, оценка источников и объемов данных. Описательныи? (предварительныи?) анализ данных (EDA) - анализ репрезентативности, шкалы и типы, визуализация, проблема несбалансированности, обнаружение корреляции?, аномалии? в данных. Очистка и преобразование данных - удаление лишних признаков, удаление непоказательных объектов, заполнение отсутствующих значении?, создание суррогатных признаков, преобразование шкал, воспроизводимость преобразования данных.