- Тема 1. Введение в машинное обучение. Типы задач. Метрические классификаторы, алгоритмы кластеризации. Деревья решений, линейные классификаторы
- Тема 2. Нейронные сети и глубокое обучение. Регрессионный анализ, ансамблевые методы. Стохастический поиск.
- Тема 3. Введение в рекомендательные системы (РС). Коллаборативная фильтрация на основе сходства по пользователям и предметам. Частые множества и ассоциативные правила. Элементы Анализа формальных поня
- Тема 4. Методы на основе матричной факторизации для рекомендательных систем. Спектральная кластеризация. Поиск частых последовательностей. Гибридные рекомендательные системы. Стандартные и дополнитель
В какой из рекомендательных систем используются знания о характеристиках самих объектов (например, жанр фильма, описание товара)?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Коллаборативная фильтрация
- Контентно-ориентированные рекомендательные системы (Content-based)
- Гибридные рекомендательные системы
- Знаниевые рекомендательные системы
В каком из перечисленных случаев особенно полезны факторизационные машины?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Когда данные полностью заполнены и нет категориальных признаков
- Когда данные разрежены и содержат категориальные признаки с большим количеством значений
- Когда требуется построить простую линейную модель
- Когда необходимо быстро кластеризовать пользователей
В каком из следующих алгоритмов каждая модель в ансамбле получает вес в зависимости от её производительности?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Случайный лес (Random Forest)
- Голосование (Voting)
- AdaBoost (Adaptive Boosting)
- Градиентный бустинг (Gradient Boosting)
В каком типе коллаборативной фильтрации рекомендации формируются на основе предпочтений похожих пользователей?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Item-based CF
- User-based CF
- Content-based filtering
- Rule-based filtering
Для чего может использоваться поиск минимального разреза в рекомендательных системах?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Для поиска латентных факторов
- Для сегментации пользователей на группы с похожими предпочтениями
- Для предсказания будущих покупок
- Для повышения скорости работы системы
Какая из перечисленных метрик наиболее чувствительна к несбалансированности классов?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Точность
- Полнота
- F1-мера
- AUC
Какая мера определяет, как часто набор объектов X и Y встречается вместе в транзакциях?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Confidence
- Lift
- Support
- Stability
Какая мера определяет, насколько вероятно, что правило X -> Y является верным?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Support
- Confidence
- Lift
- Stability
Какая мера определяет, насколько связь между X и Y сильнее, чем если бы они были независимы?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Support
- Confidence
- Lift
- Stability
Какая мера характеризует, насколько правило сохраняется при небольших изменениях в данных?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Support
- Confidence
- Lift
- Stability
Какое из понятий означает минимальный набор правил, из которого можно вывести все остальные правила с использованием логических операций?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Частый набор объектов
- Замкнутое множество
- Базис ассоциативных правил
- Поддержка
Какое из следующих утверждений верно относительно FP-дерева?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Объекты располагаются в FP-дереве в порядке возрастания частоты
- FP-дерево сканируется многократно для поиска частых наборов объектов
- FP-дерево представляет собой компактное представление базы данных транзакций
- FP-дерево используется только для поиска двухэлементных наборов объектов
Какой из методов не относится к коллаборативной фильтрации?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- User-based CF
- Item-based CF
- Content-based filtering
- Model-based CF
Какой из перечисленных алгоритмов кластеризации лучше всего подходит для обнаружения кластеров произвольной формы?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- k-средние
- Иерархическая кластеризация с одиночной связью
- DBSCAN
- К-медоиды
Какой метод используется для выявления латентных факторов путем разложения матрицы оценок?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- K-means
- Матричная факторизация
- DBSCAN
- Apriori
Какой метод используется для сравнения двух версий веб-страницы или приложения с целью определения, какая из них лучше работает?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Анализ временных рядов
- Кластеризация
- A/B тестирование
- Регрессионный анализ
Какой метод обобщает линейные модели и модели матричной факторизации и позволяет учитывать взаимодействия между признаками высокой размерности?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- K-means
- DBSCAN
- Факторизационные машины
- PCA
Какой метод объединяет прогнозы нескольких базовых моделей для получения более точного и устойчивого результата?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Регуляризация
- Нормализация
- Ансамблевый метод
- Метод опорных векторов
Какой метод оптимизации используется для минимизации ошибки между предсказанными и фактическими оценками в матричной факторизации и обновляет параметры на каждой итерации на основе случайно выбранного образца данных?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
Какой тип матрицы часто используется для представления взаимодействий пользователей с объектами в рекомендательных системах?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Плотная матрица (Dense matrix)
- Диагональная матрица (Diagonal matrix)
- Разреженная матрица (Sparse matrix)
- Единичная матрица (Identity matrix)
Какой тип регрессии используется, когда зависимость между переменными не является линейной?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Линейная регрессия
- Логистическая регрессия
- Полиномиальная регрессия
- Гребневая регрессия
Что из перечисленного не является методом оценки качества рекомендательных систем?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Mean Absolute Error (MAE)
- Root Mean Squared Error (RMSE)
- AUC (Area Under the Curve)
- Feature Importance
Что означает встраивание дополнительной информации в модели рекомендательных систем?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Уменьшение количества используемых признаков
- Использование дополнительной информации о пользователях, объектах или контексте
- Увеличение сложности алгоритма
- Использование только явных оценок
Что подразумевается под латентными факторами в моделях матричной факторизации?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Явные характеристики пользователей и объектов
- Скрытые, неявные признаки, определяющие предпочтения пользователей
- Случайные шумы в данных
- Ошибки при сборе данных
Что такое “лифт” (Lift) равный 1?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Правило очень сильное и надежное
- Правило не имеет никакой ценности
- Объекты в правиле встречаются независимо друг от друга
- Правило противоречит данным
Что такое “скорость обучения” (learning rate) в градиентном спуске?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Параметр, который определяет, как быстро модель сходится к оптимальному решению
- Функция, которая используется для вычисления градиента
- Метод регуляризации
- Параметр, определяющий размер мини-пакета
Что такое “функция активации” в нейронной сети?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Функция, которая измеряет ошибку между предсказанными и истинными значениями
- Функция, которая вводит нелинейность в выход нейрона
- Функция, которая используется для оптимизации весов нейронной сети
- Функция, которая нормализует входные данные
Что такое переобучение (overtraining)?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Ситуация, когда модель хорошо обобщает данные на новых примерах
- Ситуация, когда модель идеально соответствует обучающим данным, но плохо работает на новых данных
- Ситуация, когда модель не может найти закономерности в данных
- Ситуация, когда модель работает очень быстро
Что такое AUC (Area Under the Curve)?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Площадь под кривой зависимости точности от полноты
- Площадь под кривой зависимости TPR от FPR
- Мера разброса данных
- Коэффициент корреляции между признаками
Что является преимуществом использования ансамблей рекомендательных алгоритмов?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Простота реализации и интерпретации
- Уменьшение вычислительной сложности
- Повышение точности и устойчивости системы
- Автоматическое решение проблемы “холодного старта”