- Введение в курс
- Тема 1. Основные понятия теории нейронных сетей
- Тема 2. Стандартные архитектуры нейронных сетей
- Тема 3. Методы обучения нейронных сетей
- Тема 4. Ассоциативные запоминающие нейронные сети
- Тема 5. Технологии машинного обучения
- Тема 6. Модели машинного обучения
- Тема 7. Ансамбли моделей и оценка качества обучения
- Тема 8. Оптимизация признакового пространства
- Заключение
- Итоговая аттестация
… — это процесс группировки объектов по схожим характеристикам
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Классификация
- Регрессия
- Кластеризация
- Оптимизация
… матрицы равен сумме элементов, расположенных на главной диагонали
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Ранг
- Определитель
- След
- Минор
… модели, основанные на нечеткой логике, позволяют учитывать неопределенность и неточность данных
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Древовидные
- Линейные
- Вероятностные
- Нечеткие
… модели, такие как решающие деревья и случайный лес, делят пространство признаков на области, принимая решения на основе последовательности вопросов
Тип ответа: Текcтовый ответ
… описывает математическое представление зависимости между входными и выходными данными
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Модель кластеризации
- Модель регрессии
- Математическая модель
- Вероятностная модель
… представляет собой упрощение данных, уменьшение количества признаков
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Классификация
- Регрессия
- Кластеризация
- Понижение размерности
В задаче частичного обучения, … данные обычно составляют большую часть обучающей выборки
Тип ответа: Текcтовый ответ
Важность признаков в случайном лесу можно оценить, измеряя, насколько … точность модели при исключении этого признака
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- повышается
- уменьшается
- не изменяется
- стабилизируется
Векторное … — это множество объектов, называемых векторами, для которых определены операции сложения и умножения на скаляр
Тип ответа: Текcтовый ответ
Векторы, которые образуют … векторного пространства, линейно независимы и порождают все векторы этого пространства
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- нормаль
- базис
- ортогональ
- диагональ
Веса связей в модели Хопфилда определяются с помощью правила …, которое усиливает связи между нейронами, которые активируются одновременно
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- градиентного спуска
- обратного распространения
- Хебба
- дельта-правила
Вы — аналитик данных в компании, занимающейся онлайн-кредитованием. Ваша задача — повысить эффективность системы оценки кредитоспособности заемщиков с помощью технологий машинного обучения. Какая задача машинного обучения наиболее релевантна для непосредственной классификации заемщиков по степени риска (например, «высокий риск», «средний риск», «низкий риск») на основе исторических данных? Укажите входные данные (признаки), которые будут использоваться, и ожидаемый результат.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Регрессия: прогнозирование конкретной суммы кредита, которую можно одобрить заемщику. Входные данные: возраст, доход, кредитная история, профессия. Ожидаемый результат: рекомендуемая сумма кредита в денежных единицах.
- Кластеризация: группировка заемщиков по общим признакам (например, возрасту и доходу) без предварительного определения классов риска. Входные данные: возраст, доход, кредитная история, профессия. Ожидаемый результат: группы (кластеры) заемщиков, объединенных по сходству признаков.
- Классификация: оценка вероятности невозврата кредита. Входные данные: возраст заемщика, кредитная история, доход, профессия, наличие собственности. Ожидаемый результат: класс риска («высокий риск», «средний риск», «низкий риск»).
- Ассоциативные правила: выявление закономерностей между различными характеристиками заемщиков (например, «если заемщик молод и имеет низкий доход, то он часто допускает просрочки»). Входные данные: возраст, доход, кредитная история. Ожидаемый результат: правила, описывающие связи между характеристиками заемщиков.
Вы аналитик в компании, которая специализируется в прогнозировании спроса на электроэнергию в регионе. Вам необходимо разработать модель, которая сможет точно предсказывать потребление электроэнергии на следующий день, чтобы оптимизировать производство и избежать дефицита или избытка. Определите тип задачи машинного обучения, который наиболее подходит для прогнозирования спроса на электроэнергию. Опишите, что является целевой переменной в этой задаче, и какие значения она может принимать.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Тип задачи: регрессия (прогнозирование непрерывного числового значения). Целевая переменная: потребление электроэнергии (спрос на электроэнергию). Возможные значения целевой переменной: любое неотрицательное вещественное число, выражающее объем потребления энергии в единицах измерения (кВт/ч, МВт/ч и т.д.).
- Тип задачи: классификация (предсказание категорий). Целевая переменная: категория энергопотребления (например, низкий/нормальный/высокий уровень потребления). Возможные значения целевой переменной: три фиксированные категории: низкий, нормальный, высокий уровень потребления электроэнергии.
- Тип задачи: генерация текста (создание новых предложений). Целевая переменная: текстовое описание ожидаемых условий потребления электроэнергии. Возможные значения целевой переменной: произвольные тексты, описывающие ожидаемое поведение потребителей электроэнергии (например, «Ожидается умеренное потребление в течение суток»).
Вы работаете аналитиком в банке и разрабатываете систему автоматической обработки обращений клиентов. Вам необходимо классифицировать каждое обращение по типу. У вас есть следующие варианты классификации: вариант 1: «Мошенническая операция» или «Не мошенническая операция»; вариант 2: «Запрос на кредит», «Жалоба», «Консультация», «Техническая поддержка», «Мошенничество». Какая задача машинного обучения соответствует каждому из этих вариантов классификации?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Варианту 1: многоклассовая классификация; варианту 2: бинарная классификация.
- Варианту 1: бинарная классификация; варианту 2: регрессия.
- Варианту 1: бинарная классификация; варианту 2: многоклассовая классификация.
- Варианту 1: регрессия; варианту 2: многоклассовая классификация.
Вы работаете аналитиком в компании, занимающейся оценкой кредитных рисков. Вы создали модель машинного обучения для прогнозирования вероятности дефолта заемщиков. Исходный набор данных содержал 100 различных признаков, характеризующих заемщиков (возраст, доход, кредитная история, образование, место работы и т. д.). После обучения модели вы обнаружили, что ее производительность на тестовом наборе данных не так высока, как ожидалось, и наблюдаете признаки переобучения. Какое действие целесообразно предпринять для оптимизации признакового пространства и улучшения обобщающей способности модели (снижения переобучения)?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Следует добавить в модель регуляризацию (например, L1- или L2-регуляризацию) и увеличить размер обучающей выборки.
- Следует увеличить количество признаков, добавив новые, сгенерированные случайным образом признаки.
- Следует выбрать наиболее важных признаков и исключения остальных, с помощью метода отбора признаков (например, Recursive Feature Elimination или SelectFromModel с использованием Lasso).
- Следует преобразовать все числовые признаки в категориальные, разбив их на небольшое количество интервалов (биннингом).
Вы работаете аналитиком кредитного риска в крупном банке. Вам поручено разработать модель для прогнозирования дефолта по кредитным продуктам для физических лиц. Исходный набор данных содержит очень большое количество признаков (сотни), включая демографические данные клиентов, информацию об их кредитной истории, транзакционную активность, и макроэкономические показатели. Обработка всех этих признаков ресурсоемка, и есть подозрение, что некоторые признаки неинформативны или даже вредны для модели. Объясните, какие преимущества может дать оптимизация признакового пространства в контексте задачи прогнозирования дефолта кредитного портфеля. Перечислите преимущества, объяснив, почему они важны.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Повышение точности модели: устранение неинформативных или шумовых признаков позволяет модели лучше выявлять закономерности в данных и повышает ее точность прогнозирования. Уменьшение переобучения: ограничение количества признаков снижает риск переобучения модели, особенно при небольшом объеме данных. Улучшение интерпретируемости модели: модель с меньшим количеством признаков легче понять и интерпретировать, что важно для принятия обоснованных решений и выявления факторов риска. Уменьшение вычислительных затрат: снижение количества признаков уменьшает время обучения и использования модели, что особенно важно при работе с большими наборами данных.
- Повышение точности модели: устранение информативных или шумовых признаков позволяет модели лучше выявлять закономерности в данных и повышает ее точность прогнозирования. Уменьшение переобучения: увеличение количества признаков повышает риск переобучения модели, особенно при небольшом объеме данных. Улучшение интерпретируемости модели: модель с большим количеством признаков легче понять и интерпретировать, что важно для принятия обоснованных решений и выявления факторов риска. Уменьшение вычислительных затрат: увеличение количества признаков уменьшает время обучения и использования модели, что особенно важно при работе с большими наборами данных.
- Повышение точности модели: устранение информативных или шумовых признаков позволяет модели лучше выявлять закономерности в данных и повышает ее точность прогнозирования. Уменьшение переобучения: увеличение количества признаков повышает риск переобучения модели, особенно при низком объеме данных. Улучшение интерпретируемости модели: модель с большим количеством признаков легче понять и интерпретировать, что важно для принятия обоснованных решений и выявления факторов риска. Уменьшение низкоэффективных затрат: уменьшает количество признаков увеличивает время обучения и использования модели, что особенно важно при работе с большими наборами данных.
- Повышение точности модели: устранение неинформативных или шумовых признаков позволяет модели лучше выявлять закономерности в данных и повышает ее точность прогнозирования. Уменьшение переобучения: ограничение количества признаков снижает риск переобучения модели, особенно при небольшом объеме данных. Улучшение интерпретируемости модели: модель с меньшим количеством признаков легче понять и интерпретировать, что важно для принятия обоснованных решений и выявления факторов риска. Улучшение разработанности модели: модель с большим количеством признаков легче понять и разрабатывать, что важно для принятия обоснованных решений и выявления факторов риска и оценки проектных решений.
Вы разрабатываете систему машинного обучения для прогнозирования оттока клиентов (customer churn) в телекоммуникационной компании. Вы используете подход концептуального обучения, где каждая гипотеза представляет собой описание профиля клиента, склонного к оттоку. Предположим, вы определили следующие атрибуты для описания клиентов: Возраст: {Молодой, Средний, Пожилой} Уровень дохода: {низкий, средний, высокий} Продолжительность использования услуг: {Короткая, Средняя, Длинная} Вы решили использовать представление гипотезы, в котором «*» означает «любое значение» для атрибута, например, гипотеза «Молодой, *, *» означает, что все молодые клиенты склонны к оттоку, независимо от их дохода и продолжительности использования услуг. Из каких элементов состоит пространство гипотез в вашей системе прогнозирования оттока клиентов? Какой стратегии придерживается алгоритм при поиске оптимальной гипотезы?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Пространство гипотез состоит из всех возможных комбинаций значений атрибутов (3 * 3 * 3 = 27 гипотез). Поиск ведется путем перебора всех гипотез и выбора наиболее точной.
- Пространство гипотез состоит только из наиболее общих гипотез (например, “*, *, *”, “Молодой, *, ”). Поиск ведется от общей гипотезы к более конкретным.
- Пространство гипотез состоит из всех возможных комбинаций значений атрибутов, включая обобщенные значения (‘’). Поиск ведется от наиболее общих гипотез к более специфичным, отбрасывая гипотезы, не соответствующие обучающим данным (отрицательным примерам).
- Пространство гипотез состоит только из наиболее специфичных гипотез (например, «Молодой, Низкий, Короткая»). Поиск ведется от специфичных гипотез к более общим.
Вы разработали модель регрессии для прогнозирования цен на жилую недвижимость в городе. Ваша модель предсказывает цены в тысячах долларов. Вы хотите оценить качество своей модели на тестовой выборке. В какой ситуации наиболее целесообразно использовать среднюю абсолютную процентную ошибку (Mean Absolute Percentage Error, MAPE) в качестве основного показателя для оценки качества вашей модели?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Когда важна простота интерпретации метрики и вы хотите видеть среднюю абсолютную ошибку в тех же единицах измерения, что и целевая переменная (тысячи долларов).
- Когда вы хотите придать больший вес большим ошибкам, так как они более критичны для вашего бизнеса.
- Когда вам необходимо, чтобы метрика была устойчива к выбросам в данных.
- Когда вам необходимо оценить, на сколько процентов в среднем ошибается ваша модель, независимо от масштаба цен на недвижимость, и когда важно, чтобы ошибки в прогнозах для дешевого и дорогого жилья имели одинаковый вес.
Говоря о понятии «пространство гипотез» в контексте машинного обучения, можно утверждать, что … (Укажите 3 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- пространство гипотез – это множество всех возможных параметров модели.
- пространство гипотез – это множество всех возможных функций (моделей), которые могут быть получены на основе выбранного алгоритма обучения
- пространство гипотез – это набор всех доступных входных данных
- размер пространства гипотез зависит от сложности модели и количества параметров
- обучение можно рассматривать как процесс поиска наилучшей гипотезы (модели) в пространстве гипотез
Говоря о характеристиках «Карты ансамблевого ландшафта» (Ensemble Landscape), можно утверждать, что … (Укажите 2 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- карта ансамблевого ландшафта отображает разнообразие моделей в ансамбле, но не показывает их производительность
- карта ансамблевого ландшафта позволяет визуализировать производительность и разнообразие моделей в ансамбле
- различные методы снижения размерности могут быть использованы для визуализации карты ансамблевого ландшафта в двух или трех измерениях
Говоря о характеристиках анализа главных компонент (PCA), можно утверждать, что … (укажите 3 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- PCA — это метод кластеризации данных
- PCA — это метод уменьшения размерности, который преобразует данные в новый набор ортогональных признаков (главных компонент)
- первая главная компонента объясняет наибольшую долю дисперсии в данных, вторая — следующую по величине, и так далее.
- PCA может быть использован для визуализации многомерных данных или для уменьшения вычислительной сложности моделей машинного обучения
Говоря о характеристиках конструирования признаков, можно утверждать, что … (Укажите 3 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- конструирование признаков — это процесс автоматического выбора лучших признаков из исходного набора данных
- конструирование признаков предполагает создание новых признаков на основе существующих, с целью улучшения производительности модели
- создание новых признаков может включать в себя математические операции, комбинации признаков, или использование экспертных знаний
- хорошо сконструированные признаки могут значительно улучшить точность модели и упростить процесс обучения
Говоря о характеристичных особенностях связи между нейронами, можно утверждать, что …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- взаимосвязи между нейронами представляются весами, которые определяют силу влияния одного нейрона на другой
- связи между нейронами устанавливаются случайно и не влияют на процесс обучения
- связи между нейронами фиксированы и неизменны на протяжении всей жизни организма
- каждый нейрон соединён абсолютно со всеми остальными нейронами мозга, формируя единую сеть одинаковой силы связей
Градиентный метод использует … для определения направления изменения параметров сети, чтобы минимизировать функцию потерь
Тип ответа: Текcтовый ответ
Для успешного применения частичного обучения важно, чтобы неразмеченные данные были … размеченным данным
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- релевантны
- не связаны с
- противоположны
- независимы от
Задача … заключается в отнесении входных данных к одной из нескольких категорий
Тип ответа: Текcтовый ответ
Линейное … — это функция, которая отображает векторы из одного векторного пространства в другое, сохраняя операции сложения и умножения на скаляр
Тип ответа: Текcтовый ответ
Машинное обучение позволяет компьютерам … из опыта без явного программирования
Тип ответа: Текcтовый ответ
Метод … является разновидностью градиентного спуска, который использует адаптивный размер шага для каждого параметра
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Momentum
- Adam
- RMSprop
- Nesterov momentum
Метод … является распространенным подходом в частичном обучении, где неразмеченные данные используются для определения структуры данных
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- кластеризации
- самообучения
- регрессии
- классификации
Модель Хопфилда используется для решения задач …, таких как задача коммивояжера
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- классификации
- регрессии
- оптимизации
- кластеризации
Одним из преимуществ случайного леса является устойчивость к …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- недостаточной обучаемости
- переобучению
- смещению
- сложности
Одним из преимуществ частичного обучения является возможность улучшения производительности модели при ограниченном количестве … данных
Тип ответа: Текcтовый ответ
Основная задача модели Хопфилда — … ассоциативной памяти, то есть восстановление полного образа по его части
Тип ответа: Текcтовый ответ
Предположим, вы разрабатываете систему прогнозирования кредитного рейтинга заемщиков на основе прямого произведения искусственных нейронных сетей (ППИНС). У вас есть две уже обученные искусственные нейронные сети (ИНС): ИНС 1: обучена на исторических данных о погашении кредитов (сумма кредита, срок, процентная ставка, кредитная история); ИНС 2: обучена на данных из социальных сетей заемщиков (количество друзей, активность, интересы). Обе ИНС демонстрируют приемлемую точность, но есть подозрение, что они выявляют разные, частично пересекающиеся факторы, влияющие на кредитный рейтинг. Ваша главная цель — учесть вклад каждой ИНС в конечный прогноз в зависимости от ее индивидуальной точности и значимости выявленных факторов? Какую архитектуру ППИНС следует выбрать для объединения этих двух ИНС? Поясните ответ.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Параллельное объединение с последующим обучением: простое усреднение выходов: берется среднее значение выходов обеих ИНС. Эта дополнительная ИНС обучается на данных, содержащих как прогнозы отдельных ИНС, так и фактические кредитные рейтинги.
- Взвешенное усреднение выходов: каждой ИНС присваивается весовой коэффициент, отражающий ее вклад в конечный прогноз. Весовые коэффициенты определяются экспертным путем или на основе анализа точности каждой ИНС на проверочной выборке.
- Параллельное объединение с последующим обучением: выход первой ИНС (например, предсказанный кредитный рейтинг) подается на вход второй ИНС. Эта дополнительная ИНС обучается на данных, содержащих как прогнозы отдельных ИНС, так и фактические кредитные рейтинги.
- Параллельное объединение с последующим обучением: выходы обеих ИНС объединяются в один вектор, который подается на вход дополнительной обучаемой ИНС. Эта дополнительная ИНС обучается на данных, содержащих как прогнозы отдельных ИНС, так и фактические кредитные рейтинги.
Представьте, вы младший аналитик в отделе рисков банка. Ваша команда разрабатывает систему для прогнозирования вероятности невозврата кредита (дефолта) физическими лицами. Для этого планируется использовать нейронные сети. Вам необходимо продемонстрировать понимание основных концепций, лежащих в основе нейронных сетей, чтобы эффективно участвовать в процессе разработки и анализа модели. Предложите базовую архитектуру многослойного персептрона (MLP) для решения задачи прогнозирования невозврата кредита. Укажите: Количество входных нейронов и почему вы выбрали именно это количество. Количество скрытых слоев и нейронов в каждом слое. Обоснуйте свой выбор (какие факторы вы учитывали?). Функцию активации для каждого слоя (скрытых слоев и выходного слоя). Обоснуйте свой выбор. Функцию потерь, которую вы будете использовать для обучения сети.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Входной слой: 10-20 нейронов (по количеству признаков заемщика, например, возраст, доход, кредитная история) Скрытые слои: 2 слоя: 64 и 32 нейрона (обеспечивают достаточную сложность, но без сильного риска переобучения), ReLU активация (эффективна, избегает проблем с градиентом) Выходной слой: 1 нейрон. Сигмоида активация (выдает вероятность дефолта от 0 до 1) Функция потерь: Binary Cross-Entropy (стандарт для бинарной классификации)
- Входной слой: 40-50 нейронов (по количеству признаков заемщика, например, возраст, доход, кредитная история) Скрытые слои: 3 слоя: 64 нейрона (обеспечивают достаточную сложность, но без сильного риска переобучения), ReLU активация (эффективна, избегает проблем с градиентом) Выходной слой: 2 нейрона. Сигмоида активация (выдает вероятность дефолта от 0 до 1) Функция потерь: Binary Cross-Entropy (стандарт для бинарной классификации)
- Входной слой: 20-30 нейронов (по количеству признаков заемщика, например, возраст, доход, кредитная история) Скрытые слои: 4 слоя: 72 нейрона (обеспечивают достаточную сложность, но без сильного риска переобучения), ReLU активация (эффективна, избегает проблем с градиентом) Выходной слой: 10 нейронов. Сигмоида активация (выдает вероятность дефолта от 0 до 1) Функция потерь: Binary Cross-Entropy (стандарт для бинарной классификации)
- Входной слой: 60 нейронов (по количеству признаков заемщика, например, возраст, доход, кредитная история) Скрытые слои: 3 слоя: 2 нейрона (обеспечивают достаточную сложность, но без сильного риска переобучения), ReLU активация (эффективна, избегает проблем с градиентом) Выходной слой: 5нейронов. Сигмоида активация (выдает вероятность дефолта от 0 до 1) Функция потерь: Binary Cross-Entropy (стандарт для бинарной классификации)
Представьте, что вы аналитик данных в компании, которая занимается автоматизацией обработки текстовой информации из финансовых отчетов. Вам нужно выбрать подходящую архитектуру нейронной сети для задачи классификации финансовых новостей по темам, например, «макроэкономика», «рынок акций», «корпоративные финансы». Какую следует выбрать стандартную архитектуру нейронных сетей для решения поставленной задачи? Перечислите основные преимущества выбранной архитектуры. (укажите 2 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- Следует выбрать многослойный персептрон (MLP). Ее преимущества: способность к обучению нелинейным зависимостям, могут эффективно моделировать сложные, нелинейные взаимосвязи между входными признаками и вероятностью дефолта, что часто характерно для кредитных данных.
- Следует выбрать сверточную нейронную сеть (CNN). Ее преимущества: хорошо извлекает локальные признаки из текста, такие как сочетания слов, и не требует ручного извлечения признаков.
- Следует выбрать рекуррентную нейронную сеть (RNN). Ее преимущества: хорошо учитывает последовательность слов в тексте и может улавливать долгосрочные зависимости.
- Следует выбрать автоэнкодер. Ее преимущества: обучаются без учителя, используя только входные данные, эффективно кодирует данные в сжатое представление (латентное пространство).
Представьте, что вы аналитик данных в отделе по борьбе с мошенничеством в банке. Вам необходимо разработать систему, которая могла бы выявлять мошеннические транзакции, даже если информация о них поступает частично или с искажениями. Вы рассматриваете возможность использования ассоциативных запоминающих нейронных сетей для этой цели. Опишите, в каких конкретных экономических задачах, помимо выявления мошеннических транзакций, ассоциативные запоминающие нейронные сети (АЗС) могут быть полезны. Объясните, почему использование АЗС может быть эффективным.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Прогнозирование цен на акции на основе исторических данных. Объяснение: АЗС могут восстанавливать закономерности в исторических данных, даже если поступает неполная или зашумленная информация, что позволяет прогнозировать цены на акции.
- Прогнозирование цен на акции на основе исторических данных. Объяснение: АЗС не могут быть обучены на нормальных финансовых отчетах, и аномальные отчеты, отличающиеся от запомненных образцов, будут выявлены как подозрительные.
- Прогнозирование цен на акции на основе исторических данных. Объяснение: АЗС могут анализировать закономерности в исторических данных, даже если поступает полная или зашумленная информация, что позволяет прогнозировать цены на акции.
Представьте, что вы используете сеть Кохонена (карту Кохонена, самоорганизующуюся карту — SOM) для сегментации клиентской базы банка на основе их транзакционной активности (средний чек, частота покупок, типы покупок). Сеть обучена. Теперь, согласно принципу «Победитель получает все», вам нужно отнести нового клиента к существующему кластеру. Как определить кластер, к которому будет отнесен новый клиент?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Для определения необходимого кластера рассчитывается среднее значение векторов всех нейронов.
- Для определения необходимого кластера определяется нейрон, как среднее значение векторов всех нейронов (нейрон-победитель)
- Для определения необходимого кластера определяется нейрон, вектор весов которого наиболее близок к вектору транзакционной активности клиента (нейрон-победитель).
- Для определения необходимого кластера определяется нейрон, вектор весов которого наиболее далекий к вектору активности клиента (нейрон-победитель).
Представьте, что вы разрабатываете систему ассоциативной памяти на основе сети Хопфилда для восстановления неполных или искаженных данных о финансовых показателях компании, например, рентабельность, ликвидность, оборачиваемость активов. Вы хотите, чтобы сеть «помнила» несколько типичных профилей компаний, представляющих различные отрасли. Как, согласно правилу Хебба, изменяются веса связей между нейронами в сети Хопфилда при обучении (запоминании) нового профиля компании?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Увеличиваются веса связей между нейронами, соответствующими финансовым показателям, которые имеют одинаковый знак (оба положительные или оба отрицательные) в запоминаемом профиле, уменьшаются веса связей между нейронами с разными знаками.
- Веса всех связей между нейронами устанавливаются равными нулю независимо от конкретного финансового профиля, что фактически блокирует способность сети восстанавливать ассоциации и приводить к полной потере способности хранить какую-либо информацию о ранее запомненном финансовом состоянии компании.
- Веса связей устанавливаются случайным образом перед каждым новым запомненным профилем, что нарушает стабильность ассоциативного процесса и приводит к постепенной утрате предыдущих состояний, делая невозможным восстановление полного набора профилей и нарушая принцип сохранения информации в сети Хопфилда.
- Происходит произвольное увеличение весов некоторых связей между нейронами, соответствующих произвольно выбранным ключевым финансовым показателям (таким как рентабельность), игнорируя влияние остальных показателей и создавая дисбаланс, приводящий к невозможности эффективного восстановления исходных данных при частичном повреждении или пропусках значений.
Преобразование … используется для обработки категориальных признаков, заменяя их числовыми значениями
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- масштабирования
- нормализации
- кодирования
- дискретизации
Преобразование … разделяет непрерывный признак на несколько интервалов
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- масштабирования
- нормализации
- кодирования
- дискретизации
Расположите этапы построения и анализа ROC-кривой в правильной последовательности:
Тип ответа: Сортировка
- 1 упорядочить предсказанные вероятности принадлежности к классу по убыванию
- 2 рассчитать TPR (True Positive Rate) и FPR (False Positive Rate) для каждого порога
- 3 вычисление координат точек ROC-кривой (TPR, FPR) для различных пороговых значений классификатора
- 4 построение графика ROC-кривой на основе вычисленных координат
- 5 анализ площади под кривой (AUC) и формы кривой для оценки производительности классификатора
Расположите этапы построения модели на основе правил в правильной последовательности:
Тип ответа: Сортировка
- 1 извлечение или генерирование правил из данных
- 2 определение критериев для оценки качества правил
- 3 оценка и выбор лучших правил
- 4 применение правил к новым данным для предсказания результата
Расположите этапы процесса оценки качества решения задачи машинного обучения в правильной последовательности:
Тип ответа: Сортировка
- 1 разделение данных на обучающую и тестовую выборки (или использование кросс-валидации)
- 2 выбор метрики оценки (например, точность, F1-мера, AUC-ROC)
- 3 обучение модели на обучающей выборке
- 4 применение обученной модели к тестовой выборке и расчет выбранной метрики оценки
- 5 анализ результатов оценки и сравнение с другими моделями (если применимо)
Расположите этапы процесса принятия решений на основе нечеткой логики в правильной последовательности:
Тип ответа: Сортировка
- 1 фаззификация (преобразование четких входных значений в нечеткие множества)
- 2 применение нечетких правил (IF-THEN rules) к нечетким входным данным
- 3 агрегация результатов применения нечетких правил
- 4 дефаззификация (преобразование нечеткого множества в четкое значение)
Расположите этапы работы в типичной слоистой архитектуре нейронной сети в правильной последовательности:
Тип ответа: Сортировка
- 1 инициализация весов и смещений (bias) сети
- 2 подача входных данных на входной слой
- 3 прямое распространение данных через слои сети и применение функций активации
- 4 вычисление функции потерь (loss function) на основе предсказанных и фактических значений
- 5 обратное распространение ошибки (backpropagation) и обновление весов
Расположите этапы работы двунаправленной ассоциативной памяти (BAM) в правильной последовательности при извлечении сохраненного паттерна:
Тип ответа: Сортировка
- 1 преобразование входного паттерна в биполярный формат (+1 и -1)
- 2 подача входного паттерна (например, паттерна X) на входной слой сет
- 3 вычисление выходного паттерна, соответствующего входному паттерну, с использованием матрицы весов
- 4 проверка на сходимость: повторное преобразование выходного паттерна (паттерн Y) обратно во входной слой и сравнение с исходным входным паттерном
Расположите этапы работы нейронной сети встречного распространения в правильной последовательности:
Тип ответа: Сортировка
- 1 подача входного вектора на вход сети
- 2 определение нейрона-победителя в слое Кохонена (Kohonen layer) на основе наименьшего расстояния до входного вектора
- 3 обновление весов нейрона-победителя и его соседей в слое Кохонена для приближения к входному вектору
- 4 активация выходного нейрона, соответствующего нейрону-победителю в слое Кохонена, и формирование выходного сигнала
Случайный лес для агрегации прогнозов отдельных деревьев использует …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- взвешенное усреднение
- голосование
- медиану
- геометрическое среднее
Специалист по разработке стандартных архитектур нейронных сетей разрабатывает систему оценки кредитоспособности клиентов банка. В качестве входных данных у него есть: возраст, доход, кредитная история (количество просрочек, наличие кредитных карт), место работы, образование. Его задача — классифицировать клиентов по трем категориям: «высокий риск», «средний риск», «низкий риск». Для решения этой задачи он решил использовать радиальную нейронную сеть (RBF-сеть). Какой тип радиальной базисной функции специалист должен выбрать для построения эффективной системы оценки кредитоспособности клиентов банка?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Все радиальные базисные функции одинаково хорошо подходят для этой задачи, поэтому выбор не имеет значения.
- Следует использовать линейную РБФ, так как она наиболее проста в вычислениях и подходит для задач классификации с небольшим количеством входных данных.
- Следует использовать многомерную гауссовскую РБФ (Gaussian RBF), так как она обеспечивает гладкую аппроксимацию нелинейных зависимостей в многомерном пространстве признаков и подходит для задач классификации с непрерывными входными данными.
- Следует использовать мультиквадратичную РБФ, так как она обеспечивает высокую точность аппроксимации, даже если входные данные имеют высокую размерность.
Умножение матрицы на … представляет собой изменение масштаба вектора
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- вектор
- матрицу
- скаляр
- ноль-вектор
Установите соответствие между компонентами и характеристиками прямых произведений нейронных сетей:
Тип ответа: Сопоставление
- A. Базовые сети (Basic Networks)
- B. Результирующая сеть (Resulting Network)
- C. Оператор прямого произведения
- D. состоит из базовых сетей, которые обрабатывают различные входные данные или решают отдельные подзадачи
- E. обладает способностью обрабатывать входные данные разных типов или размерностей, объединяя результаты базовых сетей
- F. определяет способ объединения выходов базовых сетей
Установите соответствие между методами обучения без учителя и их основными целями:
Тип ответа: Сопоставление
- A. Кластеризация
- B. Понижение размерности
- C. Ассоциативные правила
- D. группировка похожих объектов в кластеры на основе их характеристик
- E. уменьшение количества переменных, сохраняя при этом наиболее важную информацию
- F. выявление взаимосвязей и закономерностей между элементами набора данных
Установите соответствие между понятиями концептуального обучения и их определениями:
Тип ответа: Сопоставление
- A. Пространство гипотез
- B. Поиск в пространстве гипотез
- C. Концепт
- D. Пример
- E. совокупность всех возможных гипотез, которые могут быть использованы для представления целевой концепции.
- F. процесс выбора гипотезы, которая наилучшим образом соответствует обучающим примерам.
- G. представляет собой описание правила или функции, которая определяет принадлежность объекта к определенной категории.
- H. представляет собой конкретный объект или событие, которое либо соответствует концепту (положительный пример), либо не соответствует (отрицательный пример).
Установите соответствие между терминами и их определениями в контексте применения сети Хопфилда для решения задач комбинаторной оптимизации:
Тип ответа: Сопоставление
- A. Нейрон
- B. Энергетическая функция
- C. Вес связи
- D. элемент сети, представляющий переменную задачи, состояние которого кодирует решение
- E. функция, минимизация которой соответствует нахождению оптимального решения комбинаторной задачи
- F. параметр, представляющий влияние одного элемента задачи на другой; задает силу взаимодействия между ними
Установите соответствие между терминами и их определениями в контексте ROC-анализа:
Тип ответа: Сопоставление
- A. True Positive Rate (TPR) / Чувствительность
- B. False Positive Rate (FPR)
- C. ROC-кривая
- D. доля верно классифицированных положительных объектов (из всех положительных)
- E. доля неверно классифицированных отрицательных объектов (из всех отрицательных)
- F. график, показывающий зависимость между TPR и FPR для различных порогов классификации
Установите соответствие между элементами радиальной базисной нейронной сети (RBF) и их функциями:
Тип ответа: Сопоставление
- A. Входной слой
- B. Скрытый слой (RBF-нейроны)
- C. Выходной слой
- D. Радиальная базисная функция (RBF)
- E. принимает входные данные и передает их в скрытый слой
- F. вычисляет расстояние между входным вектором и центром RBF-нейрона и преобразует его с помощью RBF
- G. объединяет выходы RBF-нейронов с помощью весов для формирования окончательного результата
- H. определяет реакцию RBF-нейрона на входной сигнал, обычно гауссова функция
Установите соответствие между этапами анализа главных компонент (PCA) и их описаниями:
Тип ответа: Сопоставление
- A. Центрирование данных
- B. Вычисление ковариационной матрицы
- C. Вычисление собственных векторов и собственных значений
- D. Выбор главных компонент
- E. вычитание среднего значения из каждого признака, чтобы данные имели нулевое среднее значение
- F. описывает, как признаки изменяются вместе, и используется для вычисления собственных векторов и значений
- G. определяет направления максимальной дисперсии в данных и соответствующие значения, показывающие величину дисперсии в этих направлениях
- H. выбор подмножества собственных векторов (главных компонент), соответствующих наибольшим собственным значениям