1)K-means кластеризация:
Загрузите набор данных "Ирисы" (можно использовать функцию load_iris() из библиотеки sklearn.datasets). Примените алгоритм K-means для кластеризации данных. Визуализируйте полученные кластеры на плоскости, используя только два признака (например, длину и ширину лепестка). Попробуйте различное количество кластеров (2, 3, 4) и сравните результаты
2)DBSCAN кластеризация:
Загрузите набор данных "Круги" (можно создать с помощью функции make_circles() из библиотеки sklearn.datasets). Примените алгоритм DBSCAN для кластеризации данных. Визуализируйте полученные кластеры на плоскости. Попробуйте различные значения параметров eps и min_samples и определите, как они влияют на результат кластеризации.
3)Иерархическая кластеризация:
Загрузите набор данных "Случайные точки" (можно создать с помощью функции make_blobs() из библиотеки sklearn.datasets). Примените иерархическую кластеризацию с помощью алгоритма AgglomerativeClustering. Визуализируйте дендрограмму полученных кластеров. Попробуйте различное количество кластеров и определите оптимальное число кластеров для данного набора данных.
4)Сравнение алгоритмов:
Загрузите набор данных "Ирисы". Примените все три алгоритма кластеризации (K-means, DBSCAN, иерархическая) к этим данным. Сравните результаты кластеризации по метрикам, таким как индекс силуэта (можно использовать функцию silhouette_score() из sklearn.metrics). Определите, какой алгоритм лучше всего подходит для данного набора данных.
| Гарантия на работу | 1 год |
| Средний балл | 4.54 |
| Стоимость | Назначаете сами |
| Эксперт | Выбираете сами |
| Уникальность работы | от 70% |