Ответ на вопрос
Для определения различности изображений можно использовать алгоритмы сравнения изображений, такие как perceptual hashing (например, pHash), structural similarity index (SSIM) или алгоритмы оценки похожести изображений (например, OpenCV).Для определения повторяющихся изображений можно использовать хэширование изображений (например, MD5 или SHA-1) и сравнивать полученные хэши между собой. Также можно использовать вышеупомянутые алгоритмы сравнения изображений.Что касается хранения изображений, то для небольшого количества изображений можно использовать любую базу данных, например, SQL или NoSQL (например, MongoDB). Если изображений очень много, то может быть удобнее хранить их файлами и добавлять путь к файлу в базу данных для быстрого доступа к изображениям.При парсинге сайтов для набирания изображений, убедитесь, что у вас есть разрешение на использование этих изображений (например, они не защищены авторскими правами). И также обратите внимание на этические аспекты использования изображений, полученных путем парсинга.Надеюсь, эти советы помогут вам решить вашу задачу!
Еще