Корпорация Bing начала последовательный запуск усовершенствованного поиска по картинкам, при разработке которого была использована технология глубокого обучения (Deep learning). Об этом сообщается в официальном блоге поисковой компании.

Глубокое обучение или Deep learning представляет собой подраздел Машинного Обучения (Machine Learning), использующий искусственные нейронные сети для анализа многозначных реалий, в том числе, и абстрактных понятий. Данная технология была успешно адаптирована корпорацией Microsoft под нужды поиска. В частности, интегрировавшись в поиск изображений, технология глубокого обучения позволила поисковой системе начать гораздо лучше понимать не только истинный смысл пользовательского запроса, но и содержание изображений, отдаваемых алгоритмом в результаты выдачи.

Так, например, теперь алгоритмы Bing научились еще точнее идентифицировать дублированный изобразительный контент, и, соответственно, отфильтровывать его в результатах выдачи.

Кроме того, в поиске по изображениям теперь доступен целый ряд различных фильтров. К примеру, пользователь может найти не просто фото американской певицы Кэти Пери (Katy Perry), а карандашные эскизы с её изображениями, используя фильтр «рисунок линиями»; или фотографии звезды, на которых она предстаёт перед зрителями с синим оттенком волос, используя фильтр «синий»:

«Два изображения могут быть связаны друг с другом, только если система обнаружит очевидное сходство между ними. В масштабах всего интернета триллионы изображений связываются между собой и образуют гигантский граф, в котором каждое изображение связано с другим посредством семантических связей. Используя традиционные для теории графов понятия, такие как узлы и лучи, эти картинки соотносятся с изображениями других сущностей. Таким образом, применяя технологию Deep learning, система начинает улавливать семантическую границу между различными сущностями и различает смысл семантически разнородных образцов изображений с похожей визуальной композицией», — комментируют представители Bing.

Так, например, если стандартный граф изображений, применявшийся до недавнего времени, выглядел следующим образом, а связи в нём строилась на основе визуального сходства изображений:

То система визуальных графов, основанная на технологии Deep learning, способна анализировать семантические связи между объектами и выглядит так:

В результате внедрения новой технологии в алгоритмы поиска изображений, разработчикам удалось не только добиться высокой релевантности выдачи поисковым запросам пользователей, но и исключить из неё дублированный контент, а также научиться более точного выявлять изображения, попадающие под защиту «Законом об авторском праве».