В России создали крупнейший в мире датасет для распознавания фруктов и овощей в магазинах

Сколтех: создан крупнейший в мире датасет для умных касс и систем учета магазинов
KOTOIMAGES/Shuttestock/FOTODOM

Инженер Яндекса, исследователи Центра искусственного интеллекта Сколтеха и Санкт-Петербургского государственного университета аэрокосмического приборостроения
(ГУАП) представили крупнейший в мире открытый набор данных PackEat для задач компьютерного зрения в розничной торговле. Датасет предназначен для обучения алгоритмов умных касс и систем учета весовых товаров и учитывает реальные условия супермаркетов — полиэтиленовые пакеты, пересечения объектов и «шумный» фон прилавков. Об этом «Газете.Ru» сообщили в пресс-службе Сколтеха.

Команда собрала изображения 34 видов и 65 сортов фруктов и овощей — привычных товаров с прилавков магазинов разных городов. Всего в набор вошло более 100 тысяч снимков, на которых представлено свыше 370 тысяч отдельных объектов. Около 9 тысяч изображений имеют детальную разметку: для каждого указано количество единиц товара и общий вес упаковки. Это позволяет решать ключевые для ритейла задачи — точно различать виды и сорта, корректно выделять каждый объект даже при частичном перекрытии и автоматически подсчитывать количество продуктов.

Проблема ручной идентификации весовых товаров остается одной из причин потерь в розничных сетях. Исследования показывают, что современные нейросети способны достигать точности распознавания до 92%, однако для этого им требуются качественные и реалистичные данные. PackEat восполняет этот дефицит и может существенно повысить надежность автоматизированных систем.

Описание датасета опубликовано в научном журнале Scientific Data. Набор изображений, а также код и примеры моделей выложены в открытом доступе, что позволяет разработчикам и исследователям сразу использовать их в собственных проектах и сравнивать результаты.

Ключевую роль в создании PackEat сыграли Сергей Нестерук из Yandex Cloud и Светлана Илларионова из Центра ИИ Сколтеха. По словам авторов, новый датасет станет важной основой для развития надежных и масштабируемых систем компьютерного зрения в розничной торговле.

Ранее в России разработали доступный способ очистки промышленных выбросов.