Google разработала эффективную систему распознавания изображений

Распознание объектов на крупномасштабных цифровых изображениях является одной из крупнейших академических проблем в области компьютерного зрения. Ежегодно Стэндфордский университет проводит конкурс ImageNet large-scale visual recognition challenge (ILSVRC) среди ведущих научных учреждений и лабораторий, в рамках которого участники демонстрируют самые последние технологические достижения в данной сфере.

реклама

Конкурс включает три этапа: классификация, классификация с локализацией и обнаружение. В первом случае оценивается возможность алгоритма создавать правильные "подписи" к изображению, локализация предполагает также и выделение основных объектов на изображении, похожим образом формулируется и задача обнаружения, но тут действуют более строгие критерии оценки. Модель должна быть способна описать сложную сцену с множеством объектов и мелких деталей.

В этом году в конкурсе снова приняла участие команда GoogLeNet – аббревиатура образована из слов Google и LeNet (одна из реализаций свёрточной нейронной сети). Нейронная сеть с глубоко переработанной архитектурой способна быстро обучаться и переобучаться, а также выдавать результаты даже при наличии небольшого объёма памяти за счёт более чем десятикратного сокращения числа параметров по сравнению с большинством других моделей компьютерного зрения.

анонсы и реклама

реклама

реклама

реклама

Google планирует внедрить разработки своей исследовательской команды в визуальные службы вроде поиска изображений и YouTube, а также в системы автоматического управления транспортными средствами и другие сферы, где подобная технология сможет принести пользу.

Оценитe материал
рейтинг: 4.6 из 5
голосов: 20

Комментарии Правила

Возможно вас заинтересует

Сейчас обсуждают