Платим блогерам
Редакция
Новости Hardware Mindango
На основе свёрточной нейронной сети.

реклама

Распознание объектов на крупномасштабных цифровых изображениях является одной из крупнейших академических проблем в области компьютерного зрения. Ежегодно Стэндфордский университет проводит конкурс ImageNet large-scale visual recognition challenge (ILSVRC) среди ведущих научных учреждений и лабораторий, в рамках которого участники демонстрируют самые последние технологические достижения в данной сфере.

Конкурс включает три этапа: классификация, классификация с локализацией и обнаружение. В первом случае оценивается возможность алгоритма создавать правильные "подписи" к изображению, локализация предполагает также и выделение основных объектов на изображении, похожим образом формулируется и задача обнаружения, но тут действуют более строгие критерии оценки. Модель должна быть способна описать сложную сцену с множеством объектов и мелких деталей.

реклама

В этом году в конкурсе снова приняла участие команда GoogLeNet – аббревиатура образована из слов Google и LeNet (одна из реализаций свёрточной нейронной сети). Нейронная сеть с глубоко переработанной архитектурой способна быстро обучаться и переобучаться, а также выдавать результаты даже при наличии небольшого объёма памяти за счёт более чем десятикратного сокращения числа параметров по сравнению с большинством других моделей компьютерного зрения.

Google планирует внедрить разработки своей исследовательской команды в визуальные службы вроде поиска изображений и YouTube, а также в системы автоматического управления транспортными средствами и другие сферы, где подобная технология сможет принести пользу.

Написать комментарий (0)

Сейчас обсуждают