Автоматизированные пылесосы iRobot Roomba уже много лет перемещаются по домам с помощью инфракрасных датчиков. Тем не менее компания оснастила некоторые из своих последних моделей Roomba камерами видимого света. Как оказалось, эти камеры могут фиксировать изображения людей в компрометирующих позициях, и эти изображения могут просачиваться в Сеть во время прохождения через глобальную цепочку поставок данных. В 2020 году изображение, на котором женщина сидит на унитазе со спущенными наполовину брюками, попало в Facebook.
Эта фотография является частью набора из пятнадцати фотографий, которые были получены MIT Technology Review. Фотографии изначально были размещены в группах Facebook, на серверах Discord и на других форумах венесуэльскими подрядчиками. Эти подрядчики работали в Scale AI, компании из Сан-Франциско, которая платит работникам из более бедных стран за маркировку изображений с целью обучения алгоритмов машинного обучения. Компания Scale AI получила более двух миллионов изображений от iRobot в рамках более масштабной работы с участием нескольких компаний, занимающихся маркировкой данных для улучшения алгоритмов текущих и будущих устройств компании.
По словам производителя, изображения, переданные компаниям, занимающимся маркировкой данных, делают специальные версии роботов, имеющие аппаратные и программные модификации, которые не используются в потребительских продуктах компании. Эти устройства разработки перемещались по домам сотрудников iRobot и добровольцев, которых наняли сторонние поставщики данных. Эти люди подписали соглашения, дающие Roomba право сбора данных, в том числе и видео, во время их работы. iRobot пометил каждый из этих роботов зеленой наклейкой «идет видеозапись», однако дал на усмотрение добровольцев возможность удаления всех данных, которые они посчитали конфиденциальными, в любом пространстве, в котором работает робот, в том числе и детей.

Компания не желала делиться конкретными соглашениями, подписанными этими людьми, поэтому неясно, знали ли они, что изображения, снятые роботами, будут просматриваться людьми, размечающими данные. Тем не менее генеральным директором iRobot Колином Энглом было сделано заявление, что компания прекращает всякие отношения с поставщиками услуг, которые слили конфиденциальные данные, а также направляет все силы на расследование этого вопроса и примет меры, дабы предотвратить подобные утечки от любых поставщиков услуг в дальнейшем. Scale AI также ясно дал понять, что публикация обучающих изображений в социальных сетях является нарушением соглашения, подписанного его подрядчиками.
Однако соблюдение такого соглашения может быть затруднено, особенно если вы полагаетесь на подрядчиков, расположенных по всему миру. Конкурент Scale AI, Hive, также работает с подрядчиками, и MIT Technology Review спросил генерального директора компании Кевина Гуо о том, как специалисты по маркировке данных делятся обучающими изображениями в социальных сетях. Генеральный директор ответил: «Это распределенные работники… Вы должны предположить, что люди… просят друг друга о помощи. Политика всегда говорит, что вы не должны этого делать, но это очень трудно контролировать… мы не думаем, что у нас есть надлежащий контроль, учитывая нашу рабочую силу».
Эта проблема выходит далеко за пределы компании iRobot и их устройств в целом. Маркировка данных — это целая отрасль, и спрос на эту услугу будет только расти по мере того, как машинное обучение будет улучшаться и становиться более распространенным. Камеры, прикрепленные к устройствам разработки iRobot, направлены вверх, что позволяет компании собирать обучающие изображения, включающие широкий спектр предметов домашнего обихода, помимо мебели, вокруг которой должны перемещаться роботы Roomba. Понятно, что iRobot и многие другие компании работают над обучением алгоритмов машинного обучения, которые лягут в основу следующего поколения «умных» устройств с более широкими возможностями.

