Платим блогерам
Блоги
amv212
Решения для анонимизации данных существуют, но механизмы их реализации должны быть тщательно проработаны.

реклама

Огромные объемы данных, получаемых от пользователей, поступают в распоряжение компаний, производящих смартфоны и компьютеры. Компании гарантируют нам, что эти данные анонимизированы и не содержат персональных идентификаторов, по которым можно определить личность пользователя. Но эти гарантии не имеют под собой никаких оснований, утверждает новое исследование: опытный злоумышленник может определить личность по анонимным массивам данных.

Image credits: Olia Nayda.

реклама

 

Когда началась пандемия и была введена принудительная изоляция, казалось, что мир вокруг остановился. В этом можно было легко убедиться, просто оглянувшись вокруг. Кроме того, этот факт подтверждался и статистическими данными. Например, тенденции мобильности, опубликованные такими компаниями, как Apple и Google, показали, что значительная часть населения перестала ездить на работу на работу, люди все чаще пользуются автомобилями и все меньше общественным транспортом.

Поначалу пользователей, по вполне понятным причинам, пугала эта информация. Неужели технологические компании знают, куда я хожу и что я делаю? Компании убеждали нас, что это не так. Данные анонимизированы - они знают, что пользователь куда-то ходил и что-то делал, но не знают, кто этот пользователь. Приложения других производителей также собирают огромное количество информации с вашего смартфона, либо для таргетинга рекламы, либо для иных целей, хотя во многих случаях они по-прежнему обязаны по закону анонимизировать данные, удаляя все идентификаторы личности, включая имена и номера телефонов.

Однако этого уже явно недостаточно. Исследователи смогли идентифицировать многих пользователей по анонимизированным данным, имея всего несколько деталей (например, по характеру общения в приложениях типа WhatsApp). Ив-Александр де Монтжойе, доцент Имперского колледжа Лондона и один из авторов исследования, сказал AFP, что пришло время "заново придумать, что такое анонимизация".

Что такое анонимизация?

Эти данные показывают, как изменилось движение населения в определенных местах по сравнению с периодом до пандемии. (Исследование проводилось в США)


Исследователи начали с изучения анонимизированных данных около 40 тысяч владельцев смартфонов, собранных в основном из мессенджеров. После чего они, по сути  "провели атаку" на эти данные, имитируя процесс, который мог бы выполнить вредоносный агент. Фактически, речь шла о поиске закономерностей в данных, чтобы выяснить, можно ли выяснить, личности конкретных пользователей.

Используя только прямые контактные данные, они смогли определить отдельных пользователей в 15% случаев. А после того как к этой статистике были добавлены дальнейшие взаимодействия между этими же контактами, они смогли определить уже 52% пользователей.

Однако это не свидетельствует о том, что мы должны отказаться от анонимизации, объясняют исследователи. Наоборот, мы должны усилить значение этой анонимизации, убедившись, что информация действительно анонимна.

" Полученные нами результаты говорят о том, что обезличенные и даже повторно псевдонимизированные данные о взаимодействия по-прежнему поддаются идентификации на протяжении длительного времени", - отмечают специалисты. Полученные результаты наводят на мысль, что текущая практика абсолютно не соответствует стандартам сохранения анонимности, установленным (европейскими регуляторами).

"Наши результаты являются убедительным доказательством того, что разрозненные и даже повторно псевдонимизированные данные взаимодействия могут быть связаны между собой", - заключают исследователи.

Исследователи предлагают ограничивать большие массивы данных простыми системами "вопрос-ответ" или использовать системы дифференциальной конфиденциальности, которые добавляют произвольные замены, обеспечивающие конфиденциальность информации.

Исследование было опубликовано в журнале Nature Communications.
Источники: 
https://www.wikiwand.com/en/Differential_privacy
https://www.nature.com/articles/s41467-021-27714-6
https://ourworldindata.org/grapher/changes-visitors-covid?country=~USA

1
Показать комментарии (1)

Популярные новости

Сейчас обсуждают