В технологическом секторе появилась новая тенденция. Компании, прекратившие свое существование, продают архивы внутренней переписки сотрудников. Разработчики искусственного интеллекта приобретают их как данные для обучения нейросетей.
Основательнице сервиса транскрибации cielo24 удалось превратить архивы компании в источник дохода. За тринадцать лет работы накопились огромные объемы данных. В их число вошли переписки в Slack, заявки из системы Jira и письма с рабочих почтовых ящиков. Продажа этих операционных данных принесла фирме сотни тысяч долларов.

Изображение - ChatGPT
Резкий спрос на подобную информацию возник не случайно. Крупные игроки рынка ИИ практически полностью исчерпали общедоступные текстовые ресурсы вроде Википедии и Reddit. Для создания систем, способных выполнять реальные рабочие задачи, требуются более сложные и специфические наборы данных. Переписки сотрудников содержат необходимый контекст принятия решений и естественную рабочую переписку.
Генеральный директор стартапа SimpleClosure, специализирующегося на ликвидации бизнеса, описала текущую ситуацию как золотую лихорадку. Технологические корпорации стремятся получить доступ к данным из реального мира. Перед продажей специалисты удаляют персональные данные, чтобы соблюсти законодательство. Диапазон выплат варьируется от 10 тысяч до 100 тысяч долларов.
Такая практика вызывает споры вокруг конфиденциальности. Сотрудники вряд ли предполагали, что их корреспонденция станет учебным материалом для ИИ. Правозащитники уже обратились в сенатский комитет с просьбой оценить действия Федеральной торговой комиссии в этой сфере. Они опасаются, что действующие правила защиты данных не успевают за новыми практиками рынка.

