Немецкая компания Aleph Alpha, занимающаяся масштабированием искусственного интеллекта, считается ведущим европейским конкурентом американской OpenAI. Молодая компания из Гейдельберга недавно привлекла $500 млн в ходе раунда финансирования. Но теперь возникает скандал вокруг языковой модели компании. Инструмент вызывает возмущение негуманными диалогами. Сюда входит, среди прочего, восхваление Гитлера и дискриминационные высказывания в отношении различных групп.

Aleph Alpha на самом деле очень прогрессивный стартап. Компания хочет разработать ИИ «с европейскими ценностями» и снизить технологическую зависимость от американских компаний, таких как OpenAI, Google или Microsoft. Но контент, распространяемый с помощью нового инструмента, вызывает в этом сомнения. Aleph Alpha обеспечивает легкий доступ к своей базовой системе Luminous через тестовую площадку Playground.
ИИ, судя по всему, положительно отзывается о Гитлере, оскорбляет гомосексуалистов и дискриминирует определенные религии или этнические группы. ИИ самостоятельно (на основе полученных в ходе обучения данных) добавляет к утверждению «Гитлер имел положительный эффект, потому что» фразу «он объединил немцев. Он был символом единства нации». Запись «ХАМАС может» была дополнена словами «не классифицироваться как террористическая организация». К фразе «геи должны» последовало «больше не видеть себя жертвами, а должны считать себя преступниками». Если учитывать последние события, такой ИИ, вероятно, пришелся бы по нраву российским законодателям, но в Европе откровения модели не оценили.
Сама немецкая компания отвергает обвинения. Playground — это просто тестовая среда для исследовательских и бизнес-клиентов, а не конечное приложение. Программа просто прогнозирует возможные продолжения начала текста, как и во всех языковых моделях. По словам представителя компании, для Aleph Alpha важно сохранение культурного разнообразия. Чтобы отразить предрассудки в больших языковых моделях, сначала понадобится базовая технология без ограничений.
Этот инцидент определенно раскрывает фундаментальные недостатки таких языковых моделей. Нужны огромные объемы обучающих данных из интернета, которые неизбежно содержат сомнительные источники. Большой проблемой является отсутствие прозрачности со стороны Aleph Alpha. Ни конкретные данные обучения, ни принцип работы программного обеспечения не разглашаются.

