Платим блогерам
Блоги
kosmos_news
Модель OpenAI «думает» по-китайски, но никто не знает почему.

Модель искусственного интеллекта o1 компании OpenAI характеризуется тем, что «думает» перед тем, как ответить, и проходит через своего рода внутренний мыслительный процесс. Такой подход «цепочки мыслей» позволяет модели делать логические выводы и пробовать различные решения для вывода результата. Пользователи обратили внимание на странное поведение модели.


Модель переключается на другие языки как будто бы случайным образом в ходе своих мыслительных процессов. В частности, o1 переключается на китайский язык, даже если ввод подсказки осуществляется на английском языке.
Может быть интересно


«Почему o1 Pro вдруг начал думать по-китайски? Ни одна часть подсказок (более 5 сообщений) не была на китайском языке. Возможно, это влияние обучающих данных», — пишет разработчик и исследователь ИИ Ришаб Джайн.

Точные причины изменения языка o1 остаются неясными. OpenAI пока не прокомментировала это явление. Очевидная теория заключается в том, что это может быть связано с данными обучения. Разработчик Клем Деланг также подозревает влияние обучающих данных на такое поведение модели.

OpenAI опирается на данные из открытых источников, в которых, по ее словам, доминируют китайские игроки.

«Страны или компании, контролирующие открытый исходный код ИИ, будут иметь огромную власть и влияние на будущее ИИ», — пишет Деланг.

Но есть и другие версии для объяснения этого явления. Некоторые эксперты утверждают, что модель может выбирать наиболее эффективный язык для определенных мыслительных процессов. Таким образом, модель может «воспринимать» китайский язык как особенно подходящий для определенных задач, подобно тому, как люди иногда думают на иностранном языке, когда размышляют об определенных вещах.

Течжень Ван, сотрудник стартапа Hugging Face, занимающегося разработкой искусственного интеллекта, также прокомментировал поведение модели. Он пишет, что модель выбирает язык, который «кажется» наиболее подходящим для конкретной темы или ситуации. Сам он при выполнении расчетов думает на китайском языке, потому что считает его более понятным и эффективным.

«Модель не знает, что такое язык и чем языки отличаются. Для модели всё существующее — просто текст», — рассказал порталу TechCrunch Мэтью Гуздиал, исследователь искусственного интеллекта и доцент Университета Альберты.

Он имеет в виду функциональность таких моделей ИИ. Они обрабатывают не слова напрямую, а токены. Токены могут быть целыми словами, слогами или отдельными буквами. 

В чем именно заключается причина лингвистической гибкости модели ИИ, остается неясным. Также возможно, что причина кроется в сочетании обучающих данных и способа работы модели, а не только в чем-то одном из них.


Источник: techcrunch.com
+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают