Платим блогерам
Блоги
crazycat21
Предполагают, что это тестовый вариант новой модели DeepSeek V4, на что указывают характеристики и время появления.

Новая мощная модель искусственного интеллекта (ИИ), которая недавно анонимно появилась на платформе для разработчиков, вызвала предположения о том, что китайский стартап DeepSeek, возможно, проводит тайное тестирование своей системы следующего поколения перед её официальным запуском. Об этом сообщает Reuters.

Фото: Dado Ruvic / Reuters

Бесплатная модель под названием Hunter Alpha появилась на платформе шлюзов искусственного интеллекта OpenRouter 11 марта. Её разработчик указан не был. Позже она была описана платформой как "скрытая модель".

В ходе тестов, проведенных агентством Reuters, чат-бот Hunter Alpha представился как "китайская модель ИИ, обученная преимущественно на китайском языке". Также бот заявил, что его обучающие данные охватывают период до мая 2025 года. Это тот же самый предельный период обучения, о котором сообщил собственный чат-бот DeepSeek.

Однако, как отмечает агентство, когда у платформы поинтересовались о её создателе, она отказалась назвать разработчика.

"Я знаю только своё имя, масштаб параметров и длину контекстного окна", – ответил чат-бот.

Отмечено, что ни DeepSeek, ни OpenRouter не назвали создателя модели и не ответили на соответствующие запросы.

Согласно данным Reuters, на странице профиля  Hunter Alpha указано, что это модель с одним триллионом параметров. Это значит, что она была обучена с использованием примерно одного триллиона регулируемых значений, которые определяют, как система обрабатывает язык и генерирует ответы. Модели искусственного интеллекта, которые имеют большее количество параметров, как правило, требуют значительно большей вычислительной мощности для работы.

Система также рекламирует контекстное окно, вмещающее до одного миллиона токенов, – показатель того, сколько текста новая модель ИИ может обработать или запомнить за одно взаимодействие. Токен примерно соответствует короткому фрагменту текста, например, части слова.

Как отметил Набиль Хауам, инженер, занимающийся разработкой систем ИИ, наиболее удачным сочетанием стало наличие у Hunter Alpha контекста в один миллион токенов с возможностью логического мышления и свободным доступом.

Характеристики Hunter Alpha соответствуют ожиданиям, которые местные средств массовой информации предъявляют к модели DeepSeek следующего поколения V4. Согласно сообщениям китайских изданий, запуск новой модели может произойти уже в апреле. Стартап DeepSeek, как и его многие конкуренты из Китая, имеет хорошее финансирование, несмотря на необычную структуру. Его материнской компанией является количественный хедж-фонд, а не технологический конгломерат.

Хотя совпадение характеристик не является доказательством прямой связи, оно усилило предположения разработчиков о том, что анонимная модель ИИ может являться ранней тестовой версией предстоящего релиза компании DeepSeek.

Дэниел Дьюхерст, инженер по искусственному интеллекту, проанализировавший Hunter Alpha, отметил, что наиболее сильным сигналом является цепочка рассуждений данной модели ИИ.

Масштабируемость и объем памяти Hunter Alpha также соответствуют характеристикам DeepSeek V4, которые появились в СМИ с начала этого года.

Однако некоторые разработчики считают, что имеющиеся доказательства, которые позволяют связать новую модель ИИ с DeepSeek, являются "неубедительными". В частности, Умур Озкул, руководитель независимых тестов производительности ИИ, провёл свой собственный анализ и сделал вывод о том, что модель Hunter Alpha, скорее всего, не является DeepSeek V4. В качестве аргументов он привёл наличие различий в поведении, связанном с токенами, и архитектурных моделях по сравнению с существующими системами DeepSeek. По его мнению, предположения о связи этой модели с DeepSeek вполне понятны, если учитывать возможности и заявленные сроки.

Как отмечает Reuters, анонимный запуск моделей ИИ не является редкостью. Такие платформы, как OpenRouter, позволяют разработчикам отправлять запросы десяткам моделей ИИ через единый интерфейс, что делает их популярной площадкой для тестирования новых систем.

Источник: reuters.com
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости