Платим блогерам
Блоги
Global_Chronicles
NovaSky выпустила Sky-T1, модель рассуждающего ИИ, стоимость обучения которой составляет менее 450 долларов.

В конце недели команда из NovaSky представила Sky-T1-32B-Preview — новую модель рассуждающего искусственного интеллекта. Эта модель привлекает внимание тем, что является первой открытой моделью такого типа, которую можно воспроизвести с нуля. Исследователи опубликовали как исходный код, так и данные, использованные для обучения, что позволяет другим разработчикам легко начать работу с этой моделью. Обучение Sky-T1 обошлось команде менее чем в 450 долларов, что значительно меньше, чем стоимость аналогичных моделей, которая ранее достигала миллионов. 

Может быть интересно

Процесс обучения Sky-T1, имеющей 32 миллиарда параметров, занял примерно 19 часов на системе с восемью графическими процессорами Nvidia H100. В тестах модель показала превосходство над ранней версией o1 от OpenAI в решении математических задач из набора MATH500 и в оценках программирования LiveCodeBench. Однако при решении более сложных задач в области физики и биологии Sky-T1 продемонстрировала менее успешные результаты.

2
Показать комментарии (2)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают