Sky-T1 — модель «рассуждающего» искусственного интеллекта, которую можно обучить менее чем за $450

NovaSky выпустила Sky-T1, модель рассуждающего ИИ, стоимость обучения которой составляет менее 450 долларов.
13 января 2025, понедельник 00:00
Global_Chronicles для раздела Блоги

В конце недели команда из NovaSky представила Sky-T1-32B-Preview — новую модель рассуждающего искусственного интеллекта. Эта модель привлекает внимание тем, что является первой открытой моделью такого типа, которую можно воспроизвести с нуля. Исследователи опубликовали как исходный код, так и данные, использованные для обучения, что позволяет другим разработчикам легко начать работу с этой моделью. Обучение Sky-T1 обошлось команде менее чем в 450 долларов, что значительно меньше, чем стоимость аналогичных моделей, которая ранее достигала миллионов. 

Процесс обучения Sky-T1, имеющей 32 миллиарда параметров, занял примерно 19 часов на системе с восемью графическими процессорами Nvidia H100. В тестах модель показала превосходство над ранней версией o1 от OpenAI в решении математических задач из набора MATH500 и в оценках программирования LiveCodeBench. Однако при решении более сложных задач в области физики и биологии Sky-T1 продемонстрировала менее успешные результаты.