
В конце недели команда из NovaSky представила Sky-T1-32B-Preview — новую модель рассуждающего искусственного интеллекта. Эта модель привлекает внимание тем, что является первой открытой моделью такого типа, которую можно воспроизвести с нуля. Исследователи опубликовали как исходный код, так и данные, использованные для обучения, что позволяет другим разработчикам легко начать работу с этой моделью. Обучение Sky-T1 обошлось команде менее чем в 450 долларов, что значительно меньше, чем стоимость аналогичных моделей, которая ранее достигала миллионов.
Процесс обучения Sky-T1, имеющей 32 миллиарда параметров, занял примерно 19 часов на системе с восемью графическими процессорами Nvidia H100. В тестах модель показала превосходство над ранней версией o1 от OpenAI в решении математических задач из набора MATH500 и в оценках программирования LiveCodeBench. Однако при решении более сложных задач в области физики и биологии Sky-T1 продемонстрировала менее успешные результаты.

