Платим блогерам
Блоги
kefirNET
Компания Cerebras внедряет сервис DeepSeek.

Freepik Ai

Компания iCerebras, производитель чипов искусственного интеллекта, испытывает огромный спрос на запуск крупной языковой модели DeepSeek-R1. По словам генерального директора компании Эндрю Фельдмана, такой всплеск заказов свидетельствует о растущем рынке систем искусственного интеллекта, обусловленном снижением стоимости и повышением эффективности моделей.

Может быть интересно

Компания Cerebras известна своими чипами ИИ на пластинах, которые обеспечивают пиковую вычислительную мощность 125 PFLOPS на чип и поддерживают объем памяти до 1,2 ПБ в паре с внешней памятью. Эти чипы сейчас используются для развертывания моделей DeepSeek-R1, которые могут похвастаться стоимостью предварительного обучения, составляющей всего одну десятую от стоимости основных моделей, таких как GPT-4, при сохранении сопоставимой или более высокой производительности. Такая экономическая эффективность рассматривается как поворотный момент для ИИ, обеспечивающий более широкую доступность и внедрение.

Компания Cerebras утверждает, что ее чипы ИИ на пластинах могут обеспечить производительность 1 508 токенов в секунду для DeepSeek-R1 70B, значительно превосходя традиционные графические процессоры. Хотя задержка вывода остается проблемой из-за вычислительных методов, таких как рассуждения по цепочке мыслей (CoT), которые разбивают многоэтапные задачи на промежуточные шаги, Cerebras предложила решение с помощью дистилляции моделей.

При использовании дистилляции моделей большая «модель учителя» передает свои знания меньшей «модели ученика», что облегчает проблемы развертывания. Например, модель DeepSeek-R1, дистиллированная до Llama 70B, демонстрирует минимальную потерю точности, что делает ее практичным вариантом для клиентов. Для этого процесса Cerebras использует открытые веса модели DeepSeek, размещенные на Hugging Face, что еще больше укрепляет DeepSeek в качестве ведущей модели рассуждений ИИ с открытым исходным кодом.

Эндрю Фельдман подчеркнул, что DeepSeek является важной вехой для ИИ с открытым исходным кодом, позволяя исследователям воспроизводить достижения без прямого доступа к исходному коду - требуются только параметры модели (веса). Он также подчеркнул, что экономическая эффективность DeepSeek не только потрясла индустрию ИИ, но и привлекла рост инвестиций в передовые чипы ИИ и сетевые технологии.

Вопреки мнению о том, что снижение стоимости вычислений может привести к сужению рынка, Фельдман утверждал, что снижение стоимости исторически приводит к увеличению размера рынка, как это наблюдается в случае с персональными компьютерами и смартфонами. Доступность DeepSeek согласуется с этой закономерностью, делая передовые технологии ИИ доступными для широкой аудитории.

С момента запуска публичных услуг по анализу в августе 2024 года Cerebras позиционирует себя как самого быстрого поставщика услуг по анализу ИИ в мире. В настоящее время компания предлагает дистиллированную 70-битную модель DeepSeek, поскольку более крупная 405-битная модель значительно дороже в развертывании. В то время как некоторые клиенты отдают предпочтение доступности и выбирают более компактные модели, другие готовы инвестировать в более крупные модели для повышения точности.

Источник: ithome.com
1
Показать комментарии (1)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают