Платим блогерам
Блоги
Fantoci
Стартапы вроде Cerebras, Groq и d-Matrix, а также традиционные производители процессоров — AMD и Intel — начали разработку специализированных чипов для инференса.

Искусственный интеллект продолжает изменять мир, в основе этих перемен лежат специализированные компьютерные чипы. До сих пор ключевую роль на технологическом рынке играла Nvidia, разработавшая передовые графические процессоры (GPU), которые стали фундаментом для обучения мощных ИИ-систем. Однако уникальные характеристики этих чипов, идеально подходящих для сложных вычислений, делают их менее эффективными для выполнения повседневных задач искусственного интеллекта, таких как генерация текстов или изображений.

Может быть интересно

Дело в том, что "вывод" - процесс, когда обученная нейросеть выдает ответ на запрос пользователя - имеет иные требования к вычислительной мощности. Именно здесь GPU, оптимизированные для "тренировки", оказываются избыточными и энергозатратными. Этот недостаток GPU открывает возможности для новых игроков на рынке — компаний, разрабатывающих чипы для инференса. Такие устройства специально адаптированы для эксплуатации готовых ИИ-продуктов, предлагая более экономичное решение. Это направление набирает популярность среди стартапов и таких технологических гигантов, как AMD и Intel.

Разработка ИИ-модели начинается с этапа обучения, когда система анализирует огромные массивы данных, чтобы выявить закономерности и «обучиться» на их основе. Этот процесс требует колоссальных вычислительных мощностей, и GPU справляются с этой задачей лучше всего благодаря возможности параллельной обработки огромного числа операций.

Однако на этапе инференса — задействования уже обученной модели — задачи становятся проще. Инференс предполагает, что ИИ анализирует поступающие данные и использует уже накопленные знания для генерации ответа. Например, когда пользователь задает вопрос чат-боту или просит создать изображение, система работает в режиме инференса. Использование мощных GPU для таких задач нередко оказывается неоправданно дорогим, что открывает двери для новых решений.

«Инференс требует меньших ресурсов по сравнению с обучением. Это словно сравнивать тяжелую работу с более легкой, но повседневной», — поясняет аналитик Forrester Алвин Нгуен.

Среди компаний, стремящихся занять свою нишу на рынке чипов для инференса, выделяются стартапы Cerebras, Groq и d-Matrix. В это же время традиционные конкуренты Nvidia, такие как AMD и Intel, активно развивают свои продукты, чтобы предложить более экономную альтернативу.

Сид Шет, генеральный директор и соучредитель компании d-Matrix, держит в руках чип d-Matrix Corsair во время интервью в Санта-Кларе.

D-Matrix, основанная в 2019 году, недавно представила свой первый чип для инференса под названием Corsair. По словам генерального директора компании Сида Шета, стартап столкнулся с большими трудностями: многие считали, что рынок уже насыщен. Однако сегодня d-Matrix уверена в своей стратегии.

Сид Шет сравнивает этапы работы ИИ с жизненным циклом человека. «Первую часть жизни мы посвящаем обучению — это как этап обучения ИИ. А затем мы применяем эти знания в работе, стремясь быть максимально эффективными. Это и есть инференс», — объясняет он.

Чип Corsair состоит из двух процессоров, каждый из которых включает четыре мини-чипа, произведенных тайваньской компанией TSMC. Такой дизайн позволяет устройствам быть более энергоэффективными и устойчивыми к перегреву. Проектирование ведется в Кремниевой долине, сборка — на Тайване, а тестирование проходит в США. Испытания занимают до шести месяцев, и в случае обнаружения ошибок чипы отправляют обратно на доработку.

На производственных мощностях d-Matrix царит атмосфера высокотехнологичного стартапа: лаборатории заполнены оборудованием, материнскими платами и кабелями, а рядом расположен серверный зал с системами охлаждения.

Если крупные корпорации, такие как Amazon, Google и Microsoft, продолжают инвестировать в дорогие GPU для развития ИИ, то чипы для инференса ориентированы на более широкий рынок. Например, крупные предприятия могут использовать такие решения для внедрения ИИ в своей работе без необходимости создавать собственную инфраструктуру.

Сид Шет отмечает, что особый интерес может вызвать использование инференса в видео-генерации и других прикладных задачах. «Многие компании хотят интегрировать ИИ на базе собственных данных, и чипы для инференса делают это возможным», — говорит он.

Кроме того, новые разработки позволяют запускать инференс не только в масштабных дата-центрах, но и на локальных устройствах: настольных компьютерах, ноутбуках и смартфонах.

Улучшение технологий инференса важно не только для бизнеса, но и для общества в целом. Более эффективные чипы позволяют существенно снизить затраты на эксплуатацию ИИ и сократить потребление энергии. Это особенно актуально в условиях растущей озабоченности экологическими проблемами.

«Главный вызов — найти баланс между развитием технологий и сохранением планеты», — считает Шет. Он также подчеркивает, что далеко не все компании готовы вкладывать средства в создание универсальных ИИ-моделей. Для многих из них чипы для инференса станут более доступным и рациональным решением.

Рынок чипов для искусственного интеллекта вступает в новую фазу развития. Если этап обучения остается в центре внимания, то инференс постепенно выходит на первый план, открывая огромные возможности для бизнеса и технологий. В то время как Nvidia продолжает лидировать в области GPU, конкуренты разрабатывают инновационные решения, способные не только изменить рынок, но и сделать искусственный интеллект более доступным и экологичным.

+
Написать комментарий (0)
Теперь в новом формате

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Сейчас обсуждают