Китайская компания DeepSeek, специализирующаяся на развитии искусственного интеллекта (ИИ), представила предварительную версию своей новой модели – DeepSeek V4, которая, по заявлениям компании, заметно сокращает разрыв с ведущими мировыми ИИ-системами.
Модель выходит в двух вариантах — V4 Flash и V4 Pro. Оба построены на архитектуре mixture-of-experts и поддерживают контекст длиной до 1 миллиона токенов, что позволяет обрабатывать крайне большие документы, базы кода и сложные запросы в рамках одного диалога.
Источник изображения: ChatGPTПо характеристикам DeepSeek V4 Pro достигает масштаба до 1,6 триллиона параметров, что делает её одной из крупнейших открытых моделей на рынке. При этом активируется только часть параметров за один запрос, что снижает вычислительные затраты и делает систему более эффективной в использовании.
Компания утверждает, что новая модель существенно приблизилась к уровню ведущих решений от OpenAI и Google в задачах логического рассуждения, программирования и анализа текста. Особенно подчёркивается улучшение качества ответов при сохранении низкой стоимости использования. При этом пока сложно сказать, что DeepSeek V4 приблизился к уровню Claude Code, в том числе из-за ограниченной поддержки мультимедиа.
Несмотря на это, запуск DeepSeek V4 усиливает конкуренцию на рынке ИИ. Компания делает ставку на открытые веса, масштабируемость и низкую стоимость, что также делает её привлекательной для отдельной категории разработчиков.

