языковые модели
всего материалов по тегу -
25
Alibaba представила языковую модель Qwen3-Max с триллионом параметров
Компания Alibaba представила новую крупную языковую модель Qwen3-Max. Масштабная система насчитывает более триллиона параметров и обучена на 36 триллионах токенов.
Alibaba представила модель ИИ Qwen-3-Max-Preview с триллионом параметров для борьбы с OpenAI
Китайский технологический гигант Alibaba представил новую крупную языковую модель Qwen-3-Max-Preview. Модель содержит более триллиона параметров и позиционируется как конкурент разработкам OpenAI и Google.
Марко Элез из Doge Denizen опубликовал ключ к доступу 52 языковых моделей xAI стоимостью $200 млн
Компания GitGuardian, занимающаяся мониторингом безопасности, обнаружила утечку. Код с ключом был удален после уведомления Элеза, но сам ключ продолжает работать.
Исследование выявило системные предубеждения в моральных советах ИИ
Новое исследование показало, что языковые модели ИИ демонстрируют системные предубеждения при решении моральных дилемм. Ученые обнаружили, что ИИ чаще выбирает бездействие и склонен к непоследовательным ответам.
ИИ-модели научились вырабатывать язык и нормы поведения самостоятельно без подсказок людей
Ученые продемонстрировали, что языковые модели могут коллективно формировать общие нормы и язык. Это происходит в децентрализованных условиях — без явных инструкций и без знания структуры группы.
В китайских отраслевых источниках начинают циркулировать слухи о выходе DeepSeek R2
В сети появились данные о новой модели DeepSeek R2, которая может быть на 97% дешевле GPT-4. Модель полностью обучали на китайских чипах Huawei Ascend.
Разработана новая архитектура ИИ для обычных процессоров, снижающая потребление памяти и энергии
Специалисты из Microsoft и Китайской академии наук разработали принципиально новую архитектуру ИИ, которая работает на обычных процессорах. Технология использует 1-битные вычисления, снижая энергопотребление в разы.
MIT: ИИ не способен формировать устойчивые ценности и убеждения
Ученые из США доказали, что ИИ не формирует устойчивых убеждений. Поведение нейросетей зависит от случайных факторов и формулировок запросов.
Новая языковая модель Llama 4 выйдет в конце апреля
Компания Meta (признана экстремистской, ее деятельность запрещена на территории России) планирует выпустить новую версию языковой модели Llama 4 уже в этом месяце. Однако внутренние тесты выявили необходимость доработки математических функций и логических способностей системы.
Tencent AI Lab внедряет новый метод тонкой настройки для языковых моделей
Специалисты из Tencent AI Lab представили новый метод неконтролируемой тонкой настройки префиксов (UPFT), который значительно улучшает возможности рассуждений в языковых моделях. Этот подход фокусируется на первых токенах ответов, что позволяет сократить вычислительные затраты и повысить эффективнос...
Даже 0,001% неверных обучающих данных ставит под угрозу безопасность языковых моделей ИИ
Даже самые незначительные ошибки в данных могут манипулировать языковыми моделями ИИ, такими как ChatGPT или Claude, что сопряжено с рисками, особенно в медицинской сфере, как показывает исследование Нью-Йоркского университета.
Выпущена новая версия языка программирования Ruby 3.4 с модульным механизмом сборки мусора
Также в данной версии введён новый параметр блока `it`, который упрощает работу с блоками без необходимости указывать имя переменной.
Почему ИИ не может написать "клубника" на английском: загадка языковых моделей
Несмотря на свои впечатляющие способности, такие как написание эссе и решение уравнений, ИИ, как оказывается, не может точно определить количество букв в слове "клубника" в английском языке.
Искусственный интеллект генерирует юмор, не уступающий профессионалам
Эксперименты показали, что ИИ обгоняет людей в создании шуток
Исследователи продемонстрировали ИИ-модель, потребляющую всего около 13 Вт
Открытие нового пути в искусственном интеллекте с минимальным энергопотреблением.
DeepL запустила умного помощника Write Pro для написания писем
DeepL Write Pro предоставляет на выбор несколько стилей письма.
Apple представляет языковые модели OpenELM на Hugging Face
Apple анонсировала выпуск восьми малых языковых моделей с открытым исходным кодом OpenELM, теперь доступных для разработчиков на платформе Hugging Face. Модели обещают повышенную эффективность в текстовых задачах, таких как написание электронных писем, и поддержку малых языков.
OpenAI открывает офис в Токио и выпускает версию GPT-4 для японского языка
Токийский офис OpenAI расширяет присутствие компании в Азии. Новая версия GPT-4 оптимизирована для японского языка, повышая скорость и точность работы с текстами.
Opera получает возможность загружать и запускать большие языковые модели
Интеллектуальный алгоритм работает локально, не требуя отправки данных на внешние серверы
Apple показала языковую модель нового поколения, способную интерпретировать фотографии
MM1 способен распознавать объекты, определять элементы на изображениях, обладает здравым смыслом и знанием о повседневных предметах
Google работает над улучшенной версией ИИ-помощника Bard Advanced по платной подписке
Есть ряд преимуществ.
Sapeon анонсировала новый чип X330 для ускорения работы языковых моделей
Южнокорейский стартап Sapeon анонсировал новый чип X330, который обещает 2-кратное увеличение производительности для языковых моделей по сравнению с конкурентами
Библиотека NVIDIA TensorRT-LLM для ускорения языковых моделей теперь доступна на Windows
Ранее библиотека была анонсирована для центров обработки данных.
Yandex GPT версии 2 способна простыми словами объяснить сложные термины для детей
Российский поисковик Яндекс сделал большой шаг в развитии отечественных нейросетей и рассказал о новой версии своего аналога знаменитого ChatGPT
ChatGPT от OpenAI - невероятный прорыв или угроза для рабочих мест
Мне посчастливилось работать над проектом, который использует API от OpenAI. Однако это вызывает скорее опасение, чем веру в светлое будущее.


Сейчас обсуждают