языковые модели | Теги | Overclockers.ru - крупнейший информационный сайт России

Global_Chronicles 14 апреля 2026

GuppyLM — компактная модель ИИ с открытым кодом и упрощенным обучением. Ее можно запустить и обучить за несколько минут через браузер.

This_is_the_way 3 марта 2026

Японские ученые наделили языковые модели способностью перебивать, молчать или вмешиваться вне очереди. Такое поведение повысило точность ответов при решении сложных задач по сравнению с обычными вежливыми чат-ботами.

This_is_the_way 28 января 2026

Исследование показало, что мозг обрабатывает речь поэтапно — от простых слов к построению общего смысла. Эта иерархическая динамика удивительно точно повторяет работу слоёв в больших языковых моделях искусственного интеллекта, таких как GPT.

Global_Chronicles 25 сентября 2025

Компания Alibaba представила новую крупную языковую модель Qwen3-Max. Масштабная система насчитывает более триллиона параметров и обучена на 36 триллионах токенов.

Global_Chronicles 8 сентября 2025

Китайский технологический гигант Alibaba представил новую крупную языковую модель Qwen-3-Max-Preview. Модель содержит более триллиона параметров и позиционируется как конкурент разработкам OpenAI и Google.

Astra_news 15 июля 2025

Компания GitGuardian, занимающаяся мониторингом безопасности, обнаружила утечку. Код с ключом был удален после уведомления Элеза, но сам ключ продолжает работать.

Global_Chronicles 5 июля 2025

Новое исследование показало, что языковые модели ИИ демонстрируют системные предубеждения при решении моральных дилемм. Ученые обнаружили, что ИИ чаще выбирает бездействие и склонен к непоследовательным ответам.

Global_Chronicles 18 мая 2025

Ученые продемонстрировали, что языковые модели могут коллективно формировать общие нормы и язык. Это происходит в децентрализованных условиях — без явных инструкций и без знания структуры группы.

Global_Chronicles 27 апреля 2025

В сети появились данные о новой модели DeepSeek R2, которая может быть на 97% дешевле GPT-4. Модель полностью обучали на китайских чипах Huawei Ascend.

Global_Chronicles 23 апреля 2025

Специалисты из Microsoft и Китайской академии наук разработали принципиально новую архитектуру ИИ, которая работает на обычных процессорах. Технология использует 1-битные вычисления, снижая энергопотребление в разы.

Global_Chronicles 10 апреля 2025

Ученые из США доказали, что ИИ не формирует устойчивых убеждений. Поведение нейросетей зависит от случайных факторов и формулировок запросов.

Global_Chronicles 5 апреля 2025

Компания Meta (признана экстремистской, ее деятельность запрещена на территории России) планирует выпустить новую версию языковой модели Llama 4 уже в этом месяце. Однако внутренние тесты выявили необходимость доработки математических функций и логических способностей системы.

Global_Chronicles 2 марта 2025

Специалисты из Tencent AI Lab представили новый метод неконтролируемой тонкой настройки префиксов (UPFT), который значительно улучшает возможности рассуждений в языковых моделях. Этот подход фокусируется на первых токенах ответов, что позволяет сократить вычислительные затраты и повысить эффективнос...

kosmos_news 14 января 2025

Даже самые незначительные ошибки в данных могут манипулировать языковыми моделями ИИ, такими как ChatGPT или Claude, что сопряжено с рисками, особенно в медицинской сфере, как показывает исследование Нью-Йоркского университета.

S_Miru_Po_Provodku 27 декабря 2024

Также в данной версии введён новый параметр блока `it`, который упрощает работу с блоками без необходимости указывать имя переменной.

Global_Chronicles 28 августа 2024

Несмотря на свои впечатляющие способности, такие как написание эссе и решение уравнений, ИИ, как оказывается, не может точно определить количество букв в слове "клубника" в английском языке.

TheTechBlog 5 июля 2024

Эксперименты показали, что ИИ обгоняет людей в создании шуток

TheTechBlog 28 июня 2024

Открытие нового пути в искусственном интеллекте с минимальным энергопотреблением.

TheTechBlog 26 апреля 2024

DeepL Write Pro предоставляет на выбор несколько стилей письма.

news_from_Alex 26 апреля 2024

Apple анонсировала выпуск восьми малых языковых моделей с открытым исходным кодом OpenELM, теперь доступных для разработчиков на платформе Hugging Face. Модели обещают повышенную эффективность в текстовых задачах, таких как написание электронных писем, и поддержку малых языков.

TheTechBlog 16 апреля 2024

Токийский офис OpenAI расширяет присутствие компании в Азии. Новая версия GPT-4 оптимизирована для японского языка, повышая скорость и точность работы с текстами.

Zelikman 5 апреля 2024

Интеллектуальный алгоритм работает локально, не требуя отправки данных на внешние серверы

Zelikman 19 марта 2024

MM1 способен распознавать объекты, определять элементы на изображениях, обладает здравым смыслом и знанием о повседневных предметах

Игнатий Колыско 5 января 2024 в 17:30

Есть ряд преимуществ.

TheTechBlog 19 ноября 2023

Южнокорейский стартап Sapeon анонсировал новый чип X330, который обещает 2-кратное увеличение производительности для языковых моделей по сравнению с конкурентами