Платим блогерам

Новости Software 02 марта 2023 года

Компания Microsoft представила Kosmos-1 — особую ИИ-модель, которая может анализировать содержание изображений, решать головоломки, проходить визуальные тесты на IQ и даже понимать команды на разговорном языке. По мнению специалистов, создание ИИ-системы, способной работать в текстовом, аудио- и графическом режиме (включая видеоматериалы) является ключевым шагом на пути формирования так называемого «общего искусственного интеллекта». Такому ИИ предстоит заниматься решением задач самого широкого профиля.

Принципы работы Kosmos-1 описаны в статье Language Is Not All You Need: Aligning Perception with Language Models. В данном материале исследователи детально описывают, как новая ИИ-система от Microsoft анализирует изображения, отвечает на любые вопросы о них, распознаёт и читает текст с любых картинок, проходит визуальный тест на IQ и подписывает иллюстрации.

Создание «общего искусственного интеллекта» примечательно тем, что (в теории) позволяет полностью заменить людей при выполнении любых интеллектуальных задач. Напомним, что это конечная цель OpenAI — важного партнёра Microsoft в сфере ИИ. Но Kosmos-1 является собственностью и разработкой редмондцев, сотрудники стартапа не имеют к ней отношений.

Исследователи называют Kosmos-1 «мультимодальной большой языковой моделью» (MLMM), которая умеет преобразовывать картинку в серию, как правило, текстовых «токенов». Они анализируются, а за тем текст и сопутствующие задаче элементы проходят важный процесс перобразования специальным декодером. Уже сейчас речь идёт о том, что во многих тестах Kosmos-1 обходит передовые существующие ИИ-модели.

В опубликованной и упомянутой выше статье описывался процесс прохождения теста британского психолога Джона К. Рейвена, который позволяет измерить IQ. Испытуемому демонстрируется последовательность форм с предложением продолжить её. Так вот, конкретно этот тест Kosmos-1 пока проходит с точностью 22-26 %, что не так много.

Тренировка модели Kosmos-1 велась с использованием информации из интернета — впрочем, это было очевидно. Разработчики подчёркивают, что сейчас развитие ИИ-модели находится в зачаточном состоянии, ещё нужно сделать много тестов и регулярно модернизировать алгоритм. Учёные собираются добиться улучшить Kosmos-1 таким образом, чтобы она могла вести беседы и помогать сторонним разработчикам в их работе. В будущем такую систему можно будет использовать, например, для расширения возможностей цифровых ассистентов, но сферы применения Kosmos-1 выходят далеко за эти рамки.

Социальная сеть «ВКонтакте» объявила о запуске сервиса на основе нейросети, который призван помочь пользователям в оформлении обложек для личных страниц. Как заверяют разработчики, он должен дать аудитории больше возможностей для самовыражения, а также подчеркнуть их индивидуальность.

Команда поддержки «ВКонтакте» утверждает, что нейросеть мгновенно генерирует изображения на основе интересов пользователей: их реакций, подписок на сообщества и в целом поведения на площадке. Для создания обложки нужно зайти по вот этой странице и нажать кнопку «Начать». ИИ сразу сгенерирует шесть обложек в разных стилях с учётом интересов пользователя. После чего остаётся только выбрать понравившийся вариант и нажать кнопку «Установить обложку». Изображение автоматически появится в профиле, а результатам можно поделиться через публикации или истории.

Разработчики отмечают, что в сервисе есть множество новых стилей, в которых пользователи могут получить обложки: «Супрематизм», «Футуризм», «Пуантилизм», «Мозаика», «Киберпанк» и другие. Если нейросети по объективной причине будет недостаточно информации о человеке, то она попросит добавить данные или подписаться на сообщества, которые отражают его интересы. Стоит ли это делать — решать уже вам.

Александр Тоболь, CTO ВКонтакте, вице-президент по технологиям и разработке VK:

«Обложки в профилях помогают подчеркнуть индивидуальность, выделиться и привлечь внимание аудитории к своим увлечениям. Нашим пользователям понравился такой способ самовыражения, они активно добавляют обложки в свои профили. Новая фича дополнительно расширяет возможности творчески оформить виртуальное пространство: сервис предлагает персонализированные иллюстрации для каждого человека. Нейросети «ВКонтакте» позволяют визуально продемонстрировать интересы пользователя, причём делают это стильно, оригинально и точно. На генеративной обложке может быть показано, каким спортом увлекается владелец профиля, его музыкальные предпочтения или в каких играх он залипает. Мы инвестируем в скоростные технологии, которые позволяют воспользоваться новыми продвинутыми возможностями как можно большей аудитории и при этом требуют минимальное количество ресурсов и времени, быстро решая необходимые задачи».

Напомним, обложки — это часть масштабного обновления системы профилей «ВКонтакте», которая позволяет оформить полноценную цифровую визитку и, как утверждается, развить персональный бренд.

Издание «Коммерсантъ» со ссылкой на данные ассоциации «Руссофт» сообщает, что объём экспортных продаж российских софтверных компаний по итогам прошлого года снизился на 12-17 % до $ 8,4 млрд.

Журналисты отмечают, что в сегодняшних непростых условиях разработчики программного обеспечения пытаются наладить работу с «относительно дружественными» регионами, например странами Латинской Америки и Юго-Восточной Азии. Любопытно, что разработчики отечественного ПО также пытаются сохранить поставки западным партнёрам через формально независимых третьих лиц.

Снижение объёма экспортных российских софтверных компаний объясняется вынужденным уходом с европейского и американского рынка из-за санкций. Аналитики из «СерчИнформ» отмечают, что для разработчиков указанные рынки и раньше были непростыми для продаж, а за прошлый год интерес к ним со стороны российских компаний ещё больше охладел.

Один из руководителей крупной компании заявил, что европейские контрагенты продолжают проявлять интерес к покупке российского софта, не смотря на санкции: «Я не буду называть компании и категории этого ПО, но могу сказать, что ряд российских разработчиков уже учредили за рубежом формально не связанные с ними структуры и продолжают поставки своих решений».

Сейчас разработчики и поставщики отечественного программного обеспечения заняты перенастройкой каналов экспорта. Сейчас речь идёт об усилении роли СНГ, Южной и Восточной Азии, Ближнего Востока. Глава «Руссофта» по этому поводу заявляет следующее: «Южная и Восточная Азия привлекает огромностью национальных рынков. Самыми крупными в этом макрорегионе являются рынки Индии и Китая. Интерес к рынкам Африки, а также Южной и Центральной Америки также растёт, но шансы значительно увеличить там продажи за короткий срок невелики».

Российские разработчики продолжают сохранять оптимизм в отношении возможности для завоевания международного рынка ПО. Например, директор практики «Стратегия трансформации» компании «Рексофт Консалтинг» Александр Богомолов заявляет по этому поводу следующее: «Прежде всего, надо ориентироваться на наиболее перспективные технологии. Например, у российских игроков есть возможность проявить себя в нише платформенного ПО для решений промышленного искусственного интеллекта: на глобальных рынках рост этого сегмента превысил 30%».

А уже в Минцифры считают, что за рубежом сейчас востребованы российские решения в области «цифровизации транспортной логистики, сельскохозяйственной, добывающей промышленности». В министерстве отметили, что сейчас есть сложности с транзакциями для открытия и поддержки бизнеса, а также вывода прибыли в Россию.

Что касается стратегических разработок, представленных осенью прошлого года, то в покупке российских продуктов и услуг, в том числе в области безопасности, заинтересованы 18 стран. Среди них Китай, Бразилия, Индия, Турция и Саудовская Аравия. Но каждый рынок имеет свою специфику, например, законодательную, а ключевые проблемы, препятствующие наращиванию экспорта, по-прежнему лежат в политической плоскости и требуют «административной поддержки».