Платим блогерам
Блоги
hilnur20012
Компании планируют добавить ИИ в офисные приложения для упрощения работы с данными

реклама

Google и Microsoft поставили перед собой задачу избавить компьютеры от рутинной работы, предоставив инструменты искусственного интеллекта нового поколения в качестве дополнения к существующим сервисам.

16 марта Microsoft объявила, что система Copilot на базе искусственного интеллекта скоро будет представлена в ее приложениях Microsoft 365, включая Word, Excel, PowerPoint, Outlook и Teams.

реклама

Эта новость появилась примерно через два дня после того, как Google опубликовала в блоге свои планы по внедрению ИИ в свои приложения Workspace, такие, как Docs, Sheets, Slides, Meet и Chat.

В совокупности миллионы людей используют эти приложения каждый день. Поддержка их с помощью искусственного интеллекта могла бы значительно повысить производительность. Однако не стоит забывать и о безопасности.

Появление генеративного ИИ

До недавнего времени искусственный интеллект в основном использовался для задач категоризации и идентификации, таких как распознавание номерного знака с помощью дорожной камеры. Генеративный ИИ позволяет пользователям создавать новый контент, применяя алгоритмы глубокого обучения к большим данным. ChatGPT и DALL-E, среди прочих, уже успели стать очень популярными.

Теперь Microsoft и Google нашли более конкретный способ внедрить генеративный ИИ в офисы и домашние ПК. Как и другие инструменты генеративного ИИ, Copilot и Workspace AI построены на больших языковых моделях (LLM), обученных на огромных объемах данных. Благодаря этому обучению системы «усвоили» множество правил и шаблонов, которые можно применять к новому контенту и контекстам.

Microsoft Copilot тестируется только у 20 клиентов, а подробности о доступности и ценах будут опубликованы «в ближайшие месяцы».Copilot будет интегрирован во все приложения, чтобы ускорить выполнение утомительных или повторяющихся задач. Например, это:

  • помощь пользователям в написании, редактировании и обобщении документов Word
  • превращение идей или резюме в полноценные презентации PowerPoint
  • определение тенденций данных в Excel и быстрое создание визуализации
  • "синтезирование и управление" вашим почтовым ящиком Outlook
  • предоставление сводки собраний Teams в режиме реального времени
  • объединение данных из разных документов, презентаций, электронной почты, календаря, заметок и контактов для написания электронных писем и подвода итогов чатов.

Если предположить, что он эффективно выполняет эти задачи, Copilot станет масштабным обновлением оригинального Office Assistant от Microsoft.

Google Workspace AI предложит аналогичные возможности пользователям с платной подпиской.

Что внутри?

Microsoft описала Copilot как «сложный механизм обработки и оркестровки, работающий за кулисами, чтобы объединить возможности LLM, включая GPT-4 […]».

Точно неизвестно, на каких данных был обучен сам GPT-4. Известно только то, что это было много данных, взятых из Интернета и лицензированных, согласно OpenAI.

Google Workspace AI построен на PaLM (языковая модель Pathways), которая была обучена на сочетании книг, статей Википедии, новостных статей, исходных кодов, отфильтрованных веб-страниц и разговоров в социальных сетях. Обе системы интегрированы в существующую облачную инфраструктуру. Это означает, что все данные, к которым они применяются, уже будут в сети и будут храниться на серверах компании.

Инструментам потребуется полный доступ к соответствующему контенту, чтобы предоставлять контекстуализированные ответы. Например, Copilot не может преобразовать 16-страничный документ Word в одну страницу маркеров без предварительного анализа текста.

В связи с этим возникает вопрос: будет ли информация пользователей использоваться для обучения базовых моделей? В связи с этим Microsoft заявила: «Большие языковые модели Copilot не обучаются на клиентском контенте или отдельных подсказках».

Google заявила: «[…] личные данные хранятся в тайне и не используются в более широком учебном плане базовой модели». Эти утверждения предполагают, что сам 16-страничный документ не будет использоваться для обучения алгоритмов. Вместо этого Copilot и Workspace AI будут обрабатывать данные в режиме реального времени.

Учитывая спешку с разработкой таких инструментов ИИ, может возникнуть соблазн обучать такие инструменты на «реальных» данных, специфичных для клиентов, в будущем. На данный момент, однако, кажется, что это явно исключено.

Проблемы ИИ

Как многие люди заметили после выпуска ChatGPT, текстовые инструменты генеративного ИИ склонны к алгоритмической предвзятости. Эти проблемы будут распространяться на новые инструменты от Google и Microsoft.

Результаты генеративных инструментов ИИ могут быть пронизаны неточностями и предубеждениями. Собственный чат-бот Microsoft Bing, который также работает на GPT-4, в начале этого года подвергся критике за возмутительные заявления.

Смещение возникает, когда большие объемы данных обрабатываются без надлежащего отбора или понимания обучающих данных, а также без надлежащего контроля над процессами обучения.

Например, большая часть онлайн-контента написана на английском языке, который, вероятно, является основным языком, на котором говорят люди (в основном белые и мужчины), разрабатывающие инструменты искусственного интеллекта. Это скрытое предубеждение может повлиять на стиль письма и языковые конструкции, понятные и впоследствии воспроизводимые системами, управляемыми ИИ.

На данный момент трудно точно сказать, как проблемы предвзятости могут проявиться в Copilot или Workspace AI. Например, системы могут просто не работать так же эффективно для людей в неанглоязычных странах или с разными стилями английского языка.

Вопросы безопасности

Одной из основных уязвимостей в инструментах искусственного интеллекта Microsoft и Google является то, что они могут значительно облегчить киберпреступникам кражу данных.

Если раньше преступнику, возможно, приходилось просматривать сотни файлов или электронных писем, чтобы найти определенные данные, теперь они могут использовать функции искусственного интеллекта для быстрого сопоставления и извлечения того, что им нужно.

Кроме того, поскольку пока нет указаний на то, что доступны офлайн-версии, любой, кто хочет использовать эти системы, должен будет загрузить соответствующий контент в Интернете. Данные, загруженные онлайн, подвергаются большему риску взлома, чем данные, хранящиеся только на вашем компьютере или телефоне.

Наконец, с точки зрения конфиденциальности, не особенно вдохновляет появление дополнительных возможностей, с помощью которых крупнейшие корпорации мира могут собирать и синтезировать наши данные.

Источник: techxplore.com
+
Написать комментарий (0)

Популярные новости

Сейчас обсуждают