Часть проблемы, конечно же, заключается в том, что многие из самых передовых технологий сложны, и воплотить их в жизнь может быть очень сложно. Но еще более распространенная проблема заключается в том, что ранее существовавшие требования не объясняются полностью, или количество необходимых шагов может оказаться гораздо более сложным, чем кажется на первый взгляд.
Проще говоря, «дьявол кроется в деталях».
Это относится ко многим облачным технологиям и технологиям искусственного интеллекта. Идеи продукта высокого уровня, такие как возможность быстрого анализа любого типа данных, чтобы помочь создавать модели на основе искусственного интеллекта (ИИ) или машинного обучения (МО) с использованием новых типов аппаратных ускорителей, обсуждались годами.
Однако, как ясно дал понять Google в нескольких объявлениях на своем мероприятии Cloud Next, есть много важных деталей, которые должны быть на месте, чтобы эти идеи стали реальностью.
Начнем с того, что не все инструменты анализа данных и платформы данных могут работать с любым типом данных. Вот почему так важна возможность импорта или приема новых и различных типов данных формата в более широкий спектр инструментов аналитики. Открытие возможности для платформ данных, таких как Elastic, получать доступ к данным, хранящимся в Google Cloud, и Google, обеспечивающий поддержку Elastic в своей недавно расширенной линейке инструментов бизнес-аналитики Looker — это лишь два из многих объявлений, связанных с открытыми данными, сделанных в Cloud.
Точно так же разные типы данных часто хранятся в разных форматах, и инструменты аналитики должны специально включать поддержку этих структур данных, чтобы сделать их более полезными для более широкого круга пользователей и разработчиков приложений.
Например, в растущей области хранилищ данных, где большие «озера» неструктурированных данных, таких как видео и аудио, можно запрашивать с помощью тех инструментов, которые можно найти в хранилищах структурированных данных, формат таблиц Apache Iceberg с открытым исходным кодом становится все более популярным.
Вот почему Google добавила поддержку этого и других форматов, включая Delta и Hudi, в свой механизм хранения BigLake и добавила поддержку анализа неструктурированных данных в свои инструменты анализа данных BigQuery. Это не только обеспечивает дополнительную гибкость, но также означает, что неструктурированные данные могут использовать другие инструменты Google Cloud Platform (GCP) Big Query, включая функции машинного обучения, такие как распознавание речи, компьютерное зрение, обработка текста и многое другое.
Еще одна важная область развития связана с использованием различных типов аппаратных ускорителей для повышения производительности модели ИИ. Например, Google создала несколько поколений TPU (модулей обработки тензоров), которые предлагают важные преимущества для таких приложений, как обучение модели искусственного интеллекта или логический вывод. Кроме того, было много недавних объявлений от известных полупроводниковых компаний, таких как Intel, AMD, Nvidia и Qualcomm, а также множество стартапов в области микросхем, ориентированных на эту растущую область.
Как и следовало ожидать, каждая из этих компаний-производителей чипов использует разные методы для ускорения моделей AI и ML. Что не так ясно, так это то, что методы, необходимые для написания программного обеспечения или создания моделей для различных ускорителей, также являются собственностью. В результате разработчикам программного обеспечения и создателям моделей AI/ML может быть сложно использовать преимущества этих различных чипов из-за того, как сложно может быть изучение всех этих уникальных подходов.
Чтобы решить эту проблему, пара более интригующих объявлений Google от Cloud Next — это запуск нового отраслевого консорциума под названием OpenXLA Project и дебют новых программных инструментов с открытым исходным кодом, предназначенных для упрощения процесса работы с несколькими различными типами аппаратных ускорителей.
OpenXLA предназначен для повышения гибкости выбора, который есть у разработчиков AI/ML, обеспечивая связь между большинством популярных интерфейсных фреймворков, используемых для построения моделей AI, включая TensorFlow, PyTorch и JAX, и множеством различных аппаратных ускорителей. Первоначальные выпускаемые программные инструменты включают обновленный компилятор XLA и портативный набор вычислительных операций машинного обучения под названием StableHLO.
Компании, которые также присоединились к инициативе Google, включают Intel, Amazon Web Services, AMD, Nvidia, Arm, Meta и другие. Включение Intel интересно, потому что во многих отношениях цель проекта OpenXLA аналогична собственному OneAPI Intel, который нацелен на то, чтобы позволить разработчикам использовать несколько типов вычислительных архитектур Intel, таких как ЦП, графические процессоры и ускорители искусственного интеллекта Habana Gaudi, без необходимости учиться программировать для каждого из различных типов чипов. OpenXLA выводит эту концепцию на общеотраслевой уровень и, благодаря включению многих ключевых игроков в области облачных вычислений, должна открыть ряд важных новых возможностей и ускорить внедрение аппаратных ускорителей.
Как и во многих других объявлениях, сделанных Google на Cloud Next, реальные преимущества проекта OpenXLA и связанных с ним инструментов потребуют некоторого времени, прежде чем они окажут существенное влияние. В общей картине тенденций технологической индустрии эти инструменты сами по себе могут показаться немного скромными. Однако в совокупности они представляют собой очень важные шаги вперед и свидетельствуют об усилиях Google, направленных на то, чтобы сделать свои инструменты полезными для более широкой аудитории людей.
Они также делают сильный акцент на инструменты с открытым исходным кодом и желание создать свою облачную платформу Google и связанные с ней предложения более прозрачными и гибкими. Процесс использования всех технологических инструментов, которые предлагает Google, по-прежнему, несомненно, сложен, но с обширной коллекцией объявлений, которые компания представила на Cloud Next, становится ясно, что эволюция компании как крупного поставщика облачных услуг продолжает развиваться.