IBM Telum Process — это первый нейронный процессор IBM. Он был спроектирован таким образом, чтобы дать возможность использовать выводы глубокого обучения при рабочих нагрузках предприятия в режиме реального времени, что особенно актуально для борьбы с мошенничеством. Это стало возможно благодаря новой архитектуре чипа, поддерживающей аппаратное ускорение работы алгоритмов искусственных нейронных сетей прямо во время выполнения транзакций.
Существует множество трудноформализуемых задач, которые невозможно эффективно решить алгоритмически даже с применением современных мощных компьютеров, но возможно смоделировать с помощью нейронных сетей. Чем больше слоев и элементов в каждом слое нейросети, тем более сложные функции она способна описать. Так называемые мягкие вычисления с помощью нейросетевых технологий имеют ряд преимуществ над традиционными математическими методами. Например, нейронные сети эффективнее работают с большим числом входных параметров и лучше выявляют нелинейные закономерности в сильно зашумленных неоднородных данных.
Нейросети применяют во множестве сфер. Наиболее популярные примеры — это распознавание объектов и людей на ваших фотографиях в облачных хранилищах или таргетинг рекламы по вашим запросам в интернете. Однако существуют и более серьезные сферы применения искусственного интеллекта: для военных целей или для обеспечения безопасности работы финансовых учреждений, вроде банков. С помощью ИИ уже сейчас решают как задачи классической безопасности (распознавание образов на камерах наблюдения), так и задачи конкретно финансовой безопасности (отслеживание подозрительных финансовых сделок и мошеннических операций).
Все уже наслышаны про использование машинного обучения для выявления подозрительных личностей по паттернам их поведения и мимике их лиц. Банки, казино, музеи, государственные учреждения — главные заказчики подобных систем. Системы обеспечения финансовой безопасности на базе ИИ гораздо реже на слуху, однако они тоже уже активно применяются.
Например, организация HNC Software Inc. разработала ПО Falcon, позволяющее обнаруживать широкий спектр махинаций с кредитными и дебетовыми картами. Система Falcon обучается типичному поведению клиентов и мониторит соотношения между операциями, выявляя подозрительные. Семейство систем PRISM от компании Nestor для обнаружения мошенничества с банковскими картами также созданы с применением нейросетевых технологий. ИИ в основе этих систем был обучен на выборке из более чем полумиллиона транзакций с различными типами карт. Аналогичные решения были разработаны фирмой ITC для отслеживания операций с кредитными картами Visa.
Почему же тогда мы все чаще слышим о случаях мошенничества с банковскими картами и счетами людей? Проблема на столько масштабная, что о ней говорят уже даже по федеральным каналам во всех странах. Короткий ответ: системы распознавания подозрительных паттернов на камерах работают в реальном времени, а системы обнаружения мошеннических операций — нет. Причина кроется в том, что на самом деле эти задачи достаточно сильно отличаются, и нейросети в них используются различным образом.
Нейронные сети используют как для «предсказания» (prediction), так и для получения «вывода» (inference). В обоих случаях вначале с помощью нейросеток ищут модель, которая выявит взаимосвязь между независимыми переменными и результатом. Разница в том, как используется полученная модель:
Поскольку вывод и предсказание преследуют разные цели, то и используются они в разных задачах.
Задачи, связанные с получением вывода, находятся больше в области статистики. Когда у нас есть небольшой набор входных параметров (скажем, около десяти; например, возраст, пол и т. д.) и, по сути, всего один простой результат да или нет (в смысле, это правильный набор или нет). Нейронные сети здесь используются для поиска и построения моделей, описывающих взаимосвязи между переменными, а также для проверки новых данных на реалистичность.
Задачи, связанные с предсказанием, чаще лежат в области машинного обучения. В них зачастую большой набор входных переменных (порядка сотен и тысяч; например, цвета пикселей картинки), а результатом может быть как простой, так и сложный ответ (например, марка автомобиля). И зачастую абсолютно неважно какие взаимосвязи в данных выявит для себя нейронная сеть, главное, чтобы она дала модель, эффективно предсказывающую результат.
В сфере безопасности, как и в других, существуют задачи и первого, и второго типа. Распознавание лиц на камерах типичный пример использования машинного обучения для предсказания. В то время как контроль транзакций, расчет возможного кредита, выявление убыточных сделок — задачи скорее из области статистики, требующие не только предсказаний, но и постоянного всестороннего анализа. Здесь нейросети скорее нужны для получения полноценных выводов и построения моделей.
Во обоих типах задач получение данных моделей связано с предварительным обучением нейронных сеток. Однако обучение нейросети — это ресурсозатратный процесс. Например, для обучения одной из китайских моделей распознавания речи Baidu потребовалось не только четыре терабайта обучающих данных, но и 20 экзафлопс вычислений — это 20 квинтиллионов (миллиард миллиардов) математических операций.
В процессе обучения происходит калибровка всех весов связей в нейронной сетке, но менее громоздкой она от этого не становится. Стоит еще учесть большие затраты на перемещение и хранение данных, с которыми ей предстоит работать. При современных технологиях работа такой программы в реальном времени на сервере может быть экономически оправдана далеко не для всех целей. А для целого ряда задач, где поступающие данные обновляются слишком быстро, построение таких систем просто технически нереализуемо.
С другой стороны, уже давно известно, что алгоритмы ИИ далеко не первый год сортируют по лицам сделанные нами фотографии локально прямо на наших девайсах. Причем они работают в фоне и довольно оперативно на обыкновенных компьютерах и смартфонах. Значит существуют методы, как получить из предварительно обученной нейросети что-то вроде быстрого и легкого приложения, которое будет помнить результат обучения и эффективно работать с новыми данными.
Процесс упрощения нейронной сети называется вербализацией. Существует два основных подхода как модифицировать уже обученную, но все еще громоздкую сетку так, чтобы увеличить скорость ее работы и уменьшить задержки. Прореживание (pruning) и функциональная замена (functional replacement).
В результате получается гораздо более простая программа, являющаяся существенно упрощенной предварительно обученной нейронной сеткой, частично или даже полностью замененной обычными функциями. Это уже можно запустить на смартфоне. Данный алгоритм способен быстро и эффективно прогнозировать результат и давать простой ответ (вроде: кошка это или нет), но ничего более он уже не может.
По сути, это сжатие с потерями качества, похожее на сжатие цифрового изображения. Дизайнер изначально работает над огромным красивым изображением с разрешением миллион на миллион пикселей. А, перед тем как выложить картинку в интернет, сжимает ее в JPEG. Разрешение и качество станут меньше, но почти неотличимыми для человеческого глаза от оригинала. Так же и алгоритм сжимается и оптимизируется для работы в реальном времен с сохранением необходимой точности прогноза.
Основная идея вербализации — это упрощение без значительного ухудшения качества аппроксимации для решения конкретной узкой задачи. Однако в результате вербализации будет существенно или полностью утрачена способность к обобщению новых статистических данных. То есть нейронная сеть потеряет свою изначальную способность к обучению. Более того, упрощение нейросети подобным образом уже не позволит ее использовать для дальнейшего анализа взаимосвязи переменных.
Все это возможно только при использовании изначальной (обученной, но не упрощенной) нейронной сетки. Что возвращает нас к изначальной проблеме использования «подлинных» нейросетей — очень высокая ресурсозатратность. А значит невозможность эффективно использовать их на актуальных платформах для работы с быстро обновляющимися данными в реальном времени.
При упоминании термина «предсказания нейронной сети» зачастую речь идет уже о предсказаниях алгоритма, полученного на основе обученной нейросетки. Выводы же можно получить только с помощью полноценной неупрощенной нейросети. Чтобы подчеркивать эту разницу между предсказанием и выводом, для последнего предпочитают использовать более конкретный термин — «выводы глубокого обучения» (deep learning inference).
Объявленный на конференции Hot Chips, процессор Telum разрабатывался в течение трех лет и, как ожидается, произведет революцию в области обнаружения мошенничества в банковской, финансовой, торговой, страховой и клиентской сферах. Telum придет на смену IBM z15, а новый чип ляжет в основу платформ IBM Z и LinuxOne следующего поколения. Запуск первых систем на базе Telum запланирован на первую половину 2022 года.
Недавнее исследование IBM показало, что 90% респондентов считают появление возможности собирать и запускать системы искусственного интеллекта в любой точке потока данных важным шагом вперед, поскольку сейчас в современных компаниях ИИ интегрируется практически во все процессы.
На сегодняшний день в финансовой сфере имеются различные инструменты на базе ИИ для детектирования мошенничества, однако большинство этих методов позволяют обнаружить факт нарушения только после того, как инцидент уже произошел.
И, хотя они уже ни раз успешно применялись, их недостаток в том, что из-за ограничений современных технологий процесс работы с ними может потребовать много времени и вычислительных ресурсов. Особенно когда анализ и обнаружение мошенничества осуществляются вдали от самих критически важных транзакций и данных.
Системы для обнаружения мошенничества на основе искусственного интеллекта исходят исключительно из данных прошлого опыта. Они изучают действия, поведение и тенденции транзакций на предмет аномалий. И в большинстве случаев такие системы могут обнаружить, что что-то не так, и пометить это как мошенничество, но опять же уже после того, как аномалия произойдет.
Подобное ресурсозатратное обнаружение мошенничества невозможно производить в режиме реального времени из-за высоких задержек. Поскольку к моменту обнаружения мошенничества преступник, вероятно, уже осуществит задуманное. Например, большинство компаний, выпускающих кредитные карты, смогут обнаружить факт мошенничества только после того, как мошенник приобретет товары или карта будет заявлена как украденная.
Согласно данным Федеральной торговой комиссии, потребители потеряли в результате мошенничества за 2020 год более 3,3 млрд долларов США. Для сравнения: в 2019 году эта сумма составила 1,8 млрд долларов США. Самозванцы остаются наиболее распространенным типом мошенников, о которых сообщается агентству.
Самозванцы возглавили рейтинг ущерба от мошенничества с суммой около 1,2 миллиарда долларов США. Покупки в интернете являются второй по распространенности категорией мошенничества, убытки от которой составили около 246 миллионов долларов США. Особенный всплеск сообщений потребителей о данных инцидентах наблюдался в первые дни пандемии COVID-19.
Ожидается, что ИИ-процессор поможет предприятиям в войне с мошенничеством перейти от позиции обнаружения к позиции предотвращения. Вместо того, чтобы сосредотачиваться на выявлении случаев постфактум, не влияя прямым образом на статистику преступлений, компании теперь наконец смогут начать предотвращать масштабное мошенничество, при этом не влияя на скорость транзакции и качество обслуживания клиентов.
Инновационный централизованный дизайн нового ИИ-процессора позволит еще эффективнее использовать его мощность при работе с нейронными сетями. Помимо обнаружения и предотвращения мошенничества, чип также подходит для других задач финансовых услуг, таких как обработка ссуд, клиринг, расчеты по сделкам, борьба с отмыванием денег и анализ рисков.
Чип реализован на базе 7-нм техпроцесса и содержит 8 процессорных ядер с глубоким суперскалярным конвейером команд произвольной очередности. ИИ-процессор работает на тактовой частоте более 5 ГГц и оптимизирован для гетерогенных вычислений под широкое множество различных задач. Объем L2 кэша составляет 32 МБ на каждое ядро, а полностью переработанная инфраструктура кэш-памяти позволяет формировать из кэша второго уровня виртуальные кэши L3 и L4 на 256 МБ и 2 ГБ соответственно. Также благодаря новому дизайну архитектуры систему можно масштабировать до 32 микросхем Telum, работающих вместе. А переработанный 8-канальный интерфейс памяти способен выдержать отказ целого канала и обеспечить прозрачное восстановление данных без влияния на время отклика. Двухчиповый модуль содержит 22 миллиарда транзисторов и 19 миль проводов на 17 металлических слоях.
Благодаря тому, что ускоритель Telum можно расположить в непосредственной близости к критически важным данным, его функции возможно интегрировать прямо в работу приложений. Это означает, что предприятия могут проводить большой объем вычислений типа выводов глубокого обучения для конфиденциальных транзакций в реальном времени, не прибегая к внеплатформенным решениям искусственного интеллекта, которые негативно сказываются на производительности. Хотя последние, реализованные на базе системы IBM с поддержкой Telum, также станут более гибкими и производительными.
Есть еще несколько более консервативных способов применения данной системы. С ее помощью возможно улучшить уже существующие методы обнаружения мошенничества на основе правил. Также утверждается, что данная платформа позволит эффективнее использовать машинное обучение для ускорения процессов утверждения кредитов, улучшения обслуживание клиентов, выявления убыточных сделок или транзакции, и анализа решений для создания более эффективного процесса расчетов. Правда, для некоторых из нас это, похоже, закончится фразой – «Ваш кредит неодобрен».
Что ж, видимо, мошенникам придется стать гораздо более подкованными в области технологий, ведь обманывать теперь нужно будет не только нас и банки, но и нейросети. Конечно, при условии, что ИИ-чип получит широкое признание в большем количестве компаний. Хотя тот факт, что этот и другие подобные чипы можно использовать не только для защиты своих клиентов, но и для обеспечения более быстрого выполнения других задач и финансовых услуг, проще говоря, для увеличения прибыли, явно играет на руку его внедрению и освоению.
Актуальное: