IBM ускоряет машинное обучение

Редакция

Новости Hardware 23 мар. 2018, 10:08 GreenCo

Машинное время тоже стоит денег.

На этой неделе на домашней конференции IBM THINK представители компании рассказали о прогрессе в разработке инструментов для машинного обучения. В частности, алгоритмы и платформа компании IBM оказались в 46 раз быстрее платформы Google Cloud Platform, которая использует фреймворк TensorFlow. Так, процесс тренировки на 4 млрд образах из базы данных Criteo Labs на платформе IBM был завершён за 91,5 секунды, тогда как платформе Google для этого понадобилось 70 минут. Это позволило компании IBM утверждать, что её обучающие алгоритмы работают буквально по щелчку пальцев. Тем самым алгоритм получил название IBM Snap Machine Learning (Snap ML).

Оба алгоритма, добавим, строили такую разновидность статистической модели, как логистическая регрессия, когда для предсказания события данные из базы подгоняются к логистической кривой. В данном случае использовалась база данных для таргетирования рекламы.

В компании IBM объясняют важность разработки "мгновенного" машинного обучения тем, что компании, как правило, для этих целей арендуют облачные сервисы с почасовой оплатой. Чем быстрее алгоритм будет справляться с обучением, тем дешевле будет обходиться работа с привлечением элементов искусственного интеллекта.

По словам IBM, у компании Google хорошие и гибкие алгоритмы для машинного обучения, но на определённых паттернах, в частности, на сильно разреженных данных, они оказываются малоэффективными. Для работы с такими данными и для повышения эффективности машинного обучения в компании IBM реализовали три особенных подхода. Во-первых, это распределённое обучение. Данные распараллеливаются таким образом, чтобы не было превышения памяти вплоть до локального устройства (компьютера). Рассматриваются три этапа распараллеливания: на уровне кластеров, на уровне узлов и на уровне машин. В каждом случае ставится задача минимизировать передачу данных по сети, в том числе, снижая повторную передачу и уменьшая потери от переполнения.

Во-вторых, IBM грамотно распорядилась ресурсами GPU с связке с центральным процессором. В этом случае также важно минимизировать накладные расходы, дозируя данные таким образом, чтобы эффективно использовать относительно небольшой объём памяти графического процессора. В-третьих, в компании научились оптимизировать паттерны в случае сильно разреженных данных. Результат, как говорится, налицо. Платформа IBM показала ошеломляющее преимущество по сравнению с платформой Google. Клиентам компании новая платформа IBM будет доступна позже в текущем году. В настоящее время готовятся пилотные проекты.

#ibm #супервычисления

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные статьи