Платим блогерам
Блоги
hilnur20012
На данный момент, если машина получает входные данные, которые достаточно отличаются от данных, на которых она обучалась, она запутается и не будет действовать как человек

Исследователи из Института информационных наук Университета Южной Калифорнии в Витерби разрабатывают алгоритм, который научит машины обучаться без присмотра человека.

«Вообще говоря, машинное обучение — это наука об обучении машин действовать подобно людям», — сказал Мохаммад Ростами, руководитель исследований Института информационных наук Университета Южной Калифорнии (ISI) в Витерби. Обучение машин без какого-либо контроля со стороны человека является предметом его последней статьи «Преодоление изменения концепции в настройках с учетом предметной области с помощью консолидированных внутренних распределений», которую он представил на 37-й конференции AAAI по искусственному интеллекту, состоявшейся в Вашингтоне, округ Колумбия, 20 февраля 2023.

Ростами объяснил, как обычно осуществляется машинное обучение: «Мы собираем данные, которые аннотируются людьми, а затем мы учим машину, как действовать подобно людям, учитывая эти данные. Проблема, с которой мы сталкиваемся, заключается в том, что знания, которые получает машина, ограничены набор данных, который использовался для обучения». Кроме того, набор данных, используемый для обучения, часто недоступен после завершения процесса обучения.

В результате задача: если машина получает входные данные, которые достаточно отличаются от данных, на которых она обучалась, она запутается и не будет действовать как человек.

Бульдог или ши-тцу или что-то совсем другое?

Ростами привел пример: «Существует много категорий собак, разные типы собак визуально не очень похожи, и разнообразие значительно. Если вы научите машину классифицировать собак, ее знания будут ограничены образцами, которые вы использовали для обучения. Если у вас есть новая категория собак, которой нет среди тренировочных образцов, машина не сможет узнать, что это новый тип собак».

Интересно, что люди в этом лучше, чем машины. Когда людям дают что-то классифицировать, если им дают всего несколько образцов в новой категории (например, новую породу собак), они приспосабливаются и узнают, что это за новая категория. Ростами сказал: «Шестилетний ребенок может выучить новую категорию, используя два, три или четыре образца, в отличие от большинства современных методов машинного обучения, которые требуют, как минимум, несколько сотен образцов для изучения этой новой категории».

Категоризация перед лицом смены концепции

Часто речь идет не об изучении совершенно новых категорий, а о возможности корректировки по мере изменения существующих категорий.

Если машина изучает категорию во время обучения, а затем с течением времени она претерпевает некоторые изменения (например, добавление новой подкатегории), Ростами надеется, что с помощью его исследования машина сможет изучить или расширить понятие о том, что это за категория (т. е. включить новую подкатегорию).

Меняющаяся природа категории называется «сдвигом концепции». Понятие о том, что такое категория, со временем меняется. Ростами привел еще один пример из реальной жизни: папку со спамом.

Он объяснил: «У вашей службы электронной почты есть модель, позволяющая классифицировать ваши входящие электронные письма на полезные электронные письма и электронные письма со спамом. Она обучена идентифицировать спам с использованием определенных функций. Например, если электронное письмо не адресовано вам лично, более вероятно, что это спам."

К сожалению, спамеры знают об этих моделях и постоянно добавляют новые функции, чтобы обмануть модели, чтобы их электронные письма не классифицировались как спам.

Ростами продолжил: «Это означает, что определение «спама» со временем меняется. Это определение зависит от времени. Концепция та же — у вас есть концепция «спама», — но со временем определение и детали концепции меняются. Это изменение концепции».

Новый способ обучения

В своей статье Ростами разработал метод обучения модели машинного обучения, который решает эти проблемы.

Поскольку исходные обучающие данные не всегда доступны, метод Ростами не опирается на эти данные. Соавтор и главный научный сотрудник ISI Арам Галстян объяснил так: «Модель изучает распределение старых данных в скрытом пространстве, затем она может генерировать скрытое представление, почти как создание синтетического набора данных, изучая представление старых данных».

Из-за этого модель может сохранить то, что было изучено на начальном этапе обучения, что позволяет ей адаптироваться и изучать новые категории и подкатегории с течением времени.

Это также, что важно, означает, что она не забудет исходные обучающие данные или то, что она узнала из них. Это главная проблема машинного обучения. Галстян объяснил: «Когда вы обучаете новую модель, она может забыть о некоторых шаблонах, которые были полезны раньше. Это известно как катастрофическое забывание», — сказал Галстян.

С подходом, разработанным в этой статье, Галстян сказал, что «катастрофическое забывание неявно решается, потому что мы вводим соответствие между старым распределением данных и новым. Таким образом, наша модель не забудет старое».

Что дальше?

Ростами и Галстян довольны результатами, тем более что они не полагаются на наличие исходных данных. Галстян сказал: «Я был приятно удивлен, увидев, что эта модель выгодно отличается от большинства современных существующих базовых моделей». Ростами и Галстян планируют продолжить работу над этой концепцией и применить предложенный метод к реальным задачам.

Telegram-канал @overclockers_news - теперь в новом формате. Подписывайся, чтобы быть в курсе всех новостей!
Источник: techxplore.com
+
Написать комментарий (0)

Популярные новости

Сейчас обсуждают