Платим блогерам
Блоги
Bublik1
Масштабирование перестало оказывать значительное влияние на способности новых моделей

Уже несколько лет мы становимся свидетелями стремительной гонки, цель которой заключается в создании умного алгоритма, превосходящего все ранее существующие модели. При этом ИИ просто обязан стать думающим, поскольку современные компьютерные модели не отличаются таким качеством. По информации многих исследователей, которые уже давно изучают становление искусственного интеллекта, машина не способна думать самостоятельно. Генерация текста, изображений и видео происходит по чётко заданным шаблонам. Таким образом умный алгоритм не думает, а использует заложенные в него сценарии для выдачи ответов на вопросы пользователей. Учёные полагают, что мышление происходит иначе, ведь люди способны оперировать неизвестными величинами, тогда как ИИ пока на такие свершения не способен. Есть все основания полагать, что в ближайшие десятилетия никакого прорыва не случится, а значит людям потребуется больше времени для обучения достаточно зрелого и действительного думающего алгоритма. Если такое вообще возможно. 

При этом тысячи компаний по всему миру надеются с помощью ИИ увеличить доходы и сделать свой продукт ещё более узнаваемым, снизив затраты до минимума. Перспективы кажутся довольно оптимистичными, но данные свидетельствуют о том, что создание более мощных моделей начинает сталкиваться с ограничениями. Так, несколько лидирующих компаний начинают замечать, что масштабные вложения в разработку новых моделей начинают приносить всё меньшую отдачу. Эксперты полагают, что возможности современного ИИ сильно ограничены, а без революционного прорыва предел потенциала умных алгоритмов будет достигнут уже в ближайшее время. Проблема стала особенна заметна после ряда неудач с крупнейшими моделями OpenAI и Anthropic. Например, OpenAI завершила первый этап обучения своей новой модели Orion, которая должна была сделать существенный шаг к созданию более мощного интеллекта, уровень которого соответствует или даже выше человеческого. Вот только пока Orion не может продемонстрировать революционного прорыва, а создатели не понимают, в чём причина подобных ограничений. 

Отмечается, что модель действительно лучше GPT-4 по целому ряду факторов, включая скорость обработки информации, но преимущество оказалась не таким заметным. Мало того, если сравнивать Orion и GPT-4, то можно сделать вывод, что GPT-4 действительно стала большим шагом вперёд по сравнению с GPT-3.5, тогда как новая модель ничего подобного не предлагает. Anthropic столкнулась с аналогичными препятствиями на пути к значительным достижениям. Так, новая 3.5 Opus, хоть и превзошла предыдущие версии, не смогла оправдать амбициозные ожидания. Это особенно разочаровало специалистов, учитывая огромные ресурсы, затраченные на её разработку. Опыт обеих компаний ставит под сомнение представление о том, что увеличение объёма данных и вычислительных мощностей неизменно приводит к технологическому прогрессу. Многие эксперты и инвесторы всё ещё уверены в том, что уже скоро человечество будет готово к большому прорыву, представив так называемый общей искусственный интеллект (AGI). Речь идёт о системе, которая могла бы сравниться с человеком в интеллектуальных задачах. Вот только в последнее время даже оптимисты говорят о необходимости дать разработчикам больше времени и ресурсов. Руководители OpenAI и Anthropic ранее прогнозировали, что такой ИИ может появиться уже через несколько лет, но на практике всё оказалось куда сложнее, чем ожидалось.

По мнению специалистов, занимающихся созданием умных алгоритмов, существует также серьёзная проблема ограниченности источников данных. В основе технологии, используемой в популярных ИИ-чат-ботах вроде ChatGPT, лежат данные из социальных сетей, форумов, статей, книг и других источников. Эти массивы текстовой информации позволяли создавать модели, способные на генерацию связных текстов, но для достижения более высокого уровня интеллекта, который мог бы, например, соперничать с нобелевскими лауреатами, такой информации недостаточно. Компании вынуждены искать новые решения. Например, OpenAI уже начала заключать соглашения с издательствами для доступа к высококачественным данным. Также наблюдается повышенный спрос на специалистов с глубокой отраслевой экспертизой, способных вручную разметить данные для более точного обучения ИИ. Очевидно, что выполнение таких сложных задач обходится дороже автоматического «скармливания» нейросети огромных массивов данных. Кроме того, пытаясь найти рабочую альтернативу, разработчики всё чаще прибегают к синтетическим данным. Это тексты и изображения, созданные компьютером и имитирующие реальный контент. Такой подход в теории должен позволить генерировать практически неограниченное количество данных, но на практике его эффективность оказывается ограниченной. 

В процессе обучения стало ясно, что сгенерированный машиной контент не обладает глубиной и разнообразием, свойственным человеческому опыту, а в итоге даже большие объёмы данных оказываются практически бесполезны. Эксперты пишут, что крупные компании, занимающиеся обучением передовых алгоритмов, уже не могут остановиться. Остаётся и дальше инвестировать в закупку оборудования, а масштабирование остаётся единственной реальной возможностью добиться более значимых результатов. Пытаясь создать продукты, максимально приближённые к уровню человеческого интеллекта, компании увеличивают количество данных, наращивают вычислительные мощности и удлиняют время обучения моделей. В этом году генеральный директор Anthropic Дарио Амодеи заявил, что компания потратила на обучение новейших моделей порядка 100 миллионов долларов, но в ближайшие годы эти затраты могут вырасти до 100 миллиардов.

Что интересно, но сегодня даже сами разработчики признают, что достичь результата только путём масштабирования не удастся. Например, OpenAI добавила к обучению Orion многомесячный этап пост-обучения, включающий обратную связь от пользователей. Эта процедура направлена на улучшение качества ответов и настройку эмоциональной окраски взаимодействия с человеком, что может сделать модель более «человечной» в общении. Таким образом, крупные игроки в сфере ИИ оказываются перед сложным выбором: продолжать развивать уже существующие модели, добавляя к ним улучшения, или запускать совершенно новые, требующие значительных инвестиций и часто лишь незначительно превосходящие предыдущие разработки. По мере того как растут затраты, растут и ожидания. На фоне этого всё больше специалистов пишет о скором схлопывании мыльного пузыря умных алгоритмов. 

49
Показать комментарии (49)

Популярные новости

Сейчас обсуждают