В Финляндии создана нейросеть, генерирующая юмористические версии существующих заголовков

Блоги

5 окт. 2021, 14:25 amv212

Исследователи из Хельсинкского университета попытались искусственно воспроизвести чувство юмора в машинах, разработав технологию, которая может превращать существующие новостные заголовки в юмористические

За последние десять лет специалистами в области компьютерных технологий было разработано все большее количество вычислительных технологий, способных генерировать, редактировать и анализировать тексты. Хотя некоторые из них достигли замечательных результатов, некоторые аспекты человеческого языка и общения оказалось особенно трудно воспроизвести вычислительным путем.

Одним из таких аспектов является юмор - способность человека говорить или писать смешные вещи. Юмор - это тонкое и неотъемлемое человеческое качество, поэтому воспроизвести его в компьютерных системах - далеко не простая задача.

Исследователи из Хельсинкского университета, Финляндия недавно попытались искусственно воспроизвести чувство юмора в машинах, разработав нейросеть, которая может превращать существующие новостные заголовки в юмористические. Эта технология, впервые представленная в статье, предварительно опубликованной на arXiv и представленной на 12-й Международной конференции по вычислительному творчеству (ICCC 2021), была обучена анализировать заголовки в существующем наборе данных и заменять в них слова, чтобы придать им комические или забавные качества.

Мика Хямяляйнен (слева) и Халид Альнаджар на FDG 2019.

"Автоматизированная генерация новостей стала одним из главных интересов новостных агентств", - пишут в своей статье компьютерные эксперты Халид Алнаджар и Мика Хямяляйнен, два ученых, проводивших исследование. "Зачастую заголовки для таких автоматически генерируемых новостных статей не отличаются воображением, поскольку они были созданы на основе готовых шаблонов. Мы представляем вычислительно-креативный подход к созданию заголовков, который может генерировать юмористические версии существующих заголовков".

Недавняя статья Алнаджара и Хямяляйнена вдохновлена предыдущей работой трех исследователей из Университета Рочестера и Microsoft Research AI, которые представили Humicroedit - набор данных, содержащий более 15 000 прокомментированных новостных заголовков. В этом исследовании ученые определили стратегии создания смешных заголовков, которые обычно используются людьми и которые, по их мнению, согласуются с существующими теориями юмора.

Команда из Университета Хельсинки разработала нейросеть, которая использует некоторые из этих стратегий для изменения неюмористических заголовков и делает их более забавными для читателей. Для этого она пытается найти смешные замены некоторым словам в существующих заголовках.

Два примера заголовков, сгенерированных алгоритмом исследователей, следующие: "Трамп написал в Twitter не того Ли Гринвуда" и "США заявляют, что Турция помогает ИГИЛ, прочесывая курдов в Сирии".

Чтобы оценить эффективность своего продукта, Алнаджар и Хямяляйнен использовали ее для изменения 83 заголовков, случайно выбранных из набора данных Humicroedit, и придания им более юмористического характера. Затем они попросили рецензентов на платформе краудсорсинга оставить свои отзывы о том, считают ли они заголовки, созданные нейросетью, смешными или нет.

В целом, исследователи обнаружили, что юмористические заголовки, созданные их программой, были сопоставимы с заголовками, созданными людьми, по нескольким показателям. Кроме того, в среднем, человеческие эксперты, найденные в Интернете, считали заголовки, созданные их системой, смешными в 36% случаев. Если технология будет усовершенствовано, она может помочь медиа-агентствам и журналистам придумывать новые смешные заголовки для новостных статей.

"Поскольку лучшие заголовки, созданные нашей системой для каждого оригинального заголовка, в среднем могут достигать человеческого уровня по большинству факторов, измеренных в нашей оценке, ближайшим будущим направлением нашего исследования является разработка лучшего механизма ранжирования для достижения максимальных возможностей нашей системы", - заключили Алнаджар и Хямяляйнен в своей статье. "Возможно, такому ранжированию можно научиться путем обучения классификатора с долговременной кратковременной памятью (LSTM) на аннотированных корпорациях юмора".

#искусственный интеллект #статья #новость #нейросеть #алгоритмы #алгоритм #новостные заголовки

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Популярные новости

Популярные статьи