Платим блогерам
Блоги
amv212
Исследователи из Хельсинкского университета попытались искусственно воспроизвести чувство юмора в машинах, разработав технологию, которая может превращать существующие новостные заголовки в юмористические

реклама

За последние десять лет специалистами в области компьютерных технологий было разработано все большее количество вычислительных технологий, способных генерировать, редактировать и анализировать тексты. Хотя некоторые из них достигли замечательных результатов, некоторые аспекты человеческого языка и общения оказалось особенно трудно воспроизвести вычислительным путем.

Одним из таких аспектов является юмор - способность человека говорить или писать смешные вещи. Юмор - это тонкое и неотъемлемое человеческое качество, поэтому воспроизвести его в компьютерных системах - далеко не простая задача.

реклама

Исследователи из Хельсинкского университета, Финляндия недавно попытались искусственно воспроизвести чувство юмора в машинах, разработав нейросеть, которая может превращать существующие новостные заголовки в юмористические. Эта технология, впервые представленная в статье, предварительно опубликованной на arXiv и представленной на 12-й Международной конференции по вычислительному творчеству (ICCC 2021), была обучена анализировать заголовки в существующем наборе данных и заменять в них слова, чтобы придать им комические или забавные качества.

Мика Хямяляйнен (слева) и Халид Альнаджар на FDG 2019.    

 "Автоматизированная генерация новостей стала одним из главных интересов новостных агентств", - пишут в своей статье компьютерные эксперты Халид Алнаджар и Мика Хямяляйнен, два ученых, проводивших исследование. "Зачастую заголовки для таких автоматически генерируемых новостных статей не отличаются воображением, поскольку они были созданы на основе готовых шаблонов. Мы представляем вычислительно-креативный подход к созданию заголовков, который может генерировать юмористические версии существующих заголовков".


Недавняя статья Алнаджара и Хямяляйнена вдохновлена предыдущей работой трех исследователей из Университета Рочестера и Microsoft Research AI, которые представили Humicroedit - набор данных, содержащий более 15 000 прокомментированных новостных заголовков. В этом исследовании ученые определили стратегии создания смешных заголовков, которые обычно используются людьми и которые, по их мнению, согласуются с существующими теориями юмора.

 

Команда из Университета Хельсинки разработала нейросеть, которая использует некоторые из этих стратегий для изменения неюмористических заголовков и делает их более забавными для читателей. Для этого она пытается найти смешные замены некоторым словам в существующих заголовках.

Два примера заголовков, сгенерированных алгоритмом исследователей, следующие: "Трамп написал в Twitter не того Ли Гринвуда" и "США заявляют, что Турция помогает ИГИЛ, прочесывая курдов в Сирии".

Чтобы оценить эффективность своего продукта, Алнаджар и Хямяляйнен использовали ее для изменения 83 заголовков, случайно выбранных из набора данных Humicroedit, и придания им более юмористического характера. Затем они попросили рецензентов на платформе краудсорсинга оставить свои отзывы о том, считают ли они заголовки, созданные нейросетью, смешными или нет.

В целом, исследователи обнаружили, что юмористические заголовки, созданные их программой, были сопоставимы с заголовками, созданными людьми, по нескольким показателям. Кроме того, в среднем, человеческие эксперты, найденные в Интернете, считали заголовки, созданные их системой, смешными в 36% случаев. Если технология будет усовершенствовано, она может помочь медиа-агентствам и журналистам придумывать новые смешные заголовки для новостных статей.

"Поскольку лучшие заголовки, созданные нашей системой для каждого оригинального заголовка, в среднем могут достигать человеческого уровня по большинству факторов, измеренных в нашей оценке, ближайшим будущим направлением нашего исследования является разработка лучшего механизма ранжирования для достижения максимальных возможностей нашей системы", - заключили Алнаджар и Хямяляйнен в своей статье. "Возможно, такому ранжированию можно научиться путем обучения классификатора с долговременной кратковременной памятью (LSTM) на аннотированных корпорациях юмора".

6
Показать комментарии (6)

Популярные новости

Сейчас обсуждают