Научная фантастика полна машин, которые могут читать мысли человека, но скоро такие машины могут появиться в реальной жизни. Ученые из Университета Осаки использовали усовершенствованную модель искусственного интеллекта для обработки активности человеческого мозга и воссоздания изображений, увиденных испытуемым человеком. В отличие от прошлых попыток считывать волны человеческого мозга, модель диффузии, используемая в этом исследовании, не требовала тщательного обучения или тонкой настройки, а результаты оказались поразительно точными.
Чтобы создать реконструированные изображения, исследователи начали с функциональной магнитно-резонансной томографии (фМРТ). Участникам исследования показывали различные изображения, в то время как медицинское оборудование собирало данные об активности мозга. В некоторых прошлых экспериментах проводилась аналогичная работа с данными фМРТ, например, для воссоздания лица, которое кому-то показывали. Однако эти модели ограничены генеративными алгоритмами искусственного интеллекта, которые необходимо обучать с большими наборами данных. К тому же, сейчас не так много доступных данных для обучения нейронаукам. Ключом к новому исследованию было использование диффузионной модели.
В диффузионных моделях искусственный интеллект вносит случайный шум в данные, а затем учится его удалять. Затем модель может применить процесс шумоподавления к случайным начальным значениям для создания реалистичного изображения. Чем больше стимулов в мозгу, тем больше шума в данных. А чем больше шума, тем выше разрешение конечного изображения. В этом исследовании использовался генератор изображений Stable Diffusion, который теперь может работать на смартфонах под управлением чипов Qualcomm.
Приведенные выше примеры показывают реальные изображения в верхнем ряду и версии, сгенерированные искусственным интеллектом, ниже. Даже не зная, что изображено на исходном изображении, ИИ может создать что-то относительно близкое только из данных фМРТ. Сгенерированное изображение может не соответствовать точной форме или масштабу реального изображения, но полученные изображения Stable Diffusion в формате 512 x 512 очень похожи на оригинал.
В настоящее время для сбора необходимых данных с фМРТ и создания этих изображений требуется, чтобы субъект засунул голову внутрь гигантского магнита. Впрочем, скоро могут появиться новые методы, потому что такие компании, как Neuralink Илона Маска, работают над имплантами интерфейса мозг-компьютер, которые могли бы записывать данные мозга с помощью крошечных электродов.