Исследователи из Шанхайской лаборатории искусственного интеллекта представили CosmicMan, специализированную модель преобразования текста в изображение, предназначенную для создания фотореалистичных портретов людей. Используя обширный набор данных и новый метод обучения, CosmicMan достигает впечатляющих результатов, раздвигая границы изображений, генерируемых искусственным интеллектом.
Одним из ключевых нововведений CosmicMan является его новый метод обучения, который сочетает в себе элементы генеративно-состязательных сетей (GAN) и вариационных автоэнкодеров (VAE). Такой гибридный подход позволяет модели более эффективно обучаться на огромном наборе данных, улавливая тонкие нюансы и детали, которые имеют решающее значение для создания фотореалистичных портретов людей.
Доктор Ли Вэй объясняет: «Уникальный метод обучения CosmicMan позволяет ему понимать и интерпретировать текстовые описания с удивительной точностью. Это, в свою очередь, позволяет модели создавать высокодетализированные и реалистичные портреты людей, которые отражают суть вводимого текста».
Чтобы продемонстрировать возможности CosmicMan, исследовательская группа выпустила серию потрясающих портретов, сгенерированных моделью. Каждое изображение демонстрирует способность модели улавливать мельчайшие детали, такие как выражение лица, текстура волос и тон кожи, в результате чего получаются реалистичные портреты, почти неотличимые от фотографий.