Компания OpenAI на этой неделе анонсировала браузер ChatGPT Atlas, который ожидаемо для этого разработчика выделяется наличием искусственного интеллекта в его основе. При этом компания не забывает про свой главный продукт — ChatGPT. В разработке находятся такие функции, как личные сообщения и групповые чаты в версии для Android. С ростом популярности Gemini Live создатели ChatGPT также работают над улучшением голосового режима. Вскоре может быть представлено обновление, которое упростит понимание происходящего.

Сейчас при переходе в голосовой режим ChatGPT показывается полноэкранный интерфейс с анимацией. По умолчанию текст не отображается, но есть возможность включить субтитры для просмотра транскрипции в режиме реального времени.

Хотя транскрипция упрощает отслеживание разговора, её приходится читать. На этом экране нельзя просматривать расширенный контент, включая ссылки, карты или прогноз погоды. Для доступа к расширенному контенту потребуется завершить голосовой разговор.

В ChatGPT версии 1.2025.294 обнаружен код, который позволит пользователям отслеживать голосовые разговоры с расширенным контентом, интегрируя его в чат. Журналистам удалось активировать эту функцию ещё до её официального анонса.
Нажатие на значок голосового чата вскоре перестанет открывать экран голосового чата с анимацией. Вместо этого голосовой разговор будет начинаться непосредственно в интерфейсе чата. Появятся кнопки для завершения голосового разговора и отключения/включения микрофона, позволяя выполнять больше действий на одном экране.

