Наиболее значительную ценность для обучения ИИ представляют качественные тексты из книг и статей, написанных и отредактированных квалифицированными людьми. По оценкам экспертов, такие тексты могут быть почти полностью использованы уже в 2026-2027 годах. Единственным же практически применимым и экономически выгодным способом совершенствования чат-ботов останется обучение на колоссальных массивах информации с различных площадок без согласия правообладателей. Подобная политика уже стала предметом ряда судебных разбирательств. При этом чем на большем количестве данных обучен ИИ – тем лучше он работает. Глава OpenAI Сэм Альтман предлагал обучать нейросети на основе текстов, сгенерированных другими нейросетями, но это сопряжено со значительными рисками — с каждым циклом такого обучения могут накапливаться ошибки.