Примерно 2000 лет назад произошло извержение вулкана Везувий, в результате которого огонь и пепел обрушились на римские поселения Помпеи и Геркуланум. Многие предметы и человеческие останки были покрыты пеплом, в том числе коллекция сгоревших свитков. Студент с обычной игровой видеокартой обучил искусственный интеллект читать слова из этих свитков, которые никто так и не смог расшифровать за 2 тысячи лет. Этот подвиг принес студенту-бакалавру по компьютерным наукам Люку Фарритору премию в 40 тысяч долларов и приблизил нас на один шаг к расшифровке древних знаний.
В рамках проекта Vesuvius Challenge, направленного на восстановление слов на этих древних свитках, были разыграны первые призы на общую сумму 50 тысяч долларов. Но еще остаются сотни тысяч долларов, и поэтому Фарритор опубликовал исходный код, который помог ему заработать свои 40 тысяч. Тем не менее, это не простая задача. Фарритор потратил месяцы, работая над этой задачей, и его достижением стала реконструкция единственного слова: πορφυρας, что переводится как "пурпурная краска". В общем, чтобы получить главный приз, придется очень постараться.
Извержение вулкана в 79 году н.э. было разрушительным для региона, расположенного на территории современной Кампании (Италия). Большая часть руин оставалась погребенной на протяжении веков, но археологи постепенно раскапывали прошлое. В 1700-х годах рабочие раскопали частную виллу в Геркулануме и обнаружили библиотеку с обуглившимися свитками. Папирус был настолько поврежден, что с ним нельзя было работать, не разрушив материал. Эти комки обгоревшей бумаги были не более чем диковинкой в течение нескольких столетий, пока передовые компьютерные изображения не позволили по-новому взглянуть на древние реликвии.
Презентация Фарритора, изображающая слово "πορφυρας". Источник: Vesuvius Challenge
Благодаря работе Брента Силса из лаборатории EduceLab Университета Кентукки, мы знаем, что изображено на свитках. С помощью трехмерного компьютерного сканирования Силз подтвердил, что папирусы из Геркуланума представляли собой пеструю массу карбонизированного папируса, что неудивительно, учитывая их состояние (см. верхнее изображение). Однако в этих пятнах были скрыты возможные закономерности. Исследователи заметили странные «потрескивания» в тех частях свитка, которые, по их мнению, были остатками чернил. Фарритор решил обучить модель искусственного интеллекта обнаруживать эти особенности на изображениях, предоставленных для задания.
Он использовал Nvidia GeForce GTX 1070, которая на момент выпуска в 2016 году была мощной игровой видеокартой. Сегодня она меркнет по сравнению с новейшими видеокартами RTX 40-й серии. Но это лишь показывает, что вам не обязательно тратить десятки тысяч долларов на модную видеокарту-ускоритель искусственного интеллекта, чтобы выполнять сложную работу с искусственным интеллектом.
Еще один приз в 10 тысяч долларов получил Юссеф Надер, который представил те же участки папируса после Фарритора. Код Надера также доступен всем, кто хочет увидеть, как это было сделано. Так что ознакомление с программой Vesuvius Challenge может принести свои плоды. Главный приз на данный момент составляет 700 000 долларов, но требования гораздо выше. Чтобы получить эту зарплату, участник должен обнаружить в свитках как минимум четыре отрывка непрерывного и правдоподобного текста длиной 140 символов или более.