Прочитаны первые страницы рукописи, сгоревшей в Геркулануме во время извержения Везувия 2000 лет назад

Международная команда специалистов по ИИ сумела прочитать фрагмент, полностью обугленного свитка. Свиток был обнаружен еще в XVIII веке при раскопках в Геркулануме на вилле, сгоревшей при извержении Везувия в 79 году. Раскрыть его невозможно, но ученым удалось прочесть сканы, полученные с помощью компьютерной томографии. Команда стала победителем конкурса Vesuvius Challenge и получила приз в размере 700 тысяч долларов.
Прочитаны первые страницы рукописи, сгоревшей в Геркулануме во время извержения Везувия 2000 лет назад
Текст из геркуланумского свитка, который не видели 2 000 лет. Vesuvius Challenge
Когда ученые говорят о возможности чтения сотен (а может быть, тысяч) свитков из библиотеки Филодема, они понимают, что такой огромный корпус текстов может запросто изменить не только наш взгляд древний мир, но и нас самих. Что если тексты Аристотеля, по которым человечество училось 2000 лет на самом деле были другими, а до нас дошли в сильно искаженном виде?

Команда студентов-исследователей внесла огромный вклад в разгадку одной из величайших загадок археологии, раскрыв содержание греческого текста внутри обугленного свитка, захороненного 2000 лет назад в результате извержения Везувия.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Победители конкурса под названием Vesuvius Challenge обучили модель ИИ на сканах свернутого папируса. Им удалось прочитать ранее неизвестную философскую работу, в которой обсуждаются чувства и удовольствие. Этот результат открывает путь к использованию методов ИИ для полной расшифровки других свитков. Это, по мнению исследователей, может иметь революционные последствия для нашего понимания древнего мира.

ИИ впервые читает текст из древнего свитка Геркуланума

Это достижение всколыхнуло обычно неспешный мир классической филологии. «Это то, что я всегда считал несбыточной мечтой», — говорит Кеннет Лапатин, куратор отдела древностей в Музее Дж. Пола Гетти в Лос-Анджелесе, Калифорния. В прочитанном тексте обсуждаются источники удовольствия, включая музыку, вкус каперсов и фиолетовый цвет. «Это исторический момент», — говорит филолог-классик Боб Фаулер из Бристольского университета (Великобритания), один из судей премии Vesuvius Challenge. Три студента из Египта, Швейцарии и США, которые смогли прочитать текст, разделили главный приз в размере 700 000 долларов США.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Этот свиток — один из сотен неповрежденных папирусных свитков, раскопанных еще в XVIII веке на роскошной римской вилле в Геркулануме, Италия. Эти куски пепла, известные как свитки Геркуланума, являются единственной библиотекой, сохранившейся со времен древнего мира, но они слишком хрупкие, чтобы их можно было развернуть и прочитать.

5 февраля были обнародованы сотни слов в более чем 15 столбцах текста. Это соответствует примерно 5% всего свитка. «Конкурс прояснил ситуацию для всех, кто сомневался в том, сработает ли это вообще», — говорит Брент Силс, ученый-компьютерщик из Университета Кентукки, Лексингтон, и соучредитель премии. «Никто больше в этом не сомневается».

Двадцатилетняя миссия

На протяжении столетий после того, как свитки были обнаружены, многие люди пытались открыть их. В результате некоторые свитки были уничтожены — они просто рассыпались. Папирологи все еще работают над расшифровкой и объединением некоторых фрагментированных текстов. Но свитки в самом плохом состоянии (их около 280) остались нетронутыми. Они хранятся в основном в Национальной библиотеке Неаполя (Италия), а также в Париже, Лондоне и Оксфорде (Великобритания).

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Взвешивание свитка Геркуланума. Он был сожжен и погребен во время извержения Везувия. .
Взвешивание свитка Геркуланума. Он был сожжен и погребен во время извержения Везувия. .
Vesuvius Challenge

Брент Силс пытался прочитать эти скрытые тексты почти 20 лет. Его команда разработала программное обеспечение, позволяющее «виртуально разворачивать» свернутые папирусы с помощью трехмерной компьютерной томографии (КТ). В 2019 году Силс перенес два свитка из Института Франции в Париже в ускоритель частиц Diamond Light Source недалеко от Оксфорда, чтобы выполнить сканирование с высоким разрешением.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Однако картирование поверхностей занимало много времени, а чернила на углеродной основе, используемые для написания свитков, имели ту же плотность, что и папирус, при компьютерной томографии их невозможно было различить. Силс и его коллеги задались вопросом, можно ли научить модели машинного обучения «разворачивать» свитки и различать чернила. Но разобраться во всех данных было гигантской задачей для его небольшой команды.

К Силзу обратился предприниматель из Кремниевой долины Нэт Фридман, который был заинтригован свитками Геркуланума после просмотра выступления Силса. Фридман предложил провести конкурс. Он пожертвовал 125 000 долларов на запуск проекта и собрал еще сотни тысяч в Твиттере, а Силс выпустил в свободный доступ свое программное обеспечение вместе со сканами в высоком разрешении. В марте 2023 года команда запустила конкурс Vesuvius Challenge, установив главный приз за прочтение 4 отрывков длиной не менее 140 символов до конца года.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Ключом к успеху конкурса стало «сочетание конкуренции и сотрудничества», говорит Фридман. На каждом этапе присуждались меньшие призы, чтобы стимулировать прогресс, а лучший код машинного обучения выпускался на каждом этапе, чтобы «повысить уровень» сообщества, чтобы участники могли использовать достижения друг друга.

Цвет фиолетовый

Ключевой прорыв произошел в середине прошлого года, когда американский предприниматель и бывший физик Кейси Хэндмер заметил на сканах слабую текстуру, похожую на потрескавшуюся грязь (он назвал ее «треск»), которая, казалось, имела форму греческих букв. Люк Фарритор, студент, изучающий информатику в Университете Небраски-Линкольн, использовал этот треск для обучения алгоритма машинного обучения, и прочитал самое первое слово: porphyras, «фиолетовый», что принесло ему приз за открытие первых букв в конце октября. Второе место занял египетский аспирант из Берлина Юсеф Надер, который представил еще более четкие изображения текста.

Команда исследователей использовала машинное обучение, чтобы изобразить формы чернил на свернутом свитке.
Команда исследователей использовала машинное обучение, чтобы изобразить формы чернил на свернутом свитке.
Vesuvius Challenge
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Полученный код был выпущен менее чем за три месяца до крайнего срока — 31 декабря. Его могли использовать все участники конкурса. За последнюю неделю на конкурс поступило 18 заявок. Техническое жюри проверило код участников, затем передало 12 заявок комитету папирологов, которые расшифровывали текст и оценивали разборчивость каждой записи. Только один полученный текст полностью соответствовал критериям премии: команда, сформированная Фарритором, Надером и Джулианом Шиллигером, студентом-робототехником в Швейцарском федеральном технологическом институте Цюриха.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Результаты «невероятные», говорит член жюри Федерика Николарди, папиролог из Неаполитанского университета имени Федерико II. «Мы все были совершенно поражены изображениями, которые они показывали». Сейчас она и ее коллеги анализируют полученный текст.

Музыка, удовольствие и каперсы

Содержание большинства ранее открытых свитков Геркуланума относится к эпикурейской школе философии и, по-видимому, составило рабочую библиотеку последователя афинского философа Эпикура (341-270 г. до н. э.), по имени Филодем. В новом тексте не указан автор, но, судя по грубому первому прочтению, как говорят Фаулер и Николарди, текст, вероятно, также принадлежит Филодему. Помимо приятных вкусов и зрелищ, в тексте упомянут некто по имени Ксенофант. Флейтиста с таким именем упоминают древние авторы Сенека и Плутарх.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Кеннет Лапатин говорит, что темы, обсуждаемые Филодемом и Эпикуром, по-прежнему актуальны. «Основные вопросы, которые задавал Эпикур, — это те, которые стоят перед всеми нами, людьми. Как нам жить хорошо? Как нам избежать боли?» Но «настоящие успехи еще впереди», говорит ученый. «Что меня так волнует, так это не то, что говорится в этом свитке, а то, что расшифровка этого свитка служит хорошим предзнаменованием для расшифровки сотен других свитков».

Нажми и смотри

Вероятно, в них будет много греческой философии: «Мне бы хотелось, чтобы открылись какие-нибудь работы Аристотеля», — говорит папиролог и член жюри премии Ричард Янко из Мичиганского университета в Анн-Арборе. Между тем, некоторые из открытых на сегодня свитков, написанных на латыни, охватывают более широкую предметную область. Это повышает вероятность того, что мы прочитаем новые сочинения греческих писателей и поэтов от Гомера до Сафо. Свитки «откроют черт знает какие новые секреты», — говорит Фаулер. «Мы все очень взволнованы».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Это достижение, вероятно, также вызовет споры о том, следует ли проводить дальнейшие исследования на вилле Геркуланума, все уровни которой никогда не подвергались раскопкам. Янко и Фаулер убеждены, что главная библиотека виллы так и не была найдена, а под землей все еще могут находиться тысячи свитков. В более широком смысле, методы машинного обучения, впервые предложенные Силсом и участниками конкурса Vesuvius Challenge, теперь могут быть использованы для изучения других типов скрытого текста, таких как картонаж — переработанные папирусы, которые часто используются для упаковки египетских мумий. Таких папирусов огромное количество.

Следующий шаг – это расшифровка всего свитка. Фридман объявил о сборе нового призового фонда для Vesuvius Challenge на 2024 год. Теперь без еще более амбициозная: победитель должен прочитать 85% свитка к концу года (напомним, что пока прочтено только 5%). Фридман говорит, что, зайти так далеко «кажется чудом. Но ведь это сработало».