26.07.2025, 10:13

ИИ-модель компании DeepMind научилась восстанавливать древнеримские тексты и надписи

Классические филологи британских университетов и Google DeepMind создали первую ИИ-модель Aeneas для реконструкции древних латинских надписей. Исследование открывает новые возможности для интерпретации и восстановления фрагментарных римских текстов.

Владимир Губайловский

Теги:

История

Искусственный интеллект

Археология

ИИ-модель компании DeepMind научилась восстанавливать древнеримские тексты и надписи

Реставрация поврежденной надписи (сохранившаяся надпись выделена темным, восстановленная — на светлом фоне). Nature (2025). DOI: 10.1038/s41586-025-09292-5

Рим был удивительно грамотным обществом для своего времени. Хотя точные цифры спорны, уровень грамотности в римском обществе гораздо выше, чем в других древних цивилизациях. И не только древних, но и выше, чем в Европе до XIX века. Уровень грамотности в Риме, особенно в столице по некоторым оценкам превышал 50%, грамотны были не только мужчины, но даже многие женщины, что для древних обществ практически непредставимо. Сохранилось огромное количество надписей, особенно много — более 10 тысяч — граффити в Помпеях. Многие надписи повреждены, и теперь с помощью ИИ их можно восстановить.

В Риме надписи были везде. От императорских монументов до бытовых предметов — везде можно было встретить высеченные надписи. Политические граффити, любовные стихи, эпитафии, деловые соглашения, приглашения на день рождения и магические заклинания предоставляют современным историкам богатейший материал для изучения повседневной жизни Рима.

Но древние тексты часто фрагментарны, буквы повреждены временем или намеренно испорчены. Восстановление, датировка и локализация таких надписей практически невозможны без контекстной информации. Традиционно историки полагались на собственную экспертизу для выявления «параллелей» — текстов со схожими формулировками, синтаксисом или происхождением. Эта работа требовала огромных временных затрат и глубочайших знаний.

Модель Aeneas, названная в честь героя греко-римской мифологии, кардинально ускоряет этот сложный процесс. Она анализирует тысячи латинских надписей, мгновенно находя текстуальные и контекстуальные параллели. Это позволяет историкам интерпретировать находки и развивать выводы модели.

Трудный тест на «списке достижений» императора Августа

Обработка фразы Senatus populusque Romanus («Сенат и народ Рима») моделью Aeneas. Получив изображение и текстовую транскрипцию надписи (с поврежденными участками неизвестной длины, обозначенными символом '#'), Aeneas использует декодер на основе трансформера (основной блок) для обработки текста. Специализированные сети (головы) занимаются восстановлением символов, атрибуцией по дате и географической атрибуцией (которая также включает визуальные признаки). Промежуточные представления основного блока объединяются в единое, исторически обогащенное встраивание для поиска похожих надписей из LED, ранжированных по релевантности. https://www.nature.com/articles/s41586-025-09292-5

Профессор классической филологии Университета Уорвика Элисон Кули, признанный мировой эксперт по эпиграфике, проверила «реальную» достоверность анализа Aeneas на примере знаменитой римской надписи Res Gestae Divi Augusti — автобиографического «списка достижений» императора Августа. Кули говорит: «Я была в восторге от возможности протестировать способности Aeneas через детальное изучение этого прославленного текста».

Надпись изобилует преувеличениями, неточными датами и ложными географическими указаниями, при этом среди ученых существуют значительные разногласия относительно ее датировки. Тем не менее, Aeneas точно уловила контекст, неоднозначность датировки и происхождения. Модель нашла подсказки в орфографии и словарях, и учла лингвистические нюансы, указывающие на политическую идеологию и императорскую атрибуцию.

Особенно примечательно, что Aeneas «подстраховалась», предложив два вероятных временных диапазона вместо единственного прогноза. Причем обе датировки точно отражают современные разногласия исследователей, демонстрируя способность модели учитывать неопределенность в исторических данных.

Проект Aeneas является частью более широких усилий по изучению возможностей генеративного ИИ для помощи историкам. Модель может быть адаптирована для работы с другими древними языками, письменностями и носителями — от папирусов до монет, расширяя возможности для установления связей между различными историческими свидетельствами.