Первые эксперименты с машинным обучением (МО) в археологии относятся еще к 1970-м годам, но широкое применение технологии началось в конце 1990-х. Тогда вычислительные мощности компьютеров позволили использовать МО и интеллектуальный анализ данных для обработки массивов информации и прогнозирования местоположения археологических памятников.
Искусственный интеллект в археологии: как машины помогают ученым разгадывать загадки прошлого

Бум использования машинного обучения в археологии случился в 2019-м: в том году стало резко расти количество научных публикаций о способах использования технологии.

Почему археология – особый случай для искусственного интеллекта
Чтобы ИИ мог чему-то научиться, нужно много данных. И это ключевое ограничение в использовании инструмента. Археологические данные фрагментарные и неполные. Каждый элемент – осколок посуды, архивная фотография или фрагмент здания – может иметь дефекты. Очень многое утеряно, а то, что дошло до наших дней, часто недоступно из-за прав на интеллектуальную собственность. Артефакты разбросаны по музейным и частным коллекциям, и не все их обладатели хотят сотрудничать с исследователями.
Еще одно ограничение: малое количество экспертов, способных работать с такими материалами, особенно когда речь идет про узкие области знаний. Ученые должны понимать контекст находок, особенности языка, символики или стиля. Без участия исследователя, человека с уникальным набором знаний и умений, организовать корректную разметку данных не выйдет.
Но даже при наличии эталонной разметки результат не всегда может считаться окончательным. Археологические данные несут отпечаток культуры, языка и менталитета эпох. Одни и те же символы могли менять значение в разные периоды, а иероглифы — означать разные вещи в зависимости от контекста. Поэтому интерпретация данных требует не только вычислительных мощностей, но и глубокого понимания цивилизации, с которой работает ИИ.

4 примера того, как искусственный интеллект помогает понимать прошлое
Несмотря на нехватку данных и сложности интерпретации, ИИ находит все больше практических применений в археологии. Сегодня технология помогает исследователям читать древние тексты, восстанавливать объекты, анализировать артефакты и создавать цифровые копии культурного наследия.
- Расшифровка древнеегипетских текстов
Институт AIRI вместе с ИСП РАН и ИТМО в октябре 2025 года представили инструмент на базе ИИ, который может распознавать и переводить древнеегипетские иероглифы. Для обучения использовали корпус Thesaurus Linguae Aegyptiae — крупнейшее собрание египетских текстов с переводами. Позже результаты проверили профессиональные египтологи из НИУ ВШЭ. На практике технология работает так: модели на архитектуре TrOCR распознают форму символов на изображениях, а языковые модели анализируют контекст и формируют перевод.
Помимо пользы для археологии, технология помогает обогащать знания ИИ-моделей в условиях недостатка данных. В перспективе она может использоваться в музеях, позволяя посетителям буквально «читать» древние надписи с помощью смартфона.

Это не единственный пример изучения древнеегипетского наследия с помощью ИИ. Проект Thoth.AI, созданный в Университете Цукубы (Япония) под руководством Со Миягавы, представляет собой интерактивного бота, который объясняет древнеегипетскую и коптскую грамматику, переводит тексты и может транскрибировать коптский язык из печатных изображений.
Бот работает на базе большой языковой модели Claude 3.5 Sonnet и технологии RAG, которая помогает искать и использовать внешние источники данных. Решение опирается на крупнейшие лингвистические корпуса: Comprehensive Coptic Lexicon и Thesaurus Linguae Aegyptiae. Хотя доступ к Thoth.AI ограничен, проект показывает, как ИИ может помогать ученым и делать древние языки ближе широкой аудитории.
- Воскрешение текста из пепла
В марте 2023-го стартовал международный конкурс Vesuvius Challenge, чтобы решить задачу, которая считалась невозможной: прочитать тексты из обугленных свитков, погребенных при извержении Везувия в 79 году н. э. Бумаги нашли еще в XVIII веке и хранили в Неаполе, но их нельзя было развернуть, не уничтожив.

Организаторы опубликовали данные трехмерного сканирования свитков, выполненного в Оксфорде на ускорителе Diamond Light Source – установке, создающей сверхмощные рентгеновские лучи для послойного изучения структуры объектов. И после предложили участникам применить МО, компьютерное зрение и 3D-сегментацию для «виртуального разворачивания» свитка. Призовой фонд превысил 1 млн долларов, а главный приз в 700 тысяч достался команде из Ю. Надера, Л. Фарритора и Дж. Шиллингера.
Их модель, основанная на архитектуре TimeSformer и инструментах автосегментации Volume Cartographer, позволила восстановить около двух тысяч слов: философский текст о природе удовольствия, предположительно эпикурейца Филодема Гадарского. В свитке упоминаются музыка, еда и то, как еще человек может наслаждаться жизнью.
- Собрать прошлое по кусочкам
Иногда в распоряжении археологов оказываются тысячи элементов мозаик или фресок. В 2019 году организаторы международного конкурса DAFNE (Digital Anastylosis of Frescoes challeNgE) предложили участникам собрать цельную картину с помощью компьютерного зрения и МО из отдельных фрагментов, анализируя форму, цвет и текстуру каждого элемента. Даже если реальные фрагменты не соединить физически, цифровая модель может предложить реалистичные варианты реконструкции.

В рамках конкурса был создан DAFNE Dataset — открытый набор данных, который сегодня используют для обучения нейросетей реконструкции культурного наследия. Следующим шагом стало появление датасета RePAIR уже на основе настоящих археологических материалов. В нем используются более 16 000 фрагментов фресок из Помпей, 3D-сканы и аннотации археологов, собранные при восстановлении росписей, разрушенных во время бомбардировок Второй мировой войны.
- Возвращение архитектуры и виртуальные музеи
Французская компания Iconem применяет машинное зрение и фотограмметрию (создание из множества обычных фото 3D-модели) для цифрового воссоздания разрушенных памятников. Один из известных примеров — проект по восстановлению Триумфальной арки в сирийской Пальмире. Она была построена в III веке н.э., но разрушена в 2015 году террористами Исламского государства.
Уже в 2016 году Iconem использовала дроны для проведения 3D-съемки и анализа изображений, чтобы задокументировать ущерб и подготовить данные для потенциального восстановления арки в будущем. Затем при помощи алгоритмов машинного зрения удалось собрать точную модель объекта, опираясь на снимки сохранившейся части и разбросанных вокруг обломков памятника.

В целом идея виртуальных музеев получает все большее распространение. Так, платформа AI Virtual Museum воссоздает утраченные коллекции и экспозиции с помощью генеративных моделей и 3D-рендеринга. Алгоритмы восстанавливают облик артефактов по архивным изображениям, а пользователи могут «прогуляться» по залам в виртуальной и дополненной реальности. Благодаря этому культурное наследие становится доступным, независимо от того, где находятся оригиналы.
Все это зрелищные примеры, которые можно сразу представить широкой публике. Но на практике ИИ решает и не такие заметные задачи, которые помогают археологам:
- анализирует отчеты, спутниковые и аэрофотоснимки, находит аномалии местности. Это помогает определять потенциальные места для раскопок;
- сопоставляет артефакты, выполненные в одном стиле, чтобы установить связи между культурами и регионами;
- создает человекочитаемые описания музейных предметов и каталогов, автоматически определяя тип и размер артефакта;
- дополняет утраченные части надписей или изображений, предлагая несколько вероятных реконструкций экспертам.
Ограничения и будущее поколение исследователей
С одной стороны, МО уже помогает археологам решать разные задачи: от распознавания древних иероглифов и анализа отчетов до поиска потенциальных мест раскопок. ИИ берет на себя рутину либо может глубоко погружаться в контекст и отвечать на вопросы, требующие широкого научного кругозора.
С другой, у ИИ есть объективные ограничения. Результаты напрямую зависят от качества данных. Алгоритмы могут выдавать ошибочные интерпретации, особенно при недостатке контекста, поэтому все выводы требуют экспертной проверки. Некоторые задачи, например, определение возраста находки по изображению, совсем никак не могут быть решены без участия специалиста.

Хотя существуют успешные кейсы восстановления внешнего облика древних объектов и мест, как это было с Триумфальной аркой в Пальмире, системы могут галлюцинировать. Процесс реконструкции достоверен настолько, насколько достоверна обучающая выборка. Именно человек помогает корректно достроить картину и выбрать наиболее правдоподобные интерпретации системы.
Что касается будущего ИИ в археологии, то самым перспективным направлением здесь являются генеративные модели, помогающие предсказывать новые факты. Чтобы эффективно учить и применять такие модели, нужна консолидация данных в большие датасеты. В теории ИИ может сам писать научные работы и предлагать на валидацию экспертам.
Последнее по счету, но не по значению преимущество использования ИИ, заключается в том, что цифровые инструменты делают археологию ближе широкой аудитории. Теперь увидеть, как оживают древние надписи или восстанавливаются фрески, можно в своем смартфоне.

