Хранение в ДНК: как работает система, способная уместить 60 петабайт в литре

Американская биотехкомпания Atlas Data Storage представила систему хранения данных на синтетической ДНК. Она способна уместить до 60 петабайт информации в одном литре вещества — но до массового применения технологии пока далеко.
Юрий Гандрабура
Юрий Гандрабура
Журналист-переводчик
Хранение в ДНК: как работает система, способная уместить 60 петабайт в литре
Atlas Data Storage

Новый продукт Atlas Eon 100 позиционируют как решение для долговременного хранения «незаменимых архивов» — от семейных фото и научных данных до мастер-копий фильмов, музыки и цифрового искусства. Компания утверждает, что такие данные можно сохранять тысячелетиями.

Однако за впечатляющими цифрами скрываются серьезные технологические и экономические ограничения.
Схема, показывающая процесс хранения данных ДНК. /
Схема, показывающая процесс хранения данных ДНК. / Atlas Data Storage
60 петабайт (ПБ) — это 61 440 терабайт

Хранение данных в ДНК — как работает система

  1. В основе технологии лежит принцип кодирования цифровых данных — нулей и единиц — в последовательности ДНК из четырех оснований: аденина, цитозина, гуанина и тимина.
  2. Искусственно синтезированную ДНК высушивают и хранят в виде порошка в герметичных стальных капсулах.
  3. Для считывания данные вновь «оживляют»: ДНК секвенируют и переводят обратно в бинарный код.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

По заявлению представителей компании Atlas, один литр такого носителя способен вместить эквивалент 10 млрд песен или 12 млн фильмов в HD-качестве. Это примерно в тысячу раз плотнее, чем магнитная лента — один из самых емких традиционных архивных носителей.

  • Дополнительный плюс — стабильность: ДНК может сохранять структуру веками, тогда как ленты деградируют за 10–15 лет даже при строгом контроле условий.
Компания также подчеркивает удобство резервного копирования: после записи одной цепочки ДНК ферменты позволяют за считаные часы создать миллиарды копий.
Atlas Data Storage
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

На фоне стремительного роста объемов данных — около 280 петабайт в минуту, по оценке Atlas, — технология выглядит как потенциальный ответ на «архивный кризис», усиленный развитием ИИ.

Проблема памяти

Но ключевая проблема — масштабируемость.

  1. Синтез ДНК по-прежнему занимает дни и обходится дорого.
  2. Чтение данных тоже небыстрое и недешевое: секвенирование одного гигабазы ДНК (около 250 ГБ данных) стоит примерно $30 и требует времени.
  3. Эксперты отмечают, что именно запись, а не чтение остается главным узким местом технологии.

Профессор Томас Хайнис из Имперского колледжа Лондона скептически относится к коммерческим перспективам: без конкурентной стоимости синтеза ДНК массовое внедрение невозможно.

По оценке отраслевого альянса DNA Data Storage Alliance, до использования таких систем в реальных архивах пройдет как минимум 3–5 лет.