Исследователи из Датского технического университета обнаружили удивительное сходство между процессами обучения искусственного интеллекта и человеческого мозга. Ключевым открытием стало выявление свойства выпуклости в глубоких нейронных сетях — того же математического принципа, который помогает людям формировать понятия и обобщать знания. Работа опубликована в журнале Nature Communications.
Мышление ИИ и человека имеют одинаковую скрытую геометрию

Команда под руководством профессора Ларса Кая Хансена исследовала внутренние представления ИИ — «латентные пространства», в которых машины организуют свое понимание мира. Ученые обнаружили, что искусственные нейронные сети формируют выпуклые области для понятий, причем это происходит естественным образом в процессе обучения на различных типах данных: изображениях, тексте, аудио, медицинских данных.

Ученые показали, что по уровню выпуклости в предварительно обученной модели можно предсказать, насколько хорошо она будет работать после специальной настройки на конкретную задачу. Это открывает путь к созданию более эффективных ИИ-систем, которые формируют выпуклые концептуальные области уже на этапе обучения.
Что такое выпуклость латентного пространства
Представьте, что у вас есть коллекция фотографий собак. Искусственный интеллект «видит» каждую фотографию как точку в многомерном пространстве — как если бы каждая собака была звездочкой на карте неба. Все эти точки-собаки образуют некую область в этом пространстве.

«Уровень выпуклости» характеризует то, насколько это облако похоже на правильную геометрическую фигуру без «вмятин» и «выступов». Если облако собак образует что-то вроде ровного овала — это высокая выпуклость. Если же оно изрезанное, с «заливами» и «мысами» — выпуклость низкая.
Исследователи обнаружили, что чем более «ровным овалом» располагаются понятия в памяти ИИ, тем лучше ИИ потом обучается новым задачам с этими понятиями. Можно сказать, если в мозгу машины собаки уже образуют четкое, выпуклое облако, то научить ее отличать овчарок от такс будет легче, чем если это облако размазано и изрезано.
Это похоже на то, как работает человеческий мозг — мы тоже лучше учимся новому, когда у нас уже есть четкое, организованное представление о базовых понятиях.
Открытие имеет важные практические последствия для создания более надежного искусственного интеллекта, особенно в критически важных областях, таких как здравоохранение и образование.