ИИ становится настоящим ученым, если к обучающим данным добавить теорию, созданную человеком

Исследователи под руководством Пекинского университета разработали модель ИИ, которая способна обучаться на только на наборах данных, но и использовать наборы правил, например, законы природы, описанные людьми. Ученые показали, что таким образом они могут помочь ИИ учесть основные законы реального мира, чтобы решать сложные математические задачи и оптимизировать экспериментальные условия в химических экспериментах.
ИИ становится настоящим ученым, если к обучающим данным добавить теорию, созданную человеком
Припомним, перечтем, полюбим, потолкуем. DALLE-3
Когда вы учите ребенка решать головоломки, вы либо позволите ему разобраться в этом методом проб и ошибок, либо дадите несколько советов. Включение советов и правил в обучение ИИ, например, законов физики, может сделать его более точно отражающим реальный мир.

Исследователи под руководством Пекинского университета разработали структуру для оценки относительной ценности правил и данных в «информированных моделях машинного обучения», которые включают в себя и то, и другое. Ученые показали, что таким образом они могут помочь ИИ учесть основные законы реального мира и лучше ориентироваться в научных проблемах, таких как решение сложных математических задач и оптимизация экспериментальных условий в химических экспериментах.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«Внедрение человеческих знаний в модели ИИ потенциально может повысить их эффективность и способность делать выводы, но вопрос в том, как сбалансировать влияние данных и знаний», — говорит первый автор Хао Сюй из Пекинского университета. «Наша структура может быть использована для оценки различных знаний и правил для повышения прогностических возможностей моделей глубокого обучения».

Генеративные модели искусственного интеллекта, такие как ChatGPT или Sora, основаны исключительно на данных: моделям предоставляются обучающие данные, и они обучаются методом проб и ошибок. Однако, получая только данные, эти системы не имеют возможности изучать физические законы, такие как гравитация или гидродинамика, и им также трудно работать в ситуациях, которые отличаются от их обучающих данных.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как посадить ИИ за учебники

(A) Информационный поток в обычном машинном обучении, управляемом данными, и информированном машинном обучении.
(B) Пример уравнения Уравнение Бюргерса (одномерный случай уравнения Навье-Стокса) для информированного машинного обучения. Черные точки относятся к данным обучения. u и u' являются ссылками и предсказаниями соответственно. Среднеквадратическая ошибка для сценариев с распределением и без распределения отображается сплошными и пунктирными фиолетовыми линиями соответственно.
(C) Объяснение функции данных и правил информированного машинного обучения с точки зрения распределения выборки. Здесь правила относятся к формализованным знаниям, которые могут быть включены в модель машинного обучения.
(A) Информационный поток в обычном машинном обучении, управляемом данными, и информированном машинном обучении. (B) Пример уравнения Уравнение Бюргерса (одномерный случай уравнения Навье-Стокса) для информированного машинного обучения. Черные точки относятся к данным обучения. u и u' являются ссылками и предсказаниями соответственно. Среднеквадратическая ошибка для сценариев с распределением и без распределения отображается сплошными и пунктирными фиолетовыми линиями соответственно. (C) Объяснение функции данных и правил информированного машинного обучения с точки зрения распределения выборки. Здесь правила относятся к формализованным знаниям, которые могут быть включены в модель машинного обучения.
https://www.cell.com/nexus/fulltext/S2950-1601(24)00001-9
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Альтернативный подход — это информированное машинное обучение, при котором исследователи предоставляют модели некоторые базовые правила, помогающие управлять процессом обучения, но пока не вполне понятно как сделать.

«Мы пытаемся научить модели ИИ законам физики, чтобы они могли лучше отражать реальный мир, что сделало бы их более полезными в науке и технике», — говорит соавтор работы Юньтянь Чен из Восточного технологического института в Нинбо.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Чтобы повысить производительность информированного машинного обучения, команда разработала структуру для расчета вклада отдельного правила в точность прогнозирования данной модели. Исследователи также изучили взаимодействие между различными правилами, поскольку большинство информированных моделей машинного обучения включают в себя несколько правил, а слишком большое количество правил может привести к сбою моделей.

Это позволило ученым оптимизировать модели, регулируя относительное влияние различных правил и полностью отфильтровывать избыточные или противоречивые правила.

«Мы обнаружили, что правила имеют разные типы взаимосвязей, и мы используем эти взаимосвязи, чтобы ускорить обучение модели и повысить точность», — говорит Чен.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Исследователи говорят, что их структура имеет широкое практическое применение в инженерии, физике и химии. Они продемонстрировали потенциал метода, используя его для оптимизации моделей машинного обучения при решении многомерных уравнений и прогнозировании результатов экспериментов по тонкослойной хроматографии и оптимизации будущих условий экспериментальной химии.

Исследователи планируют превратить свою структуру в загружаемый плагин, который смогут использовать другие разработчики ИИ. В конечном счете, ученые хотят обучить свои модели так, чтобы они могли извлекать необходимые им знания и правила непосредственно из данных, а не только использовать правила, выбранные исследователями-людьми.

«Мы хотим сделать это замкнутым циклом, превратив модель в настоящего ученого», — говорит Чен. — «Мы работаем над разработкой модели, которая сможет напрямую извлекать знания из данных, а затем использовать эти знания для создания правил и самосовершенствования».