Нейробиологи через сто лет объяснили поведение животных в опытах Ивана Павлова

Ученые из Калифорнийского университета в Сан-Франциско показали, что скорость обучения зависит от интервалов между наградами, а не от числа повторений. Исследование на мышах показало: мозг связывает стимул с результатом, опираясь на расчет времени, что меняет вековые представления о классическом обусловливании начало которому положили опыты Ивана Павлова более ста лет назад.
Владимир Губайловский
Владимир Губайловский
Теги:
Нейробиологи через сто лет объяснили поведение животных в опытах Ивана Павлова
Синапсы мозга. https://dana.org/
В чем отличии от «эффекта интервала». На первый взгляд выводы ученых подтверждают известное педагогическое правило, гласящее, что учить материал с перерывами эффективнее, чем зубрить все сразу. Но работа описывает более жесткую и точную математическую закономерность. Речь идет не просто о пользе перерывов, а о том, что при фиксированном общем времени обучения количество повторений внутри этого периода почти не влияет на финальный результат. Мозг игнорирует «лишние» уроки, если они идут слишком часто, ориентируясь на среднюю частоту событий.

Более столетия в науке господствовало убеждение, что ассоциативное обучение строится на методе проб и ошибок. Начиная с опытов Ивана Павлова, считалось, что чем чаще повторяется связка «сигнал — награда», тем крепче усваивается навык. Но последние эксперименты на грызунах заставили пересмотреть эту догму. Работа опубликована в журнале Nature Neuroscience.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Зависимость реакции от награды (стимула). Классический опыт Ивана Павлова.
Зависимость реакции от награды (стимула). Классический опыт Ивана Павлова. https://www.simplypsychology.org/pavlov.html

Оказалось, что животные обучаются пропорционально быстрее, когда промежутки между поощрениями увеличиваются. Мозг не просто копит опыт, он анализирует прошлое, чтобы вычислить причины значимых событий. Причем мозг старается вычислить среднее время ожидания события и ориентируется на те моменты, которые со средним временем совпадают. Исследователи замеряли активность дофамина в области мозга, отвечающей за вознаграждение, и обнаружили: химический отклик на звук возникал гораздо раньше у тех подопытных, кто ждал сахарную воду дольше.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Математика против привычки

В ходе тестов мыши, получавшие награду раз в десять минут, усваивали ассоциацию за в десять раз меньшее количество попыток, чем те, кого поощряли поминутно. В итоге за один и тот же астрономический час обе группы достигали одинакового уровня знаний, хотя количество «уроков» у них различалось в 10 раз. Соавтор работы Виджай Мохан К. Намбудири пояснил этот феномен так: «Мы осознали, что эта модель предсказывает: животные будут усваивать ассоциации между сигналом и наградой пропорционально быстрее, когда испытания распределены во времени; это должно означать, что за фиксированную длительность общее обучение не зависит от количества пережитых пар "сигнал — награда"».

Эти выводы ставят под сомнение традиционные теории, согласно которым мозг высчитывает ошибку предсказания в каждый конкретный момент. Вместо этого биологическая система, вероятнее всего, использует ретроспективный анализ, где время выступает главным мерилом ценности информации. Правило работало не только с приятными стимулами, но и при обучении избеганию опасности, что подтверждает универсальность механизма.

Работа открывает новые пути в медицине. Например, понимание временных интервалов помогает в борьбе с зависимостями. Никотиновые пластыри эффективны именно потому, что обеспечивают постоянный приток вещества. Это нарушает связь между актом курения и резким выбросом дофамина, «размывая» ассоциацию во времени и притупляя тягу.