Мозгу заранее известен точный момент наступления вознаграждения, и это знание определяет наше поведение.
Вентральная область покрышки (ventral tegmental area, VTA) — это небольшой участок мозга, который считается одним из ключевых звеньев системы мотивации и вознаграждения. Именно здесь вырабатывается дофамин — нейромодулятор, который помогает мозгу предугадывать, какие действия принесут вознаграждение, основываясь на обусловленных контекстом ситуации сигналах. Но новое исследование ученых из Университета Женевы, Гарварда и Университета Макгилла показало, что функции VTA значительно шире. Она не только кодирует факт ожидаемого вознаграждения, но и точно предсказывает момент, когда оно должно наступить.
До 1990-х годов считалось, что VTA напрямую связана с ощущением удовольствия. Однако последующие исследования изменили это представление: оказалось, что она не столько отвечает за само чувство, возникающее из-за награды, сколько кодирует предсказание ее получения. Например, если за световым сигналом регулярно следует вознаграждение, со временем VTA начинает вырабатывать дофамин не в момент его получения, а сразу после сигнала. То есть мозг фиксирует не само событие, а его вероятность — именно на этом основан механизм так называемого «обучения с подкреплением». Этот процесс лежит в основе не только нашего поведения, но и алгоритмов искусственного интеллекта которые тоже совершенствуют свои действия путем проб и ошибок.
Источник: hi-tech.mail.ru