Проблема единой модели человеческого разума

На протяжении десятилетий психологи спорят над основным вопросом: может ли одна общая теория объяснить работу человеческого разума, или внимание, память и принятие решений требуют своих собственных моделей?

Новые исследования и модель «Центавр»

Недавние исследования, проведенные в рамках работы над искусственным интеллектом, привнесли в это обсуждение новую остроту. Исследование было опубликовано в высокорейтинговом журнале Nature и описывало модель искусственного интеллекта под названием «Центавр». Созданная путем тонкой настройки большой языковой модели на данных психологических экспериментов, «Центавр» смогла предсказать поведение человека по 160 когнитивным задачам, охватывающим принятие решений, исполнительный контроль и другие области. Эти результаты привлекли внимание, поскольку предполагали нечто смелое: одну модель, способную имитировать множество аспектов человеческого мышления.

Критика модели «Центавр»

Однако серьезная критика не заставила себя ждать. Исследователи из Университета Чжэцзян опубликовали статью в журнале National Science Open, в которой оспаривают эффективность модели «Центавр». По их мнению, работа модели может не отражать реальное понимание исследуемых задач и, наоборот, основывается на выявлении шаблонов ответов, а не на осмыслении самих задач.

Эксперименты с измененными условиями

Важно отметить, что первоначальные разработчики «Центавра», включая Бинза и его коллег, доказали, что модель может обобщать данные на новых участниках и испытаниях. Они измерили производительность модели, используя негативную логарифмическую вероятность, которая определяет, насколько хорошо модель предсказывает выборы людей. В их тестах «Центавр» превосходила несколько специализированных когнитивных моделей.

Вопрос, который поставили исследователи из Чжэцзяна, заключался в том, что происходит, если убрать информацию, которую модель якобы должна понимать. Чтобы ответить на него, они создали три измененных условия тестирования. В первом, названном «без инструкций», они полностью убрали указания к задачам, оставив только текст процедуры, описывающий ответы участников. Во втором, «без контекста», удалили как инструкции, так и процедуры, позволяя модели работать только с абстрактными токенами выбора, такими как «<>». Третье условие внесло еще больше путаницы, заменив реальные инструкции на вводящую в заблуждение директиву, требующую выбора символа «J» при появлении токена «<<».

Выводы и последствия

Если бы «Центавр» действительно понимала задачи, ее производительность должна была бы упасть до уровня случайных выборов при исчезновении ключевой информации. Тем не менее этого не произошло, что наводит на мысль о том, что модель, вероятно, основывается на тонких статистических указателях, встроенных в набор данных. В заданиях, созданных человеком, часто присутствуют незаметные для людей, но поддающиеся обнаружению алгоритмами, паттерны.

Эти результаты подчеркивают существование глубокой проблемы. Модель, ориентированная на язык, которая не может надежно следовать переписанным или вводящим в заблуждение инструкциям, вызывает опасения относительно более глубоких утверждений о своих способностях. Если «Центавр» обходила инструкции и вместо этого предсказывала вероятные ответы на основе статистического следа, то ее понимание внимания, памяти или принятия решений может оказаться более поверхностным, чем кажется.

Критика доказывает, что хотя идея единой модели является многообещающей, необходимо скептически подходить к оценке результатов. Исследование напоминает ученым о важности более сложной оценки: модели должны проходить испытания в измененных или вводящих в заблуждение условиях, а не только на чистых эталонных тестах.

Данные исследования показывают: несмотря на высокие результаты, модели ИИ могут иметь проблемы с глубоким пониманием. Для широкой общественности это служит предостережением о том, что заголовки о машинах, имитирующих человеческий разум, следует воспринимать с осторожностью. Высокие баллы не всегда означают понимание.

Таким образом, вопрос о движении к единой модели когнитивных процессов остается актуальным, но данный обмен мнениями показывает, что прогресс требует skepticism наравне с инновациями. Вопрос о работе человеческого разума по-прежнему является загадкой, даже для машин, обученных на миллионах слов.