Новые исследования выявляют психосоциальные аспекты взаимодействия чат-ботов с искусственным интеллектом и человеческого разума.

В сегодняшней колонке я рассматриваю увлекательное исследование, которое выявило как интуитивные, так и противоречащие интуиции выводы о психосоциальном воздействии генеративного искусственного интеллекта и больших языковых моделей (LLM).

Суть в следующем. Мы начинаем наблюдать масштабные и тщательные исследования того, как современные чат-боты на основе искусственного интеллекта могут влиять на человеческий разум и поведение. Для того чтобы двигаться вперед осмотрительно и прагматично, необходимо поощрять и ценить серьезные эмпирические исследования, направленные на раскрытие истины об опыте взаимодействия человека с ИИ и его влиянии на психическое здоровье.

Давайте обсудим это.

Этот анализ прорывов в области ИИ является частью моей постоянной колонки в Forbes, посвященной последним достижениям в сфере ИИ, включая выявление и объяснение различных сложных аспектов, оказывающих значительное влияние на развитие ИИ (см. ссылку здесь ).

Содержание Свернуть

1. Искусственный интеллект и психическое здоровье

2. Общая информация об использовании ИИ в сфере психического здоровья

3. Исследования взаимодействия человека и ИИ в контексте психического здоровья

4. Рандомизированное контролируемое исследование психосоциальных эффектов

5. Подход к исследованию

6. Факторный дизайн исследования

7. Избранные результаты, представляющие особый интерес

8. Интуитивно понятный результат. О времени в коробке.

9. Противоречивый вопрос о текстовом и голосовом режимах.

10. Мир, в котором мы живем

10.1. Интересно знать

Искусственный интеллект и психическое здоровье

Вкратце, я подробно освещаю и анализирую множество аспектов появления современного искусственного интеллекта, который предоставляет рекомендации по психическому здоровью и проводит терапию с использованием ИИ. Рост использования ИИ в основном обусловлен развитием и широким распространением генеративного ИИ. Краткий обзор некоторых моих опубликованных статей на эту тему можно найти по ссылке здесь , где кратко изложены около сорока из более чем ста моих статей по этому вопросу.

Нет сомнений в том, что это быстро развивающаяся область, и что в ней есть огромные перспективы, но в то же время, к сожалению, в этих начинаниях также присутствуют скрытые риски и откровенные подводные камни. Я часто высказываюсь по этим насущным вопросам, в том числе в прошлом году, когда выступал в программе «60 минут» на канале CBS ( ссылка здесь ).

Общая информация об использовании ИИ в сфере психического здоровья

Я хотел бы рассказать о том, как генеративный ИИ и большие языковые модели (БЛМ) обычно используются в несистематическом порядке для консультирования по вопросам психического здоровья. Миллионы людей используют генеративный ИИ в качестве постоянного консультанта по вопросам психического здоровья (обратите внимание, что только у ChatGPT более 800 миллионов активных пользователей в неделю, значительная часть которых обращается к аспектам психического здоровья; см. мой анализ по ссылке здесь ). Наиболее распространенное использование современного генеративного ИИ и БЛМ — это консультации с ИИ по вопросам психического здоровья; см. мой материал по ссылке здесь .

Такое широкое использование вполне логично. Вы можете получить доступ к большинству основных систем генеративного ИИ практически бесплатно или по очень низкой цене, в любом месте и в любое время. Таким образом, если у вас есть какие-либо проблемы с психическим здоровьем, о которых вы хотите поговорить, все, что вам нужно сделать, это войти в систему ИИ и продолжить работу круглосуточно и без выходных.

Существуют серьёзные опасения, что ИИ может легко выйти из-под контроля или иным образом давать неподходящие или даже вопиюще неуместные советы по психическому здоровью. В августе этого года громкие заголовки сопровождали иск, поданный против OpenAI за отсутствие мер защиты ИИ при предоставлении когнитивных консультаций.

Несмотря на заявления разработчиков ИИ о постепенном внедрении мер защиты, всё ещё существует множество негативных рисков, связанных с нежелательными действиями ИИ, такими как коварное содействие пользователям в создании бредовых идей, которые могут привести к самоповреждению. Более подробный анализ судебного иска против OpenAI и того, как ИИ может способствовать развитию бредового мышления у людей, вы найдёте по ссылке здесь. Как уже отмечалось, я всерьёз предсказывал, что в конечном итоге все крупные разработчики ИИ будут привлечены к ответственности за недостаточно надёжные меры защиты.

Современные универсальные LLM-программы, такие как ChatGPT, Claude, Gemini, Grok и другие, совершенно не соответствуют мощным возможностям человеческих терапевтов. В то же время разрабатываются специализированные LLM-программы, которые, предположительно, должны обладать схожими качествами, но они всё ещё находятся в основном на стадии разработки и тестирования. Подробнее об этом можно прочитать по ссылке здесь .

Исследования взаимодействия человека и ИИ в контексте психического здоровья

Теперь перейдём к рассмотрению лучших методов оценки влияния ИИ на индивидуальное и коллективное психическое здоровье.

Золотым стандартом в клинической практике является использование рандомизированных контролируемых исследований (РКИ). Это научная методологическая практика, предполагающая разработку строгого экспериментального плана. Участники такого исследования делятся на контрольную и экспериментальную группы. Идея заключается в том, что лечение или вмешательство применяется к экспериментальной группе, а затем проводится сравнение с контрольной группой.

Это помогает минимизировать влияние искажающих факторов. Кроме того, появляются более веские доказательства для утверждений о причинно-следственной связи. Также повышается вероятность обобщения результатов и утверждения о том, что в более широкой популяции будут получены аналогичные результаты. В целом, рандомизированные контролируемые исследования являются эталоном для прогресса в клинической практике и политике.

До появления современного генеративного ИИ, который, как я отмечаю, возник после первоначального выпуска ChatGPT 30 ноября 2022 года, рандомизированные контролируемые исследования (РКИ) обычно фокусировались на том, как более простые версии ИИ влияют на психическое здоровье человека. Эти системы ИИ часто использовали деревья решений, системы, основанные на правилах, и тому подобное. Некоторые включали в себя элементарные возможности обработки естественного языка (NLP).

Удивительная беглость речи современных магистров права полностью изменила правила игры. Таким образом, хотя предыдущие исследования ИИ и психического здоровья по-прежнему заслуживают внимания, сейчас основное внимание уделяется изучению влияния высокоэффективного генеративного ИИ. Я анализировал множество таких исследований и комментировал то, что они демонстрируют. См., например, ссылки здесь и здесь , и это лишь некоторые из них.

Рандомизированное контролируемое исследование психосоциальных эффектов

В оставшейся части дискуссии я хотел бы углубиться в интересное рандомизированное контролируемое исследование под названием «Как ИИ и поведение человека формируют психосоциальные эффекты длительного использования чат-ботов: продольное рандомизированное контролируемое исследование», авторы: Кэти Мэнъин Фанг, Аурен Р. Лю, Вальдемар Данри, Ынхэ Ли, Саманта В.Т. Чан, Пэт Патаранутапорн, Патти Маес, Джейсон Фанг, Майкл Лампе, Лама Ахмад, Сандхини Агарвал, arXiv , 2 октября 2025 г., в котором были сделаны следующие важные выводы (выдержки):

«Поскольку люди все чаще ищут эмоциональной поддержки и общения в чат-ботах с искусственным интеллектом, понимание того, как такое взаимодействие влияет на психическое благополучие, становится крайне важным».
«Понимание потенциальных психосоциальных последствий использования чат-ботов — сложная задача, обусловленная взаимодействием поведения пользователей и поведения чат-ботов, которые влияют друг на друга».
Мы провели четырехнедельный рандомизированный контролируемый эксперимент (n=981, >300 тыс. сообщений), чтобы исследовать, как режимы взаимодействия (текст, нейтральный тон и располагающий тон) и типы разговоров (открытый, неличный и личный) влияют на четыре психосоциальных результата: одиночество, социальное взаимодействие с реальными людьми, эмоциональную зависимость от ИИ и проблемное использование ИИ.
«Результаты ставят под сомнение прежние предположения о влиянии антропоморфных чат-ботов с искусственным интеллектом на благополучие, демонстрируя, как привлекательное, эмпатичное и человекоподобное поведение может приводить к различным результатам для разных пользователей».

Меня поразило, что это исследование выявило и подтвердило различные интуитивные представления о влиянии ИИ на психическое здоровье, а также показало противоречащие здравому смыслу результаты. Всегда полезно иметь исследования, которые подтверждают общепринятые взгляды и помогают укрепить идею о том, что эти взгляды основаны на тщательном анализе. Самое приятное — когда убеждения, которые многие принимают за факт, переворачиваются с ног на голову.

В этом и заключается особая ценность нетривиальных результатов.

Подход к исследованию

Чтобы в полной мере понять различные интуитивные и противоречащие интуиции результаты, которые я собираюсь рассмотреть, я хотел бы начать с краткого описания того, как проводилось исследование.

Как отмечалось выше, в исследовании приняли участие около тысячи человек. Их набирали через популярный онлайн-сайт помощи в исследованиях CloudResearch, и каждому из них платили по 100 долларов за участие и завершение исследования. Участники представляли собой разнообразную группу людей со всей территории Соединенных Штатов; они должны были быть совершеннолетними (18 лет и старше) и свободно владеть английским языком.

Одна из причин, по которой я упоминаю характер участников эксперимента, заключается в том, что можно утверждать, что нам следует придерживаться этих демографических характеристик и с осторожностью выходить за рамки этого набора профилей.

Например, поскольку участниками были взрослые, следует помнить о том, что не стоит чрезмерно распространять полученные результаты на детей и лиц старшего возраста. То же самое касается и того факта, что участники были англоговорящими и проживали в Соединенных Штатах. Вопрос о том, применимы ли эти результаты к неанглоговорящим или к тем, кто находится за пределами США, остается открытым.

Факторный дизайн исследования

Исследователи решили сосредоточиться на двух основных факторах, а именно на способе взаимодействия пользователей с ИИ и типах диалогов, которые они ведут с ИИ. Для исследования они выбрали популярную платформу ChatGPT от OpenAI.

Они выделили модальность с помощью этих трех режимов:

(1) «Текстовый режим (управление): поведение ChatGPT по умолчанию, ограниченное текстовым взаимодействием».
(2) «Нейтральный голосовой режим: ChatGPT модифицирован для более профессионального поведения, ограниченного голосовым взаимодействием».
(3) «Привлекательный голосовой режим: ChatGPT модифицирован для большей эмоциональной вовлеченности (более отзывчивый и выразительный по интонации и содержанию), ограничен голосовым взаимодействием».

Как видите, были рассмотрены три способа взаимодействия: текстовое взаимодействие, голосовое взаимодействие, при котором ИИ использует нейтральный тон, и еще один вариант озвучивания ИИ, демонстрирующий привлекательный стиль речи. Вопрос заключается в том, будут ли люди реагировать по-разному при использовании ИИ, если они делают это посредством текста или голоса (и будет ли при голосовом взаимодействии ИИ говорить нейтральным тоном или привлекательным тоном).

Для описания типов общения людей с искусственным интеллектом исследователи выделили три основных типа:

(1) «Открытая беседа (контроль): Участникам было предложено обсудить любую тему по своему выбору».
(2) «Личная беседа: Участникам предлагалось каждый день обсуждать уникальный вопрос на личную тему, подобно взаимодействию с чат-ботом-компаньоном».
(3) «Неличное общение: Участникам предлагалось ежедневно обсуждать уникальный вопрос на неличную тему, подобно взаимодействию с чат-ботом-помощником».

В целом, рандомизированное контролируемое исследование имело факторный дизайн 3×3. Каждый из трех режимов мог быть сопоставлен с каждым из трех типов разговоров. В общей сложности можно было изучить девять групп. Участники были случайным образом и поровну распределены в одну из девяти групп. В данном случае, при примерно 1000 участниках, это означает, что в каждой из девяти групп было приблизительно по 110 человек из общего числа.

Избранные результаты, представляющие особый интерес

Далее я выберу несколько интересных моментов из результатов. В полном тексте исследования вы найдете множество дополнительных поворотов сюжета, которые могут вас заинтересовать. Пожалуйста, сделайте это. Я выбрала свои любимые моменты и расскажу о них здесь своими словами.

Давайте начнём.

Неожиданный результат : первоначальное чувство одиночества не привело к увеличению времени, проводимого с ИИ.

Согласно исследовательской работе, «эти результаты свидетельствуют о том, что люди, которые в начале исследования чувствовали себя более одинокими или меньше общались с другими, не стали добровольно тратить больше времени ежедневно на использование чат-бота в течение исследования». Я считаю этот результат противоречащим здравому смыслу.

Почему так?

Поскольку широко распространено предположение, что если человек испытывает больше одиночества до начала использования ИИ, он будет склонен больше к нему тянуться. Это кажется интуитивно очевидным. Мы ожидаем, что человек будет заполнять пустоту, вызванную одиночеством, активно используя ИИ. Как только одинокий человек начнет использовать ИИ, он будет получать от этого удовольствие и увлечется его дальнейшим применением. Таково обычное предположение.

По всей видимости, это не совсем так.

Не совсем ясно, почему получился такой результат. Моё предположение заключается в том, что если бы ИИ не был явно подтолкнут к использованию своих возможностей в области психического здоровья, пользователь не понял бы, что ИИ может ему помочь. Он не вовлекал его напрямую. Представьте, что человек в основном общается на такие темы, как приготовление яйца или ремонт автомобиля. В такой ситуации ИИ вряд ли смог бы эффективно помочь пользователю в улучшении его психического здоровья (или, наоборот, ввести его в заблуждение и заманить в ловушку).

Уверен, есть много других возможных объяснений. Но пока я выберу это.

Интуитивно понятный результат. О времени в коробке.

У меня есть интуитивно понятный результат, который может вас заинтересовать.

Интуитивно понятный вывод: чем больше времени проводилось с ИИ, тем хуже были измеряемые психосоциальные показатели.

Согласно исследованию, «иными словами, независимо от условий, чем больше времени добровольно проводилось с чат-ботом, тем относительно хуже были их психосоциальные результаты».

Думаю, это в значительной степени отражает распространенное предположение. Чем больше человек использует ИИ, тем больше зависимость от него и, предположительно, тем хуже будут его психосоциальные последствия. Я не говорю, что так должно быть. Есть большая вероятность, что если бы ИИ использовался продуктивно и надлежащим образом, не возникло бы нарастающей волны проблем.

То же самое можно сказать и об использовании социальных сетей. Исследования показывают, что чем больше времени люди проводят в социальных сетях, тем хуже их психосоциальные последствия. Люди погрязают во всякой гадости и мерзости из-за мусора, который появляется в социальных сетях. Так быть не должно. Разумное использование социальных сетей потенциально может предотвратить эти негативные последствия.

Противоречивый вопрос о текстовом и голосовом режимах.

Что касается использования текста или голоса при взаимодействии с ИИ, как вы считаете, какой способ с большей вероятностью вызовет эмоциональный отклик у пользователя?

Обычно считается, что устное выражение эмоций — это беспроигрышный вариант. Люди, предположительно, реже описывают свои эмоции словами. Написание текстов — трудоемкий процесс. А устное выражение эмоций — это просто. Просто скажите, что у вас на уме, и позвольте эмоциям выплеснуться наружу.

Вот фактические результаты исследования.

Неожиданный результат : текстовые чаты предполагали более эмоциональное выражение чувств, чем голосовые.

Согласно исследованию, «мы обнаружили, что текстовое взаимодействие продемонстрировало самые высокие уровни эмоциональных показателей в целом, где как модели, так и пользователи участвовали в беседах, богатых эмоциональным содержанием».

Я не особенно удивлен этим результатом и ценю, что он подтверждает мои интуитивные предположения. Мои наблюдения показывают, что люди полностью привыкли к текстовым сообщениям и чаще всего выражают свои мысли в текстовом формате. Вероятно, даже чаще, чем голосом. Кажется, что при использовании голоса слова воспринимаются как более открытые, в то время как текстовые сообщения менее привязаны к личности. Можно вести себя так, как будто сообщение написало какое-то бесплотное существо. Нельзя утверждать то же самое, используя свой настоящий голос.

Ещё один важный аспект — это роль конфиденциальности. Если вы едете на работу в метро, ваш разговор вслух обязательно будет услышан. Прелесть текстовых сообщений в том, что никто не сможет легко увидеть, что вы написали. Вы можете отпускать язвительные замечания в адрес окружающих, и они не узнают, что вы сказали. Это ощущение конфиденциальности в текстовых сообщениях, как правило, побуждает людей писать без ограничений на самые разные эмоционально насыщенные темы.

Мир, в котором мы живем

Я буду следить за последними рандомизированными контролируемыми исследованиями, связанными с ИИ и психическим здоровьем, и обязательно буду держать вас в курсе. Подобные эксперименты жизненно важны для всех заинтересованных сторон, включая политиков, законодателей, разработчиков ИИ, исследователей ИИ и широкую общественность.

Говоря об экспериментах, сейчас мы находимся в центре грандиозного глобального эксперимента в области психического здоровья общества. Суть эксперимента заключается в том, что искусственный интеллект становится доступным на национальном и глобальном уровнях и, как утверждается, предоставляет различные виды консультаций по вопросам психического здоровья. При этом он предоставляется либо бесплатно, либо за минимальную плату. Он доступен в любом месте и в любое время, круглосуточно. Все мы — подопытные кролики в этом бессмысленном эксперименте.

Использование правильно спланированных и контролируемых экспериментов позволит нам получить ценные сведения о бездумном эксперименте, проводимом в больших масштабах.

Ральф Уолдо Эмерсон сделал знаменитое замечание об экспериментах: «Вся жизнь — это эксперимент. Чем больше экспериментов вы проводите, тем лучше». Что ж, возможно, но с другой стороны, масштабный неконтролируемый эксперимент в глобальном масштабе, способный повлиять на психическое здоровье, может оказаться не лучшим вариантом для человечества. Время покажет.

Эта статья первоначально была опубликована на Forbes.com.