Поддержать команду Зеркала
Беларусы на войне
  1. Кочанова высказалась о соцподдержке населения государством. Рассказываем, о чем явно «забыла» упомянуть чиновница
  2. Ученые: только одна страна в мире способна полностью обеспечить себя продовольствием. А Беларусь?
  3. Вернулся в страну после 50-летнего отсутствия и ужаснулся увиденному. История, пожалуй, самого эпатажного беларусского политика
  4. Умер бывший политзаключенный Александр Класковский. Ему было 46 лет
  5. В ГПК заявили, что Польша «прекратила принимать автобусы» из Беларуси. В чатах пишут, что их все же пропускают, но «очень медленно»
  6. «У людей шок от донатов на войну». Поговорили с сотрудником беларусского юрлица «Лесты», которое решено передать в собственность РФ
  7. На пятницу объявили оранжевый уровень опасности. К грозам, ливням, граду и шквалистому ветру добавилась еще одна «беда»
  8. «Не просто экономика, а шанс на выживание». Что пишут китайские СМИ о визите Лукашенко к Си Цзиньпину
  9. Трамп повысил пошлины на импортные сталь и алюминий для всех стран, кроме одной
  10. «Кремлевские чиновники публично признали, что Россия стремится к полному уничтожению Украины». ISW о высказываниях Медведева и Пескова
  11. Литва перестала признавать небиометрические паспорта россиян. А что с беларусскими? Узнали
  12. СМИ сообщают о задержании начальника Комитета здравоохранения Мингорисполкома. В приемной говорят, что он с понедельника «в отпуске»
  13. Обмен долларов и снятие наличных по-новому, введение комиссии, удар по вкладчикам. Банки вводят валютные изменения
  14. «Сам напросился, выпроваживать не стали». Зачем Лукашенко летал в Китай, где два дня ждал встречи с Си Цзиньпином


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.