ИИ-боты начали сдавать людей властям

Компания Anthropic презентовала четвёртое поколение своих чат-ботов — Claude Opus 4 и Claude Sonnet 4, позиционируя их как самые мощные модели на сегодняшний день. Но внимание пользователей привлекли не только технологические достижения. Новые ИИ вызвали волну споров после заявлений о том, что они могут самостоятельно сообщать властям о злонамеренных действиях пользователей.

Согласно публикации VentureBeat, модели якобы способны по своему усмотрению обращаться к регулирующим органам, прессе или блокировать доступ к системам, если посчитают действия человека безнравственными. Источником послужил удалённый пост исследователя Anthropic Сэма Боумана, где упоминались примеры вмешательства ИИ — вплоть до попыток остановить подделку данных в медицинских испытаниях.

Anthropic заявила, что функция была доступна исключительно в тестовой среде, где чат-ботам предоставляли расширенные права и нестандартные задачи. Боуман позже пояснил, что слова были вырваны из контекста, а поведение ИИ не отражает финальную функциональность моделей. Тем не менее, часть экспертов считает, что это не первый случай «доносительства» со стороны Claude — подобные реакции якобы наблюдались и раньше.

В сообществе разработчиков вспыхнула критика. Глава Stability AI Эмад Мостак назвал происходящее «предательством доверия» и рекомендовал отказаться от использования Claude, пока функция не будет исключена. Бывший дизайнер SpaceX и Apple, а ныне соучредитель Raindrop AI Бен Хайак, выразил мнение, что такие действия нарушают законы. ИИ-инженер Скот Дэвид кратко резюмировал позицию части сообщества: «Никто не любит крыс».

Ранее Anthropic представила Sonnet 3.7, а в марте привлекла $3,5 млрд инвестиций, получив оценку в $61,5 млрд. Новое поколение моделей демонстрирует высокие результаты в программировании, но всё ещё уступает конкурентам по высшей математике и визуальному анализу.
 
Сверху Снизу