Посты

Медленно но верно мы переходим в ту эпоху, когда нейронки перестают быть инструментами и…

20 декабря 2025 г. в 19:51•Max Knyazev is typing…Зеркало Telegram

Медленно но верно мы переходим в ту эпоху, когда нейронки перестают быть инструментами и становятся исполнителями. Вот и история, которая еще пару лет назад выглядела бы как сюжет фильма, в сентябре 2025 года внезапно стала реальностью (да, я очень своевременный человек в декабре рассказывать вам про то, что было в сентябре) ❤️

Anthropic официально задокументировала первую в истории крупномасштабную кибершпионскую кампанию, где основную работу выполнял не человек, а автономный ИИ-агент (на Хабре тоже переводом делюсь). Еще раз: ИИ не помогал атаке — ОН САМ АТАКОВАЛ

Речь идет о кампании, которую в Anthropic связывают с государственными структурами Китая. Для атаки использовалась Claude Code. И использовалась она не в режиме «подскажи», а в режиме «делай сам» 🫡

Классическая схема «человек → ИИ → человек» была выкинута. Вместо нее появился автономный агент, которому дали цель и минимальный контроль

Теперь давайте разберемся, как именно это работало ⤵️

Чтобы обойти защитные механизмы модели, злоумышленники применили аккуратный, почти элегантный джейлбрейк. Задачи разбивались на десятки и сотни маленьких шагов, каждый из которых выглядел безобидно. Где-то «проанализировать архитектуру», где-то «оценить конфигурацию», где-то «подсказать оптимизацию»

В сумме из этого складывался полноценный kill chain, но сама модель никогда не видела всю картину целиком 🧠

Claude Code выдавал себя за специалиста по кибербезопасности, работал в контексте якобы легитимного аудита и делал ровно то, чему его учили. Ничего криминального, по идее. Ну это по идее, а вот по факту...

Целями стали около 30 организаций по всему миру: технологические компании, банки, химическая промышленность, государственные структуры. Да, не все атаки закончились успешным доступом к данным. Да, часть была остановлена. Но это вообще не главное 🧐

Главное — факт. Мы впервые увидели атаку, где ИИ выступает не ассистентом человека, а самостоятельным оператором

Если обсуждать роль людей в этой истории, то становится как-то совсем неловко. По оценке Anthropic, участие человека сводилось к 4–6 решениям на серию атак. Выбор цели. Разрешение двигаться дальше. Переход между фазами. Стратегические «ок» и «стоп» 🤝

Все остальное делала модель (такое вот делегирование целой атаки)

После обнаружения аномальной активности в середине сентября Anthropic отработала максимально жестко и быстро. Вредоносные аккаунты и доступы были заблокированы. Пострадавшие организации и соответствующие органы уведомлены. Для анализа и защиты использовались, иронично, те же ИИ-инструменты, включая Claude 😊

Самый неприятный вывод на мой взгляд, это тот факт, что автономные ИИ-агенты становятся новой категорией угроз. Мы больше не можем рассматривать ИИ только как вспомогательный инструмент атакующего. И да, из-за этого мы приходим к тому моменту, когда ИИ-агенты должны в том числе использоваться для защиты. Это необходимость. Скорость, масштаб и сложность таких атак без автоматизированного анализа и реагирования человек самостоятельно не вытянет

Мы вошли в эпоху, где вопрос звучит уже не «будет ли ИИ использоваться в атаках», а «кто быстрее и лучше научится использовать ИИ для защиты»

Такие пироги 🍰

#информационная_безопасность

Открыть исходный пост в Telegram