
Большинство разработчиков используют Claude Code для рефакторинга и написания функций. Codex — для фич и багфиксов. Это работает, но можно найти новые сценарии.
Реальная мощь AI-агентов открывается, когда вы начинаете воспринимать их как универсальных автономных исполнителей, способных делать всё, что можно описать в терминале. Идеи материализуются почти со скоростью мысли: между “а что если…” и работающим прототипом — минуты, не дни. Ограничение только одно — ваша фантазия.
Web-исследования на автопилоте
Запустить Claude Code с web-поиском и делегировать ему сбор информации — очевидный сценарий. Неочевидное: насколько глубоко он может копать. (буквально deep research у вас дома)
Пример: Анализ конкурентов с pricing-таблицами
claude
> Найди 10 SaaS-сервисов для управления проектами, запущенных
> в 2024-2026. Для каждого собери: ценообразование (все тарифы), ключевын фичи,
> технический стэк, финансирование
> Сохрани в markdown файле: saas-analysis.md
Claude Code использует встроенные сервисы web-поиск, посещает сайты, парсит страницы, проверяет Crunchbase и прочие базы для данных о финансировании. Результат — структурированный отчёт за 5-10 минут.
Где это работает:
- Исследование трендов перед запуском продукта
- Сбор кейсов для презентаций (“найди 20 компаний, которые мигрировали с Postgres на TimescaleDB”)
- Технический due diligence (“проверь, какие CVE были у этой библиотеки за последний год”)

Skills: расширяемость без лимитов
Claude Code поддерживает skills — кастомные инструкции, которые превращают агента в специалиста. Skills можно писать самому или искать готовые.
SEO-оптимизация контента
Skill seo-optimizer (гипотетический пример, но вы можете написать свой):
/seo-optimize blog/my-post.md --keyword "AI agents" --target-lang ru
Агент:
- Анализирует текущий контент
- Проверяет keyword density
- Генерирует meta description и title
- Добавляет internal links на релевантные статьи
- Форматирует headings для featured snippets
Генерация изображений
Skill для генерации изображений подключается к Nano Banana Pro (модель Gemini 3 Pro Image от Google DeepMind) и работает прямо из Claude Code:
/nanobanana "futuristic dashboard UI, dark theme,
high-quality digital art" --width 1920 --height 1080
Nano Banana Pro отлично рендерит текст на изображениях (вывески, диаграммы, mockups с реальным контентом), поддерживает 4K и понимает сложные составные промпты. Результат конвертируется в WebP автоматически. Идеально для прототипирования лендингов, hero images, инфографики.
Другие полезные skills:
better-icons— поиск иконок из 200+ библиотек (Iconify) и вставка SVGthreejs-*— целая серия skills для 3D-графики (geometry, shaders, lighting, loaders)agent-browser— автоматизация браузера для тестирования и скрапингаagent-pipeline— многоступенчатый pipeline (spec → plan → implementation → review)
Пентест и security audit
Запустить агента с задачей “найди уязвимости” звучит амбициозно, но работает лучше, чем кажется. Ключевое — давать конкретные задачи, а не абстрактное “проверь безопасность”.

Статический анализ (SAST)
Агент читает код и ищет известные паттерны уязвимостей. Не замена специализированным сканерам вроде Semgrep, но хорошее дополнение — потому что агент понимает контекст.
claude
> Проведи security audit src/api/ по OWASP Top 10. Для каждой категории:
> 1. Broken Access Control — есть ли эндпоинты без проверки авторизации?
> 2. Injection — пользовательский ввод попадает в SQL/shell без санитизации?
> 3. Cryptographic Failures — захардкоженные секреты, слабые алгоритмы?
> 4. Security Misconfiguration — CORS *, debug mode в production?
> Для каждой находки: severity, файл, строка, PoC-запрос если применимо.
> Отчёт в security-audit.md
Что агент делает хорошо: связывает находки в цепочки. “Эндпоинт /api/users/:id не проверяет, что :id принадлежит текущему пользователю” + “поле email из этого эндпоинта используется в шаблоне письма без экранирования” = IDOR + потенциальный XSS. Человек может пропустить связь между двумя файлами в разных частях проекта, агент — нет, потому что он прочитал весь код.
Динамический анализ (DAST)
Через agent-browser или curl агент может гонять реальные запросы к dev-серверу:
> Подними dev-сервер (npm run dev) и протестируй все API-эндпоинты:
> - Попробуй SQL injection через параметры
> - Проверь, что rate limiting работает (отправь 100 запросов подряд)
> - Попробуй path traversal через file upload
> Логируй все запросы и ответы.
Аудит зависимостей
npm audit и cargo audit выдают список CVE. Агент идёт дальше — проверяет, какие из них реально эксплуатируемы в контексте вашего проекта:
> Запусти cargo audit. Для каждой найденной CVE проверь:
> используется ли уязвимая функция в нашем коде?
> Если да — предложи fix или workaround. Если нет — пометь как false positive.
Fuzzing
> Напиши property-based тесты для всех REST handlers в api/.
> Используй hypothesis для Python или fast-check для TypeScript.
> Сфокусируйся на edge cases: пустые строки, огромные числа,
> unicode, null bytes, SQL keywords в полях ввода.
Агент генерирует сотни тест-кейсов, которые человек не додумался бы написать. Нагрузочные тесты (k6, Locust) с реалистичными сценариями — тоже сюда.
API exploration и Explore-субагенты
Новый API, документация непонятная, примеров мало. Классическая ситуация.
Базовый сценарий: SDK из документации
> Изучи API документацию YooKassa (https://yookassa.ru/developers).
> Напиши TypeScript SDK для:
> - Создания платежа
> - Проверки статуса
> - Webhook verification
> - Auto-renewal через saved payment method
> Добавь примеры использования и error handling.
Агент читает docs через WebFetch, анализирует структуру запросов, генерирует типизированный клиент. Вы получаете SDK вместо копипасты curl-команд. Бонус: агент может протестировать API в sandbox-режиме (если есть тестовые ключи) и показать реальные ответы.
Explore-субагенты: параллельное исследование
Когда API большой, один агент будет последовательно ползти по документации. Explore-субагенты (subagent_type=Explore) решают это параллельностью.
Как они работают:
- Запускаются через
Tasktool — несколько штук одновременно - Имеют доступ к поиску по файлам, grep, чтению, web-поиску — но не могут редактировать файлы
- Каждый глубоко копает свою область, не засоряя основной контекст
- Результат возвращается компактным саммари
> Изучи Stripe API. Запусти 3 explore-субагента параллельно:
> 1. Payment Intents — flow создания, подтверждения, 3D Secure
> 2. Webhooks — типы событий, верификация подписи, retry-политика
> 3. Customer + PaymentMethod — привязка карты, recurring billing
> Собери результаты в stripe-api-research.md с примерами запросов.
Три агента работают одновременно, каждый глубоко копает свою область. Результат — не поверхностный обзор, а детальное исследование за время, которое один агент потратил бы на треть работы.
Это же работает для исследования кодовых баз. Унаследовали проект на 200k строк без документации? Запустите explore-субагентов: один разбирает модели данных, другой — API-слой, третий — бизнес-логику. Через 5 минут у вас архитектурный обзор.
Reverse engineering чужих API
Когда документации нет или она врёт:
> Вот HAR-файл с трафиком мобильного приложения (traffic.har).
> Восстанови API-спецификацию:
> - Все эндпоинты с методами и параметрами
> - Формат авторизации (какие токены, где передаются)
> - Rate limits (если видно из заголовков)
> Сгенерируй OpenAPI spec.
Прототипы и MVP за минуты
Разрыв между задумкой и реализацией схлопнулся. “А что если сделать X?” → промпт → работающий код. Это меняет подход к валидации идей: вместо дней планирования — быстрый прототип и проверка на практике.
Кейс: Нужен landing для валидации идеи.
codex
> Создай Astro-сайт для SaaS "AI Email Assistant". Страницы:
> - Hero с value proposition
> - Features (3 блока)
> - Pricing (2 тарифа)
> - FAQ
> - Footer с email-формой (Mailchimp)
> Стиль: минимализм, Tailwind, тёмная тема. Деплой на Vercel.
Codex за 10-15 минут создаёт проект, пишет компоненты, настраивает Tailwind, добавляет форму с валидацией, коммитит, пушит, деплоит через Vercel CLI. Результат: рабочий сайт на your-project.vercel.app.
Быстрая проверка новой библиотеки:
> Создай минимальный пример использования Better Auth с OAuth
> (GitHub + Google), Drizzle ORM, и session management. Покажи
> полный setup для Next.js App Router.
Вместо чтения docs на 2 часа — готовый рабочий код за 5 минут.
CLI-утилиты на лету:
> Напиши CLI на Python: принимает CSV с заказами, группирует по городу,
> считает средний чек, шлёт отчёт в Telegram-бот. Click для аргументов.
Раньше это задача на день. Сейчас — на 5 минут.
Оркестрация агентов: multi-agent workflows
Один агент — это круто. Команда агентов, работающих параллельно — это уже конвейер.

Пример: Полный цикл фичи от spec до PR
# Включаем экспериментальные agent teams
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
claude
> Создай команду из 3 агентов для фичи "user profile avatars" с upload в S3:
> - Один для backend (API endpoints + S3 integration)
> - Один для frontend (Upload UI + preview component)
> - Один для testing (E2E и unit-тесты)
> Используй Sonnet для всех агентов.
Claude автоматически создаёт team, запускает субагентов через Task tool, создаёт общий список задач. Агенты координируются через SendMessage и распределённые задачи.
Как это работает:
- TeamCreate/TeamDelete — создание и удаление команд
- TaskCreate/TaskUpdate — управление задачами (status, dependencies, ownership)
- SendMessage — прямые сообщения между агентами и broadcast
- Display modes — in-process (Shift+Up/Down для переключения) или split panes (tmux/iTerm2)
Ограничение: агенты иногда конфликтуют при одновременном редактировании одного файла. Разделяйте зоны ответственности чётко. Agent teams — экспериментальная фича, требует CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1.
Claude Code в CI/CD
Claude Code работает не только локально в терминале. Его можно встроить в CI/CD pipeline — и тогда агент становится частью вашего процесса разработки: ревьюит PR, генерирует changelog, запускает security-аудит при каждом пуше.
Пример: автоматический code review в GitHub Actions
- name: Claude Code Review
run: |
claude -p "Проверь diff этого PR. Найди баги, проблемы
с безопасностью, нарушения code style. Если всё ок — напиши
короткий approve-комментарий. Если нет — перечисли проблемы
с указанием файлов и строк." --output-format json
Другие сценарии в CI:
- Автогенерация release notes из коммитов между тегами
- Проверка миграций БД на обратную совместимость
- Линтинг документации (“проверь, что все публичные функции задокументированы”)
- Security audit при каждом PR (по модели из секции про пентест выше)
Провайдеры: не только Anthropic API
Claude Code по умолчанию ходит в Anthropic API, но можно направить его через прокси на альтернативных провайдеров. Это полезно, когда нужны другие модели, ниже цена, или доступ из региона с ограничениями.
Omnirouter работает как прокси между Claude Code и провайдером. Подключаете свой API-ключ (Anthropic, OpenRouter, или OAuth от подписки Claude Pro/Max) — и используете через единый endpoint. Настройка — одна переменная:
export ANTHROPIC_BASE_URL=https://api.omnirouter.ru
export ANTHROPIC_API_KEY=omni_***
claude
Через Omnirouter также доступны сторонние провайдеры:
- Kimi — дешёвый доступ к Claude-моделям, хорошие лимиты
- Z.ai — ещё один Anthropic-совместимый провайдер
- OpenRouter — агрегатор с десятками моделей, pay-per-use
- Chutes — бюджетный вариант для экспериментов
Каждый провайдер — это просто API-ключ в настройках Omnirouter. Переключение между ними — без изменений в коде или CI-конфиге.
Ещё сценарии
Миграция между стеками
Не просто “перепиши с PHP на Go”, а осмысленная миграция с сохранением поведения:
> Мигрируй Express.js API (src/api/) на Elysia.
> Сохрани все эндпоинты, middleware, валидацию.
> Замени Joi на Zod, express-session на Better Auth.
> Покажи diff в поведении, если есть.
Анализ логов и разбор инцидентов
3 часа ночи, сервис лежит, в логах каша:
> Вот лог из production (logs/error-2026-02-11.log).
> Найди root cause падения между 02:15 и 02:30 UTC.
> Проверь, какие коммиты были задеплоены за последние 24 часа.
> Предложи fix.
Агент фильтрует шум, сопоставляет timestamp ошибок с git log, находит проблемный коммит.
Оптимизация SQL и схемы БД
> Вот EXPLAIN ANALYZE медленных запросов (slow-queries.sql).
> Предложи индексы. Найди N+1 в Prisma-коде (src/db/).
> Проверь, есть ли смысл в materialized views для дашборда.
Генерация инфраструктуры
Terraform, Docker Compose, Kubernetes — всё, что описывается декларативно:
> Напиши Terraform для AWS:
> - ECS Fargate (2 сервиса: API + worker)
> - RDS PostgreSQL (Multi-AZ)
> - ALB с SSL
> - VPC с private/public subnets
> Используй модули, не хардкодь ресурсы.
Генерация датасетов для ML
> Создай synthetic dataset для sentiment analysis.
> 10,000 отзывов о ресторанах (русский язык).
> Колонки: text, rating (1-5), sentiment (positive/negative/neutral).
> Сохрани в CSV.
Документация из кода
> Сгенерируй API reference из TypeScript types в src/api/.
> Формат: Markdown с примерами запросов для каждого endpoint.
> Добавь mermaid-диаграмму для authentication flow.
DevOps-автоматизация
> Напиши GitHub Actions workflow:
> - Run tests on PR
> - Build Docker image
> - Push to registry (только main branch)
> - Deploy на staging (auto), production (manual approval)
Локализация
> Переведи все i18n-ключи из locales/en.json на русский, немецкий,
> испанский. Тон: неформальный, для B2C SaaS.
> Проверь, что все переменные ({{name}}) на месте.
Парсинг и трансформация данных
> В data/invoices/ лежат 200 PDF-счетов от разных поставщиков.
> Извлеки из каждого: номер, дату, сумму, ИНН, позиции.
> Сохрани в CSV. Пометь файлы, которые не удалось распарсить.
Боты за вечер
Telegram-бот, Discord-бот, Slack-бот. Агент знает API всех платформ, подключает webhook, деплоит. От идеи до работающего бота — один промпт.
Mock-серверы для фронтенда
> Из openapi.yaml сгенерируй mock-сервер на Express.
> Каждый эндпоинт возвращает реалистичные данные (не просто {}).
> Поддержи пагинацию и фильтрацию где указано в спеке.
Фронтенд-команда не ждёт, пока бэкенд допилит API.
Порог входа: почти нулевой
Отдельно стоит сказать вот что: AI-агенты радикально снижают порог входа в разработку.
Человек без опыта в программировании может собрать работающего Telegram-бота, лендинг, CLI-утилиту, автоматизацию для своего бизнеса. Не потому что агент пишет идеальный код — а потому что он берёт на себя всю механику: синтаксис, конфигурацию, зависимости, деплой. Вам остаётся только описать что вы хотите.
Для опытных разработчиков эффект другой: задачи, которые раньше были “можно, но лень настраивать” (Terraform, CI/CD, browser extension, data pipeline) — теперь делаются за один промпт. Зона того, что реально сделать за вечер, выросла в разы.
Без тестов это карточный домик

Легко увлечься скоростью и забыть про проверку. Агент написал 500 строк за 3 минуты — кажется, что всё работает. Но без верификации вы строите на песке.
Правило: каждый значимый результат агента должен быть проверен — тестами, другим агентом, или вручную. Проект без тестов, собранный AI-агентами, развалится при первом же изменении.
Что помогает:
- Тесты как часть промпта. Не “напиши функцию X”, а “напиши функцию X и unit-тесты к ней”. Агент пишет тесты, запускает, видит красные — и чинит код сам.
- Ревью агентом-рецензентом. Один агент пишет код, второй (или тот же, но отдельным промптом) проверяет: ищет edge cases, проверяет error handling, сверяет с документацией. В Claude Code для этого есть
/reviewиcode-reviewer-committerсубагент. - CI как страховка. Линтер, тесты, type checker в GitHub Actions ловят то, что вы пропустили. Агент сгенерировал код с ошибкой типов — CI не пустит в main.
- Не доверяйте слепо. Агент может уверенно написать код, который компилируется, проходит очевидные тесты — и содержит тонкий баг в бизнес-логике. Чем критичнее код, тем внимательнее ревью.
Скорость AI-агентов — это суперсила, но только в паре с проверкой. Быстро написать и быстро сломать — не одно и то же.
Почему это работает (и где ломается)
Работает, когда:
- Задача чётко сформулирована (“создай X с параметрами Y”)
- Есть примеры или документация для reference
- Агент может проверить результат (тесты, линтеры, компиляция)
Ломается, когда:
- Требуется креативность высокого уровня (дизайн brand identity, UX-стратегия)
- Нужен domain expertise, которого нет в training data
- Задача слишком расплывчата (“сделай лучше”)
AI-агенты — не замена мышлению, а усилитель исполнения. Вы придумываете что делать, агент делает это на порядок быстрее.
С чего начать
- Попробуйте один нестандартный сценарий — не рефакторинг, а что-то из списка выше
- Изучите skills —
/help skillsв Claude Code, поищите готовые в GitHub - Автоматизируйте одну рутинную задачу — что вы делаете раз в неделю и ненавидите?
- Не забывайте про тесты — после каждого значимого изменения: регрессия бизнес-логики, новые тесты, DRY/KISS/YAGNI
- Попробуйте explore-субагентов — для исследования нового API или чужой кодовой базы
Единственный лимит — ваша фантазия. И, конечно, API rate limits. Но это уже другая история.