Сценарии использования Claude Code и Codex за пределами обычного кодинга

AI-агенты

Большинство разработчиков используют Claude Code для рефакторинга и написания функций. Codex — для фич и багфиксов. Это работает, но можно найти новые сценарии.

Реальная мощь AI-агентов открывается, когда вы начинаете воспринимать их как универсальных автономных исполнителей, способных делать всё, что можно описать в терминале. Идеи материализуются почти со скоростью мысли: между “а что если…” и работающим прототипом — минуты, не дни. Ограничение только одно — ваша фантазия.

Web-исследования на автопилоте

Запустить Claude Code с web-поиском и делегировать ему сбор информации — очевидный сценарий. Неочевидное: насколько глубоко он может копать. (буквально deep research у вас дома)

Пример: Анализ конкурентов с pricing-таблицами

claude

> Найди 10 SaaS-сервисов для управления проектами, запущенных
> в 2024-2026. Для каждого собери: ценообразование (все тарифы), ключевын фичи,
> технический стэк, финансирование
> Сохрани в markdown файле: saas-analysis.md

Claude Code использует встроенные сервисы web-поиск, посещает сайты, парсит страницы, проверяет Crunchbase и прочие базы для данных о финансировании. Результат — структурированный отчёт за 5-10 минут.

Где это работает:

Исследование трендов перед запуском продукта
Сбор кейсов для презентаций (“найди 20 компаний, которые мигрировали с Postgres на TimescaleDB”)
Технический due diligence (“проверь, какие CVE были у этой библиотеки за последний год”)

Research agents

Skills: расширяемость без лимитов

Claude Code поддерживает skills — кастомные инструкции, которые превращают агента в специалиста. Skills можно писать самому или искать готовые.

SEO-оптимизация контента

Skill seo-optimizer (гипотетический пример, но вы можете написать свой):

/seo-optimize blog/my-post.md --keyword "AI agents" --target-lang ru

Агент:

Анализирует текущий контент
Проверяет keyword density
Генерирует meta description и title
Добавляет internal links на релевантные статьи
Форматирует headings для featured snippets

Генерация изображений

Skill для генерации изображений подключается к Nano Banana Pro (модель Gemini 3 Pro Image от Google DeepMind) и работает прямо из Claude Code:

/nanobanana "futuristic dashboard UI, dark theme,
high-quality digital art" --width 1920 --height 1080

Nano Banana Pro отлично рендерит текст на изображениях (вывески, диаграммы, mockups с реальным контентом), поддерживает 4K и понимает сложные составные промпты. Результат конвертируется в WebP автоматически. Идеально для прототипирования лендингов, hero images, инфографики.

Другие полезные skills:

better-icons — поиск иконок из 200+ библиотек (Iconify) и вставка SVG
threejs-* — целая серия skills для 3D-графики (geometry, shaders, lighting, loaders)
agent-browser — автоматизация браузера для тестирования и скрапинга
agent-pipeline — многоступенчатый pipeline (spec → plan → implementation → review)

Пентест и security audit

Запустить агента с задачей “найди уязвимости” звучит амбициозно, но работает лучше, чем кажется. Ключевое — давать конкретные задачи, а не абстрактное “проверь безопасность”.

Security testing

Статический анализ (SAST)

Агент читает код и ищет известные паттерны уязвимостей. Не замена специализированным сканерам вроде Semgrep, но хорошее дополнение — потому что агент понимает контекст.

claude

> Проведи security audit src/api/ по OWASP Top 10. Для каждой категории:
> 1. Broken Access Control — есть ли эндпоинты без проверки авторизации?
> 2. Injection — пользовательский ввод попадает в SQL/shell без санитизации?
> 3. Cryptographic Failures — захардкоженные секреты, слабые алгоритмы?
> 4. Security Misconfiguration — CORS *, debug mode в production?
> Для каждой находки: severity, файл, строка, PoC-запрос если применимо.
> Отчёт в security-audit.md

Что агент делает хорошо: связывает находки в цепочки. “Эндпоинт /api/users/:id не проверяет, что :id принадлежит текущему пользователю” + “поле email из этого эндпоинта используется в шаблоне письма без экранирования” = IDOR + потенциальный XSS. Человек может пропустить связь между двумя файлами в разных частях проекта, агент — нет, потому что он прочитал весь код.

Динамический анализ (DAST)

Через agent-browser или curl агент может гонять реальные запросы к dev-серверу:

> Подними dev-сервер (npm run dev) и протестируй все API-эндпоинты:
> - Попробуй SQL injection через параметры
> - Проверь, что rate limiting работает (отправь 100 запросов подряд)
> - Попробуй path traversal через file upload
> Логируй все запросы и ответы.

Аудит зависимостей

npm audit и cargo audit выдают список CVE. Агент идёт дальше — проверяет, какие из них реально эксплуатируемы в контексте вашего проекта:

> Запусти cargo audit. Для каждой найденной CVE проверь:
> используется ли уязвимая функция в нашем коде?
> Если да — предложи fix или workaround. Если нет — пометь как false positive.

Fuzzing

> Напиши property-based тесты для всех REST handlers в api/.
> Используй hypothesis для Python или fast-check для TypeScript.
> Сфокусируйся на edge cases: пустые строки, огромные числа,
> unicode, null bytes, SQL keywords в полях ввода.

Агент генерирует сотни тест-кейсов, которые человек не додумался бы написать. Нагрузочные тесты (k6, Locust) с реалистичными сценариями — тоже сюда.

API exploration и Explore-субагенты

Новый API, документация непонятная, примеров мало. Классическая ситуация.

Базовый сценарий: SDK из документации

> Изучи API документацию YooKassa (https://yookassa.ru/developers).
> Напиши TypeScript SDK для:
> - Создания платежа
> - Проверки статуса
> - Webhook verification
> - Auto-renewal через saved payment method
> Добавь примеры использования и error handling.

Агент читает docs через WebFetch, анализирует структуру запросов, генерирует типизированный клиент. Вы получаете SDK вместо копипасты curl-команд. Бонус: агент может протестировать API в sandbox-режиме (если есть тестовые ключи) и показать реальные ответы.

Explore-субагенты: параллельное исследование

Когда API большой, один агент будет последовательно ползти по документации. Explore-субагенты (subagent_type=Explore) решают это параллельностью.

Как они работают:

Запускаются через Task tool — несколько штук одновременно
Имеют доступ к поиску по файлам, grep, чтению, web-поиску — но не могут редактировать файлы
Каждый глубоко копает свою область, не засоряя основной контекст
Результат возвращается компактным саммари

> Изучи Stripe API. Запусти 3 explore-субагента параллельно:
> 1. Payment Intents — flow создания, подтверждения, 3D Secure
> 2. Webhooks — типы событий, верификация подписи, retry-политика
> 3. Customer + PaymentMethod — привязка карты, recurring billing
> Собери результаты в stripe-api-research.md с примерами запросов.

Три агента работают одновременно, каждый глубоко копает свою область. Результат — не поверхностный обзор, а детальное исследование за время, которое один агент потратил бы на треть работы.

Это же работает для исследования кодовых баз. Унаследовали проект на 200k строк без документации? Запустите explore-субагентов: один разбирает модели данных, другой — API-слой, третий — бизнес-логику. Через 5 минут у вас архитектурный обзор.

Reverse engineering чужих API

Когда документации нет или она врёт:

> Вот HAR-файл с трафиком мобильного приложения (traffic.har).
> Восстанови API-спецификацию:
> - Все эндпоинты с методами и параметрами
> - Формат авторизации (какие токены, где передаются)
> - Rate limits (если видно из заголовков)
> Сгенерируй OpenAPI spec.

Прототипы и MVP за минуты

Разрыв между задумкой и реализацией схлопнулся. “А что если сделать X?” → промпт → работающий код. Это меняет подход к валидации идей: вместо дней планирования — быстрый прототип и проверка на практике.

Кейс: Нужен landing для валидации идеи.

codex

> Создай Astro-сайт для SaaS "AI Email Assistant". Страницы:
> - Hero с value proposition
> - Features (3 блока)
> - Pricing (2 тарифа)
> - FAQ
> - Footer с email-формой (Mailchimp)
> Стиль: минимализм, Tailwind, тёмная тема. Деплой на Vercel.

Codex за 10-15 минут создаёт проект, пишет компоненты, настраивает Tailwind, добавляет форму с валидацией, коммитит, пушит, деплоит через Vercel CLI. Результат: рабочий сайт на your-project.vercel.app.

Быстрая проверка новой библиотеки:

> Создай минимальный пример использования Better Auth с OAuth
> (GitHub + Google), Drizzle ORM, и session management. Покажи
> полный setup для Next.js App Router.

Вместо чтения docs на 2 часа — готовый рабочий код за 5 минут.

CLI-утилиты на лету:

> Напиши CLI на Python: принимает CSV с заказами, группирует по городу,
> считает средний чек, шлёт отчёт в Telegram-бот. Click для аргументов.

Раньше это задача на день. Сейчас — на 5 минут.

Оркестрация агентов: multi-agent workflows

Один агент — это круто. Команда агентов, работающих параллельно — это уже конвейер.

Agent orchestration

Пример: Полный цикл фичи от spec до PR

# Включаем экспериментальные agent teams
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
claude

> Создай команду из 3 агентов для фичи "user profile avatars" с upload в S3:
> - Один для backend (API endpoints + S3 integration)
> - Один для frontend (Upload UI + preview component)
> - Один для testing (E2E и unit-тесты)
> Используй Sonnet для всех агентов.

Claude автоматически создаёт team, запускает субагентов через Task tool, создаёт общий список задач. Агенты координируются через SendMessage и распределённые задачи.

Как это работает:

TeamCreate/TeamDelete — создание и удаление команд
TaskCreate/TaskUpdate — управление задачами (status, dependencies, ownership)
SendMessage — прямые сообщения между агентами и broadcast
Display modes — in-process (Shift+Up/Down для переключения) или split panes (tmux/iTerm2)

Ограничение: агенты иногда конфликтуют при одновременном редактировании одного файла. Разделяйте зоны ответственности чётко. Agent teams — экспериментальная фича, требует CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1.

Claude Code в CI/CD

Claude Code работает не только локально в терминале. Его можно встроить в CI/CD pipeline — и тогда агент становится частью вашего процесса разработки: ревьюит PR, генерирует changelog, запускает security-аудит при каждом пуше.

Пример: автоматический code review в GitHub Actions

- name: Claude Code Review
  run: |
    claude -p "Проверь diff этого PR. Найди баги, проблемы
    с безопасностью, нарушения code style. Если всё ок — напиши
    короткий approve-комментарий. Если нет — перечисли проблемы
    с указанием файлов и строк." --output-format json

Другие сценарии в CI:

Автогенерация release notes из коммитов между тегами
Проверка миграций БД на обратную совместимость
Линтинг документации (“проверь, что все публичные функции задокументированы”)
Security audit при каждом PR (по модели из секции про пентест выше)

Провайдеры: не только Anthropic API

Claude Code по умолчанию ходит в Anthropic API, но можно направить его через прокси на альтернативных провайдеров. Это полезно, когда нужны другие модели, ниже цена, или доступ из региона с ограничениями.

Omnirouter работает как прокси между Claude Code и провайдером. Подключаете свой API-ключ (Anthropic, OpenRouter, или OAuth от подписки Claude Pro/Max) — и используете через единый endpoint. Настройка — одна переменная:

export ANTHROPIC_BASE_URL=https://api.omnirouter.ru
export ANTHROPIC_API_KEY=omni_***
claude

Через Omnirouter также доступны сторонние провайдеры:

Kimi — дешёвый доступ к Claude-моделям, хорошие лимиты
Z.ai — ещё один Anthropic-совместимый провайдер
OpenRouter — агрегатор с десятками моделей, pay-per-use
Chutes — бюджетный вариант для экспериментов

Каждый провайдер — это просто API-ключ в настройках Omnirouter. Переключение между ними — без изменений в коде или CI-конфиге.

Ещё сценарии

Миграция между стеками

Не просто “перепиши с PHP на Go”, а осмысленная миграция с сохранением поведения:

> Мигрируй Express.js API (src/api/) на Elysia.
> Сохрани все эндпоинты, middleware, валидацию.
> Замени Joi на Zod, express-session на Better Auth.
> Покажи diff в поведении, если есть.

Анализ логов и разбор инцидентов

3 часа ночи, сервис лежит, в логах каша:

> Вот лог из production (logs/error-2026-02-11.log).
> Найди root cause падения между 02:15 и 02:30 UTC.
> Проверь, какие коммиты были задеплоены за последние 24 часа.
> Предложи fix.

Агент фильтрует шум, сопоставляет timestamp ошибок с git log, находит проблемный коммит.

Оптимизация SQL и схемы БД

> Вот EXPLAIN ANALYZE медленных запросов (slow-queries.sql).
> Предложи индексы. Найди N+1 в Prisma-коде (src/db/).
> Проверь, есть ли смысл в materialized views для дашборда.

Генерация инфраструктуры

Terraform, Docker Compose, Kubernetes — всё, что описывается декларативно:

> Напиши Terraform для AWS:
> - ECS Fargate (2 сервиса: API + worker)
> - RDS PostgreSQL (Multi-AZ)
> - ALB с SSL
> - VPC с private/public subnets
> Используй модули, не хардкодь ресурсы.

Генерация датасетов для ML

> Создай synthetic dataset для sentiment analysis.
> 10,000 отзывов о ресторанах (русский язык).
> Колонки: text, rating (1-5), sentiment (positive/negative/neutral).
> Сохрани в CSV.

Документация из кода

> Сгенерируй API reference из TypeScript types в src/api/.
> Формат: Markdown с примерами запросов для каждого endpoint.
> Добавь mermaid-диаграмму для authentication flow.

DevOps-автоматизация

> Напиши GitHub Actions workflow:
> - Run tests on PR
> - Build Docker image
> - Push to registry (только main branch)
> - Deploy на staging (auto), production (manual approval)

Локализация

> Переведи все i18n-ключи из locales/en.json на русский, немецкий,
> испанский. Тон: неформальный, для B2C SaaS.
> Проверь, что все переменные ({{name}}) на месте.

Парсинг и трансформация данных

> В data/invoices/ лежат 200 PDF-счетов от разных поставщиков.
> Извлеки из каждого: номер, дату, сумму, ИНН, позиции.
> Сохрани в CSV. Пометь файлы, которые не удалось распарсить.

Боты за вечер

Telegram-бот, Discord-бот, Slack-бот. Агент знает API всех платформ, подключает webhook, деплоит. От идеи до работающего бота — один промпт.

Mock-серверы для фронтенда

> Из openapi.yaml сгенерируй mock-сервер на Express.
> Каждый эндпоинт возвращает реалистичные данные (не просто {}).
> Поддержи пагинацию и фильтрацию где указано в спеке.

Фронтенд-команда не ждёт, пока бэкенд допилит API.

Порог входа: почти нулевой

Отдельно стоит сказать вот что: AI-агенты радикально снижают порог входа в разработку.

Человек без опыта в программировании может собрать работающего Telegram-бота, лендинг, CLI-утилиту, автоматизацию для своего бизнеса. Не потому что агент пишет идеальный код — а потому что он берёт на себя всю механику: синтаксис, конфигурацию, зависимости, деплой. Вам остаётся только описать что вы хотите.

Для опытных разработчиков эффект другой: задачи, которые раньше были “можно, но лень настраивать” (Terraform, CI/CD, browser extension, data pipeline) — теперь делаются за один промпт. Зона того, что реально сделать за вечер, выросла в разы.

Без тестов это карточный домик

Карточный домик из кода

Легко увлечься скоростью и забыть про проверку. Агент написал 500 строк за 3 минуты — кажется, что всё работает. Но без верификации вы строите на песке.

Правило: каждый значимый результат агента должен быть проверен — тестами, другим агентом, или вручную. Проект без тестов, собранный AI-агентами, развалится при первом же изменении.

Что помогает:

Тесты как часть промпта. Не “напиши функцию X”, а “напиши функцию X и unit-тесты к ней”. Агент пишет тесты, запускает, видит красные — и чинит код сам.
Ревью агентом-рецензентом. Один агент пишет код, второй (или тот же, но отдельным промптом) проверяет: ищет edge cases, проверяет error handling, сверяет с документацией. В Claude Code для этого есть /review и code-reviewer-committer субагент.
CI как страховка. Линтер, тесты, type checker в GitHub Actions ловят то, что вы пропустили. Агент сгенерировал код с ошибкой типов — CI не пустит в main.
Не доверяйте слепо. Агент может уверенно написать код, который компилируется, проходит очевидные тесты — и содержит тонкий баг в бизнес-логике. Чем критичнее код, тем внимательнее ревью.

Скорость AI-агентов — это суперсила, но только в паре с проверкой. Быстро написать и быстро сломать — не одно и то же.

Почему это работает (и где ломается)

Работает, когда:

Задача чётко сформулирована (“создай X с параметрами Y”)
Есть примеры или документация для reference
Агент может проверить результат (тесты, линтеры, компиляция)

Ломается, когда:

Требуется креативность высокого уровня (дизайн brand identity, UX-стратегия)
Нужен domain expertise, которого нет в training data
Задача слишком расплывчата (“сделай лучше”)

AI-агенты — не замена мышлению, а усилитель исполнения. Вы придумываете что делать, агент делает это на порядок быстрее.

С чего начать

Попробуйте один нестандартный сценарий — не рефакторинг, а что-то из списка выше
Изучите skills — /help skills в Claude Code, поищите готовые в GitHub
Автоматизируйте одну рутинную задачу — что вы делаете раз в неделю и ненавидите?
Не забывайте про тесты — после каждого значимого изменения: регрессия бизнес-логики, новые тесты, DRY/KISS/YAGNI
Попробуйте explore-субагентов — для исследования нового API или чужой кодовой базы

Единственный лимит — ваша фантазия. И, конечно, API rate limits. Но это уже другая история.