💎 Пока многие делают супер-системы с множеством скиллов и субагентов и далее запускают работу Claude Code на часы, я действую в обратную сторону — ещё более дотошно.
Да, Codex-5.3 и Opus-4.6 хороши, но всё ещё не достаточно хороши (на мой взгляд. Но ниже поймёте почему так считаю)
Какой же у меня фреймворк?
Допустим, мы начинаем проект с нуля или собираемся сделать супер-большую фичу.
1. Долго обсуждаю реализацию с GPT и Claude параллельно, переодически шаря между ними идеи. Далее остаюсь на Claude, чтобы он сделал мне спеки, и каждую спеку показываю GPT. Он находит очень много несовершенств! И вместе на троих мы докручиваем спеки.
2. Далее на основе спеков делаем план файл, в котором каждый раздел максимально подробно детализирован по задачам + в них прописано, к каким спешкам ии-агенту нужно ссылаться. Также обязательно нужно обновить CLAUDE.md и AGENTS.md под фичу/проект. В них обязательно нужно прописать, что должны быть тесты и документация для каждого модуля!
3. Далее для удобства Claude мне создаёт промпты, которые остаётся на каждом этапе просто скопипастить и нажать пуск.
4. Далее в отдельных чатах с Claude мы начинаем работать со спеками. 1 чат = максимум 1 раздел. Когда уже база есть — можно параллель. По каждому разделу сначала Claude-кодинг-агент должен сделать план, я его показываю Codex, он его валидирует, как правило, показывает кучу слабых мест. Чаще всего хватает 1 интеграции докрутки плана, но иногда 2–3. Как только Claude закончил реализацию и дал саммари того, что сделал, я снова показываю это Codex, он находит слабости и баги. И далее Claude их дорабатывает. Далее /compact и продолжаем (ну или новый чат).
4.5 Да, Codex я использую тут не просто так. Если делать ревью агента Claude отдельного в отдельном чате — так тоже работает, но хуже. И использую тут codex-5.3-extra-high.
5. После каждого раздела, а ещё лучше — чаще, нужно делать ещё один ревью через /review агента. Тут я делаю и через sonnet-4.6, и через Codex-5.3-high (без extra), и они находят разные слабости. Можно ещё security-review запустить в Claude, если фичи могут нести небезопасность.
6. И так пока спеки не будут завершены. Можно потом по верности ещё раз агентами пройтись по ним и проверить, всё ли сделано как надо.
Доп моменты:
— внимание, я хотя бы наискосок, но Читаю, что там агенты спланировали! Иначе это рулетка: чем дольше так делать, тем выше вероятность достаточно сильного отклонения от того, что у вас в голове. Даже с людьми нужна постоянна синхронизация, что говорить про агентов.
— желательно опять же руками протыкивать и смотреть по факту что сделано, не только полагаясь на отчёты и прохождение тестов.
— фреймворк выше может быть избыточен для MVP, который надо на коленке сделать за 2–3 часа. Но если есть время и токены, то всё же лучше сразу сделать нормально, потому что потом рефакторинг может быть дольше и больнее.
P.S. Использую 1code.dev
у ребят там и Codex, и Claude Code. Они уже вполне докрутили решение, багрепортил им как мог, так как реально это удобно. Удобнее, чем наивный Claude Code desktop. Единственное — будьте готовы, что у вас должна быть 16gb GPU, если хотите 4+ чата одновременно запускать.
И ещё приятно, что фаундер там — тоже свой, родом из РФ.
Какие у вас фреймворки или лайфхаки?
Видео выше поставил для привлечения внимания) Оно в тему исследования Anthropic, какие профессии скоро исчезнут)
#вайбкодинг
@oh_my_zen