Реальные паттерны из ежедневной работы AGINE: какие модели когда использовать, как Obsidian превращается в long-term память, какие GitHub-скиллы режут расход в разы. Без теории — то что мы сами применяем.
① Model routing — главный source экономии
Один проект — три модели. Каждая на своём месте.
Самая частая ошибка — гонять всё через Opus. Он в 5× дороже Sonnet и в 15× дороже Haiku, а на простых задачах ничего не выигрывает. Правило AGINE: модель = инструмент под класс задачи.
Не брать когда:сложные многошаговые задачи, рассуждения, генерация архитектуры.
Sonnet 4.6
$3 / 1M токенов input
Брать когда:ежедневный coding, refactoring, документация, средне-сложные tool-use, ~80% задач разработки.
Не брать когда:критические архитектурные решения где нужна глубина (там Opus).
Opus 4.7
$15 / 1M токенов input
Брать когда:критическое мышление, system design, сложные баги где нужен глубокий анализ, важные ревью.
Не брать когда:рутина и массовые задачи (там Sonnet) или batch-обработка (там Haiku).
🎯 AGINE-правило: 70/25/5
70% задач — Sonnet, 25% — Haiku (extraction, классификация), 5% — Opus (только критические решения). Это снижает счёт в 3-4 раза vs «всё через Opus».
② Obsidian = long-term память
Не пересказывай контекст каждую сессию. Сохраняй его.
Каждая новая сессия Claude Code = заново подгружать контекст (что строим, какой стек, какие решения уже приняты). На 20 файлах CLAUDE.md это легко 30k токенов на старте. Решение — Obsidian как vault постоянной памяти, к которой Claude обращается через MCP.
claude-code-memory-setup
Obsidian + Graphify для Claude Code
до 71.5× меньше токенов на сессию
Полный setup: Obsidian vault + knowledge graph + chat-import pipeline. Claude хранит работу проекта как структурированную базу, обращается к нужным частям через MCP — а не загружает всё в начале сессии.
Когда брать:долгие проекты (3+ месяцев), большие codebase, командная работа где знание проекта надо передавать.
Claude читает источники (статьи, видео, заметки), извлекает entities/concepts, обновляет cross-references, кладёт в структурированный vault. Vault становится богаче с каждым ingest — это и есть compound memory.
Когда брать:контент-работа, research-проекты, knowledge-base строительство (вот этот лендинг — мечта на этом stack).
Реализация подхода Karpathy: Claude + Obsidian = персональная wiki. Команды /wiki /save /autoresearch автоматически структурируют знание в vault, который растёт нелинейно.
Когда брать:фаундеры/исследователи которые ведут много проектов параллельно.
Если делаешь свой Obsidian-workflow — без этого MCP не обойтись. Даёт Claude доступ к файлам vault: чтение, поиск, индексация. Connected via .mcp.json в проекте.
Когда брать:любой setup где Claude должен читать и понимать структуру файлов на диске.
Чужие готовые оптимизаторы — берём, не изобретаем.
Сообщество Claude Code уже сделало 10+ инструментов для урезания токен-расхода. Каждый закрывает свою точку утечки — ставим только то что подходит твоему workflow, не всё подряд.
claude-token-efficient
One-file CLAUDE.md template
до -40% выходных токенов
Один CLAUDE.md, который инструктирует Claude отвечать терсе. Убирает 'Sure!', 'Great question!', длинные объяснения очевидного. Drop-in: положил файл в проект — заработало.
Когда брать:output-heavy workflows (массовый рефакторинг, генерация документации, большие refactors).
Запускается отдельно от Claude (НЕ внутри его контекста — не съедает window). Сканирует историю сессий, находит «ghost tokens» — куски контекста которые ничего не дают, но платятся. Подсказывает что урезать в CLAUDE.md.
Когда брать:когда вижу что счёт растёт, не понимая откуда. Раз в неделю прогон = найдёшь утечки.
Список из 100+ инструментов, IDE-интеграций, фреймворков, ресурсов для Claude Code. Не оптимизатор сам по себе, но — единственное место где не пропустишь нужный инструмент. Раздел Token Optimization внутри.
Когда брать:перед стартом проекта — посмотреть что уже сделано в твоей нише.
Не библиотека, а .md-документ с разбором: где Claude Code тратит токены (initial context, model responses, retries), как мерить, как урезать. Хороший mental model перед тем как ставить tools.
Когда брать:первый шаг — прочитать чтобы понимать что и где режется.
→Sonnet 4.6 как default для всей разработки (~70% запросов).
→Haiku 4.5 для extraction-агентов в SMM-pipeline (классификация трендов, парсинг JSON ответов).
→Opus 4.7 точечно — только critical decisions (system design, ревью production change).
→Obsidian vault (agine-knowledge) — все решения, баги, фичи, sessions. Claude обращается через filesystem MCP.
→Custom CLAUDE.md — терсе-инструкции, AGINE voice, ссылки на canonical docs внутри vault.
→Subagents (general-purpose / Explore) — для параллельных поисков. Они работают в отдельном контексте и возвращают только summary, экономя главный context.
Месячный бюджет на Claude API в AGINE: ~$80-120 при 6+ часах работы каждый день. Без этих оптимизаций было бы $500+.
Хочешь больше гайдов как этот?
Напиши «КЛОД» в коммент под нашим Instagram-постом — @kd23.livee
Бот пришлёт ссылку на нужный раздел этого лендинга.