8 марта 2026 г.

От семи агентов к одному: как поломка Антропика спасла мой продукт

architectureengineeringai

Эта статья заменяет «Энергетические описания», «Промпт для генерального обзора» и «От агентов-аналитиков к энергетическому кэшу», которые описывают предыдущую версию системы.

В начале марта 2026-го у Anthropic случился массовый сбой. Мой сервис, который целиком зависел от Claude, просто перестал работать. Пользователи видели ошибки, я видел панику. И пошёл экспериментировать с тем, что работает. Через две недели у меня был другой продукт — быстрее, проще, дешевле. Иногда нужно, чтобы кто-то выдернул вилку из розетки, чтобы ты наконец задумался: а может, не нужно столько розеток?

Что было раньше (и почему мне до сих пор жалко это выбрасывать)

Старая архитектура строилась на красивой идее: энергетика каждого дома натальной карты статична и не зависит от вопроса пользователя. Значит, её можно описать один раз, закэшировать, и переиспользовать бесконечно.

Звучит элегантно. На практике это означало следующее:

При добавлении карты система генерировала 12 энергетических текстов — по одному на каждый дом, по 500-1500 слов каждый, отдельный LLM-вызов на каждый. Пользователь добавлял карту — и ждал. Пять минут. Иногда дольше. Он ещё ничего не спросил, ещё не увидел ни одного ответа — а уже сидел и смотрел на прогресс-бар. Многие не досиживали. И я их понимаю — я бы тоже не досидел.

При каждом вопросе — классификатор определял тип запроса, планировщик строил план из 4-10 пунктов, для каждого пункта проверялся кэш, недостающие тексты генерировались, потом всё собиралось в финальный ответ. Семь агентов, каждый со своим промптом. Время ответа — до двух минут.

Красиво на архитектурной диаграмме. Мучительно на практике.

При этом — и это важно — сама идея мне до сих пор нравится. Энергетические тексты были хорошими. Промпты для их генерации — результат сотен итераций и нескольких сотен евро на тестирование. Кэширование работало. Просто всё это было решением не той проблемы, которая стояла перед продуктом. Возможно, я ещё вернусь к этой архитектуре — когда пойму, зачем. А пока промпты лежат в гите и ждут своего часа.

Что реально сломалось

Пять минут на вход — и тишина. Пять минут ожидания при добавлении первой карты — это не "долго". Это "закрыл вкладку". Люди приходили, добавляли карту, видели что нужно ждать — и уходили. Я терял пользователей до того, как они успевали задать хоть один вопрос. Отличный способ строить бизнес.

Две минуты на ответ. Даже после того как карта "прогрелась" — каждый сложный вопрос мог занять до двух минут. В мире, где люди привыкли к ChatGPT с его пятью секундами, две минуты — это вечность. Особенно если ты ещё не уверен, стоит ли вообще этот сервис твоего времени.

Семь точек отказа. Семь агентов — семь мест, где что-то может пойти не так. Классификатор иногда ошибался. Планировщик строил странные планы. Один зависший вызов тормозил всё. А потом Антропик лёг — и все семь точек отказали одновременно. Симфония надёжности.

Кэш ради кэша. "Десятый вопрос будет дешёвым!" — обещал я. Проблема в том, что до десятого вопроса добирались единицы. Большинство задавало 2-3 вопроса. Я построил Ferrari для поездки в булочную за углом.

Как Антропик подтолкнул к переменам

В начале марта Claude лёг. Не на пять минут — серьёзно и надолго. Сервис не работал, пользователи писали, а я сидел и ждал, пока чужая инфраструктура починится. Приятное ощущение полной беспомощности.

Вместо того чтобы просто ждать, пошёл тестировать альтернативы. Gemini, GPT-5.2 — что угодно, лишь бы работало прямо сейчас. И обнаружил кое-что неожиданное.

GPT-5.2 держит контекст. Весь JSON натальной карты — позиции планет, куспиды домов, аспекты с орбисами, достоинства, перехваченные знаки, рецепции — загружается целиком в один промпт. И модель не путается. Не путает управителя дома с планетой в доме. Не теряет секции. Не забывает проверить перехваченные знаки.

Раньше энергетические тексты были костылём: предыдущие модели не могли нормально работать с сырой картой, им нужен был предварительно разжёванный анализ. GPT-5.2 жуёт сам. Неплохо, когда модель делает за тебя то, на что ты потратил полгода инженерной работы.

Промпт стал другим — больше и плотнее. Вместо семи небольших промптов — один, но основательный. В нём вся методология: производная логика домов, трёхуровневая модель интерпретации, карта сознания по домам, спектр интеграции планет, осевой принцип, маршрутизация по вопросам, демографическая адаптация. Один документ, который модель получает целиком при каждом вопросе.

Что это дало

Мгновенная готовность. Добавляешь карту — и сразу можешь спрашивать. Пять минут ожидания превратились в ноль. Это, наверное, самое важное изменение с точки зрения продукта. Не самое впечатляющее технически — но самое важное.

30-60 секунд вместо двух минут. Один LLM-вызов вместо десяти. Всё ещё не мгновенно — промпт большой, карта подробная, ответы длинные. Но разница между "жду две минуты, уставившись в экран" и "жду полминуты, пока наливаю чай" — принципиальная.

€1 на старте. Вместо бесплатных "двух вопросов с пятиминутной загрузкой" каждый новый пользователь получает евро на счёт. Благодаря снижению стоимости вызовов этого хватает на ощутимо больше вопросов — можно реально распробовать систему, а не получить два ответа и упереться в стену.

Надёжность. Одна модель, один вызов, одна точка отказа вместо семи. И если GPT-5.2 вдруг тоже ляжет — я переключусь на Claude или Gemini за день. Промпт один, адаптировать его под другого провайдера несравнимо проще, чем переносить семь агентов.

Что потерялось (и ждёт в запасе)

Кэширование было красивой инженерной идеей. "Карта прогревается с каждым вопросом" — я до сих пор считаю это хорошей метафорой и хорошей архитектурой. Если бы люди задавали по 20 вопросов подряд, это имело бы огромный смысл. Но реальность показала: красивая система не стоит ничего, если она мешает первому впечатлению.

Разделение Sonnet/Opus тоже ушло. Раньше пользователь выбирал между быстрым дешёвым и глубоким дорогим. Теперь одна модель покрывает оба сценария достаточно хорошо.

Промпты энергетических описаний — сотни итераций, несколько сотен евро на тестирование — лежат в репозитории. Не удалены. Я инженер, и мне физически больно удалять работающий код. Когда-нибудь, возможно, найду им применение — для офлайн-отчётов, для premium-тира с глубоким анализом, или для чего-то, чего я ещё не придумал. А может, они так и останутся памятником overengineering. Тоже почётная судьба.

Мораль

Я люблю строить системы. Мульти-агентный pipeline был хорошей системой — с элегантным кэшированием, параллельной генерацией, разделением ответственности. Я строил его несколько месяцев и гордился результатом.

А потом Антропик сломался, и за две недели я собрал то, что работает лучше.

Иногда правильное архитектурное решение — снести архитектуру. И иногда для этого нужен внешний пинок. Спасибо, Anthropic.