8. märts 2026

Seitsmest agendist üheni: kuidas Anthropicu krahh mu toote päästis

architectureengineeringai

See artikkel asendab „Energeetilised kirjeldused", „Üldülevaate prompt" ja „Analüütikaagentidest energiavahemäluni", mis kirjeldavad süsteemi eelmist versiooni.

Märtsi alguses 2026 juhtus Anthropicul massiline katkestus. Mu teenus, mis sõltus täielikult Claude'ist, lihtsalt lakkas töötamast. Kasutajad nägid vigu, mina nägin paanikat. Ja hakkasin katsetama sellega, mis parasjagu töötas. Kahe nädala pärast oli mul teine toode — kiirem, lihtsam, odavam. Vahel on vaja, et keegi tõmbaks pistiku seinast välja, et sa lõpuks mõtleks: äkki pole nii palju pistikupesi vajagi?

Mis oli enne (ja miks mul on siiani kahju seda ära visata)

Vana arhitektuur põhines elegantsel ideel: iga maja energeetika nataalkaardis on staatiline ega sõltu kasutaja küsimusest. Seega saab seda üks kord kirjeldada, vahemällu panna ja lõputult taaskasutada.

Kõlab elegantselt. Praktikas tähendas see järgmist:

Kaardi lisamisel genereeris süsteem 12 energeetilist teksti — üks iga maja kohta, 500-1500 sõna igaüks, eraldi LLM-väljakutse igaühe jaoks. Kasutaja lisas kaardi — ja ootas. Viis minutit. Vahel kauem. Ta polnud veel ühtegi küsimust esitanud, polnud näinud ühtegi vastust — aga istus juba ja vaatas edenemisriba. Paljud ei jäänud ootama. Ja ma saan aru — ma poleks ka jäänud.

Iga küsimuse puhul — klassifikaator määras päringu tüübi, planeerija koostas plaani 4-10 punktiga, iga punkti kohta kontrolliti vahemälu, puuduvad tekstid genereeriti, siis pandi kõik kokku lõppvastuseks. Seitse agenti, igaühel oma prompt. Vastamise aeg — kuni kaks minutit.

Näeb ilus välja arhitektuuridiagrammil. Piinav praktikas.

Ja samas — ja see on oluline — mulle meeldib see idee siiani. Energeetilised tekstid olid head. Nende genereerimise promptid olid sadade iteratsioonide ja mitme saja euro testimise tulemus. Vahemälu töötas. See lihtsalt oli lahendus valele probleemile, mis tootel ees seisis. Võib-olla tulen ma kunagi selle arhitektuuri juurde tagasi — kui saan aru, milleks. Praegu lebavad promptid gitis ja ootavad oma tundi.

Mis tegelikult katki läks

Viis minutit sissepääsuks — ja siis vaikus. Viis minutit ootamist esimese kaardi lisamisel — see pole „aeglane". See on „panin tabi kinni". Inimesed tulid, lisasid kaardi, nägid, et peab ootama — ja läksid ära. Ma kaotasin kasutajaid enne, kui nad jõudsid ühtegi küsimust esitada. Suurepärane viis äri ehitada.

Kaks minutit vastuse peale. Isegi pärast seda, kui kaart oli „soojas" — iga keeruline küsimus võis võtta kaks minutit. Maailmas, kus inimesed on harjunud ChatGPT viiesekundilise vastusega, on kaks minutit igavik. Eriti kui sa pole veel kindel, kas see teenus üldse su aega väärt on.

Seitse rikke punkti. Seitse agenti — seitse kohta, kus midagi saab valesti minna. Klassifikaator eksis vahel. Planeerija koostas imelikke plaane. Üks kinni jäänud väljakutse pidurdas kõike. Ja siis Anthropic kukkus — ja kõik seitse punkti läksid korraga rivist välja. Usaldusväärsuse sümfoonia.

Vahemälu vahemälu pärast. „Kümnes küsimus tuleb odav!" — lubasin. Probleem on selles, et kümnenda küsimuseni jõudsid üksikud. Enamik esitas 2-3 küsimust. Ma ehitasin Ferrari, et sõita nurga taha pagarisse.

Kuidas Anthropic muutustele tõuke andis

Märtsi alguses Claude kukkus. Mitte viieks minutiks — tõsiselt ja kauaks. Teenus ei töötanud, kasutajad kirjutasid, ja mina istusin ning ootasin, kuni kellegi teise infrastruktuur ennast parandab. Meeldiv tunne täielikust abitusest.

Selle asemel, et lihtsalt oodata, hakkasin alternatiive testima. Gemini, GPT-5.2 — ükskõik mis, peaasi et töötab praegu. Ja avastasin midagi ootamatut.

GPT-5.2 hoiab konteksti. Kogu nataalkaardi JSON — planeetide positsioonid, majade tipud, aspektid orbistega, väärikused, pealetõmmatud märgid, rettseptsioonid — laetakse tervikuna ühte prompti. Ja mudel ei aja sassi. Ei aja segamini maja valitsejat planeediga majas. Ei kaota sektsioone. Ei unusta kontrollida pealetõmmatud märke.

Varem olid energeetilised tekstid kark: eelmised mudelid ei suutnud toore kaardiga normaalselt töötada, neile oli vaja eelnevalt ette seeditud analüüsi. GPT-5.2 seedib ise. Päris hea, kui mudel teeb su eest ära selle, mille peale sa kulutasid pool aastat inseneritööd.

Prompt muutus — suurem ja tihedam. Seitsme väikse prompti asemel — üks, aga põhjalik. Selles on kogu metoodika: majade tuletuslik loogika, kolmetasandiline tõlgendusmudel, teadvuse kaart majade kaupa, planeetide integratsiooni spekter, teljeprintsiip, küsimuste marsruutimine, demograafiline kohandamine. Üks dokument, mille mudel saab tervikuna iga küsimuse juures.

Mida see andis

Kohene valmisolek. Lisad kaardi — ja saad kohe küsida. Viis minutit ootamist muutus nulliks. See on ilmselt kõige olulisem muudatus toote seisukohast. Mitte kõige muljetavaldavam tehniliselt — aga kõige olulisem.

30-60 sekundit kahe minuti asemel. Üks LLM-väljakutse kümne asemel. Ikka mitte kohene — prompt on suur, kaart detailne, vastused pikad. Aga vahe „ootan kaks minutit ekraani jõllitades" ja „ootan pool minutit, kuni teed valin" vahel — see on põhimõtteline.

1 € alguses. Tasuta „kahe küsimuse ja viieminutilise laadimise" asemel saab iga uus kasutaja euro kontole. Tänu väljakutsete odavnemisele jätkub sellest tuntavalt rohkemateks küsimusteks — saab süsteemi päriselt proovida, mitte saada kaks vastust ja jookseda vastu seina.

Usaldusväärsus. Üks mudel, üks väljakutse, üks rikke punkt seitsme asemel. Ja kui GPT-5.2 ka maha kukub — vahetan Claude'i või Gemini peale päevaga. Prompt on üks ja selle kohandamine teise pakkuja jaoks on võrreldamatult lihtsam kui seitsme agendi üleviimine.

Mis kadus (ja ootab varuks)

Vahemälu oli ilus insenerimõte. „Kaart soojeneb iga küsimusega" — ma pean seda siiani heaks metafooriks ja heaks arhitektuuriks. Kui inimesed esitaksid 20 küsimust järjest, oleks sellel tohutu mõte. Aga reaalsus näitas: ilus süsteem ei ole midagi väärt, kui see rikub esmamulje.

Sonnet/Opus jaotus läks ka. Varem valis kasutaja kiire-ja-odava ning sügava-ja-kalli vahel. Nüüd katab üks mudel mõlemad stsenaariumid piisavalt hästi.

Energeetiliste kirjelduste promptid — sajad iteratsioonid, mitu sada eurot testimisele — lebavad repos. Pole kustutatud. Ma olen insener ja mul on füüsiliselt valus töötavat koodi kustutada. Kunagi, võib-olla, leian neile kasutuse — offline-raportite jaoks, premium-taseme süvaanalüüsi jaoks, või millegi jaoks, mida pole veel välja mõelnud. Või äkki jäävadki nad overengineering'u mälestusmärgiks. Ka see on auväärne saatus.

Moraal

Mulle meeldib süsteeme ehitada. Multi-agent pipeline oli hea süsteem — elegantse vahemäluga, paralleelse genereerimisega, vastutuste jaotusega. Ma ehitasin seda mitu kuud ja olin tulemuse üle uhke.

Ja siis Anthropic kukkus kokku ja kahe nädalaga panin kokku midagi, mis töötab paremini.

Vahel on õige arhitektuurne otsus — lammutada arhitektuur. Ja vahel on selleks vaja välist tõuget. Aitäh, Anthropic.