Agentní RAG chatbot 8) Tým expertů aneb stavba agentních systémů v LangGraph

RAG chatbot - langgraph agents

V minulém díle jsme udělali obrovský skok. Zavedením GraphRAGu a databáze Neo4j jsme našemu systému dali síť vztahů, díky které chápe souvislosti. Nyní už náš AI asistent ví, že „Firma X“ patří pod „Holding Y“. Máme tedy geniálního knihovníka. Ale v byznysu nestačí jen vědět. Musíte konat.

Toto je osmý díl seriálu Agentní RAG chatbot, kde krok za krokem rozebírám, jak správně postavit celou architekturu a čemu se naopak vyhnout. Postupně zde najdete odkazy na všechny díly, které si časem můžete přečíst.

Představte si rozdíl mezi studentem, který na zkoušce odpoví na otázku (to je RAG), a týmem specialistů, kteří společně vyřeší komplexní projekt (to je Agentní systém).

Dnes vám ukážu, jak tento tým postavit pomocí technologie LangGraph. Technologie, která v roce 2025/2026 definuje rozdíl mezi hloupým chatbotem a autonomním systémem.

Agentní RAG chatbot
Zdroj: blog.langchain.com

Konec lineárního myšlení

Drtivá většina AI aplikací, které dnes vidíte, funguje jako trubka. Na jedné straně hodíte dotaz, ten proletí sérií předem daných kroků (najdi data –> pošli do LLM –> odpověz) a na druhé straně vypadne výsledek.

Říkáme tomu Chain (řetězec). Problém je, že reálný svět není lineární. Co se stane, když AI v prvním kroku nenajde správnou smlouvu? V lineárním systému proces selže nebo si vymyslí odpověď.

V reálném světě, když člověk nenajde smlouvu ve složce A, jde se podívat do složky B. Nebo se zeptá kolegy. Nebo zavolá klientovi. Dělá smyčky, rozhoduje se, vrací se o krok zpět.

A přesně to nám umožňuje LangGraph. Umožňuje nám stavět systémy, které nejsou řetězcem, ale grafem. Systémy, které umí cyklit, opravovat samy sebe a měnit plán za běhu.

Orchestrace digitálních zaměstnanců LangGraph (postavený na populárním LangChainu) nám umožňuje definovat stav (State), jakousi virtuální složku s dokumenty, kterou si mezi sebou předávají různí specializovaní agenti.

V našem AI systému už nestavíme jednoho univerzálního robota. Stavíme tým. Zde je architektura, kterou aktuálně nasazuji u klientů:

  1. Supervisor (Manažer). Toto je hlavní LLM (obvykle GPT-4.1 nebo Claude 4.5 Opus, kterému uživatel zadá úkol. On nic neřeší. On jen rozděluje práci. Podívá se na dotaz a rozhodne: „Tohle je právní dotaz, to pošlu Právníkovi“ nebo „Tohle je dotaz na data, to pošlu Analytikovi“.
  2. Agent Výzkumník (Researcher).Tento agent má přístup k našemu GraphRAGu (viz minulý díl). Jeho úkolem není odpovídat uživateli, ale dolovat fakta. Umí pokládat doplňující dotazy do databáze Neo4j, dokud nemá jistotu, že má všechna data.
  3. Agent Kritik (Critic). Tohle je klíčová role pro eliminaci halucinací. Než systém odpoví uživateli, výstup projde přes Kritika. Ten porovná odpověď s nalezenými daty. Pokud nesedí, vrátí ji Výzkumníkovi s poznámkou: „Tohle jsi si vymyslel, najdi to znovu.“ Teprve když jsou všichni spokojeni, Supervisor předá výsledek uživateli.

Abych nepsal jen po pozitivech: Má to samozřejmě i své nevýhody: Rychlost reakce je výrazně pomalejší, cena narůstá s tím, jak jednotliví agenti komunikují mezi sebou a opravují chyby a v neposlední řadě i agenti dělají chyby a mohou se zacyklit (zde je právě důležitý zásah člověka). Dá se ale očekávat, že agenti se budou zlepšovat, zrychlovat a hlavně zlevňovat.

Jak to vypadá v kódu

Nodes a Edges

Nebudu vás zatěžovat složitou syntaxí, ale princip musíte pochopit. V LangGraphu definujeme dvě věci: Uzly (Nodes): To jsou naši agenti. Každý uzel je funkce, která dostane aktuální stav, něco udělá (zavolá LLM, spustí Python kód, prohledá graf) a aktualizuje stav.

Hrany (Edges): To jsou pravidla pro přesun. Zde definujeme logiku. Příklad podmíněné hrany (Conditional Edge): Pokud Agent Výzkumník našel dokumenty –> jdi na Agenta Spisovatele. Pokud Agent Výzkumník nic nenašel –> jdi na Agenta Tazatele (zeptej se uživatele na upřesnění). Tato schopnost vrátit se je tím, co dělá systém robustním. Běžný chatbot by řekl „nevím“. Agentní systém v LangGraphu si řekne „zkusím to jinak“.

Horká novinka z února 2026

Neo4j Aura Agent Právě v době psaní tohoto článku (3. února 2026) přišlo Neo4j s oznámením, které nám práci s agenty dramaticky zjednodušuje. Spustili službu Neo4j Aura Agent do všeobecné dostupnosti (GA).

Zdroj: neo4j.com/blog

Co to znamená pro nás architekty?

Dosud jsme museli logiku Agenta Výzkumníka, který se umí ptát do grafové databáze, psát ručně. Museli jsme mu vysvětlit schéma dat a naučit ho generovat Cypher dotazy. To bylo náchylné k chybám. Neo4j Aura Agent to otáčí. Je to služba přímo v cloudu AuraDB, která:

  1. Automaticky pochopí vaše data: Podívá se na ontologii vašeho grafu a sama vygeneruje nástroje, které agent potřebuje k dolování dat.
  2. Nasazení na jeden klik: Vytvoří zabezpečený endpoint (REST API nebo MCP Server), ke kterému se můžete připojit.
  3. Integrace s MCP (Model Context Protocol): Toto je revoluce. Agenta postaveného nad vašimi firemními daty můžete díky MCP během minuty připojit přímo do nástrojů jako Claude Desktop, Cursor nebo Microsoft Copilot. V praxi to znamená, že část logiky, kterou jsme dříve museli kódovat v LangGraphu (napojení na databázi), nyní dostáváme jako hotovou službu. LangGraph pak využijeme na orchestraci vyšší logiky, zatímco o dolování dat se postará Aura Agent. Po celý únor 2026 je tato služba zdarma, takže doporučuji ji okamžitě vyzkoušet na vašich datech.

Human-in-the-loop

Záchranná brzda Pro CEO a ředitele firem je největším strašákem autonomní AI, která začne posílat nesmyslné e-maily klientům. LangGraph má pro toto geniální řešení zvané Human-in-the-loop. Můžeme definovat breakpointy: místa v procesu, kde se systém musí zastavit a počkat na schválení člověkem.

Typický scénář z praxe: Uživatel: „Pošli stížnost na IT oddělení, že nejde wifi.“ Agent writer: Napíše e-mail. LangGraph: Zastaví proces před odesláním. Uživatel (v rozhraní aplikace): Vidí návrh e-mailu a tlačítko [Schválit] nebo [Upravit]. Až po kliknutí systém pokračuje k nástroji pro odeslání e-mailu. Tím získáváte efektivitu automatizace, ale zachováváte 100% kontrolu nad výstupem.

Sdílená paměť (Persistence)

Další revoluční vlastností je perzistence. LangGraph ukládá „stav“ každého vlákna do databáze (my používáme Postgres). To znamená, že konverzace může trvat dny. Agent může narazit na problém, poslat vám notifikaci „Potřebuji schválit rozpočet“ a uspat se. Vy přijdete za dva dny, kliknete na „Schválit“ a agent se probudí přesně v tom bodě, kde skončil, se všemi kontexty a proměnnými. To už není chatování. To je workflow automatizace.

Praktický přínos: Proč za to platit? Možná si říkáte, proč stavět složitý graf agentů, když ChatGPT umí odpovědět taky. Odpověď je spolehlivost a specializace.

Jediný prompt, který má dělat všechno (hledat, počítat, psát, formátovat), bude vždy chybovat. Je to jako chtít po jednom zaměstnanci, aby byl účetní, právník i uklízečka zároveň. Když systém rozdělíte na malé agenty v LangGraphu, každý dělá jednu věc perfektně.

Agent SQL Expert se soustředí jen na psaní bezchybných dotazů. Agent Právník se soustředí jen na interpretaci smluv. Výsledkem je systém, který zvládne úlohy, na kterých běžné LLM selhávají.

Například: „Projdi všechny faktury za minulý měsíc, porovnej je se smlouvami v GraphRAGu a vypiš ty, které nesedí.“ To je úkol pro tým, ne pro jednotlivce.

V příštím, devátém díle se podíváme na téma, které je pro nasazení takto silných systémů kritické. Jak zajistit, aby se tento tým expertů nevzbouřil a data neutekla ven. Budeme řešit digitální pevnost a zabezpečení dat.

Díly seriálu

Obsah článku

Líbí se Vám obsah?

Odebírejte Newsletter, ať vám nic neunikne.

Vývoj AI

Vývoj interních zabezpečených AI systémů.

Sledujte mě na sítích.

Odebírejte Newsletter, ať vám nic neunikne.

Podobné články

Můj rok 2025 a plány na 2026

Jaký byl můj rok 2025? Doslova plný změn a tentokrát naštěstí pozitivních! Dá se říci, že jsem si konečně uskutečnil některé vytoužené a jiné méně

Číst více »