AI pro citlivá data · lokální modely a bezpečnost

Vaše data nesmí ven. Postavím AI, která tohle pravidlo dodrží od první minuty.

Interní AI agenti pro firmy, kde smlouvy klientů, zdravotní záznamy nebo finanční pozice nesmí utéct z perimetru. Lokální modely na vašem hardwaru, nebo EU cloud s privátními endpointy. Anonymizace osobních údajů, oddělené role, dohledatelnost každé odpovědi.

DG
Daniel Gottwald
AI Architect · 14 let v digitálu · Kutná Hora

Kontaktujte mě

Finanční sektor
Právní sektor
Vědecká instituce
Mediální dům

Proč běžný cloud AI nestačí

Vaše firma má povinnost vědět, kde jsou data klientů, kdo k nim přistoupil a co s nimi systém udělal. Smlouvy, zdravotní záznamy, finanční pozice, interní know-how. Pokud to skončí v ChatGPT, regulátor položí tři otázky, na které nedokážete odpovědět.

Kde jsou data fyzicky? Kdo k nim měl přístup? Použije je poskytovatel AI k trénování svého modelu?

Standardní cloud AI je navržený pro produktivitu, ne pro důkazní stopu. Pro firmu, která spadá pod GDPR, MDR, AI Act, DORA nebo má povinnost mlčenlivosti vůči klientovi, to nestačí. Stavím AI architektury, které těmto pravidlům vyhoví od první minuty, ne jako přídavek na konci.

Dvě varianty, jak data udržet v bezpečí

Podle míry regulace a citlivosti dat volíme jednu ze dvou cest. V discovery fázi spočítáme, která dává smysl pro váš případ.

Lokální AI na vašem hardwaru

Open-source modely (Llama, Qwen, Mistral) běží na vašem serveru ve vaší serverovně. Data nikdy neopustí firmu, žádný vnější poskytovatel. Vyšší pořizovací náklad, plná datová suverenita. Vhodné pro nejpřísnější regulaci a firmy, které chtějí být nezávislé na cloudových poskytovatelích.

EU cloud s privátními endpointy

Azure OpenAI EU nebo Vertex AI EU s podepsanou zpracovatelskou smlouvou. Data zůstávají v evropském datacentru, žádný trénink na vašich datech. Nižší vstupní náklad, vyšší kvalita modelů, rychlejší nasazení. Před voláním modelu probíhá anonymizace osobních údajů.

Hybridní varianta

Pro většinu klientů ideální poměr. Citlivá vyhledávací vrstva běží lokálně, samotné generování odpovědi přes EU cloud s anonymizovanými daty. Provider vidí strukturu dotazu, ne obsah. Demaskování proběhne uvnitř vaší firmy.

Vlastní hardware, vlastní kód

Nezávisle na variantě platí: plný zdrojový kód, žádný vendor lock-in, dokumentace na úrovni runbooku. Pokud projekt převedete na vlastní tým nebo jiného dodavatele, vezmete si vše s sebou. Bezpečnost není přídavek, je součást architektury.

Co konkrétně řeším

Při návrhu architektury procházím tyto hrozby u každého klienta. Ne checklist, který se odškrtne, ale konkrétní místa, kde se rozhoduje, jestli vám systém v provozu způsobí incident.

Hrozba
Mé opatření

Citlivé údaje v dotazu (jména klientů, IBAN, čísla smluv) odejdou do externího AI
Anonymizace osobních údajů před odesláním. Jména, identifikátory, čísla účtů se nahradí placeholderem, po přijetí odpovědi se vrátí zpět uvnitř vaší firmy. Poskytovatel vidí strukturu dotazu, ne obsah. Lokální varianta tento krok nepotřebuje.

Uživatel s nízkým oprávněním dostane v odpovědi data, ke kterým nemá přístup
Filtr práv probíhá před vyhledáváním, ne po něm. AI nikdy nevidí dokumenty, ke kterým uživatel nemá přístup. Žádný kompromis.

Útočník vloží do firemního dokumentu skryté instrukce pro AI
Oddělení uživatelského dotazu od systémových instrukcí. Vstupní brána, která validuje, co se k modelu dostane. Detekce neviditelných znaků a známých útoků.

Regulátor se zeptá, kdo se díval na data klienta X a co s nimi AI udělala
Dohledatelný záznam každé interakce. Kdo se ptal, kdy, jakým dotazem, jakou odpověď dostal, z jakých zdrojů. Záznamy neměnné, importovatelné do vašeho bezpečnostního nástroje. Odpověď do minuty.

Poskytovatel AI změní podmínky, zdraží nebo zkrachuje
Architektura nezávislá na konkrétním poskytovateli. Lze přepnout na jiný cloud nebo přejít na lokální model bez přepisování celého systému. Pro klienty s nejpřísnějšími požadavky volím lokální variantu už od začátku.

AI rozhodne místo člověka v situaci, která to nesmí
Pro citlivé akce (odeslání emailu, změna v CRM, vytvoření dokumentu) vyžaduje AI lidské schválení. Navrhuje, člověk rozhoduje. Žádná autonomní akce bez explicitního potvrzení.

Tři případy z reálné praxe

Finanční sektor

AI agent nad investičními postupy, smlouvami a interní knihovnou

Klient spravuje stovky milionů Kč klientského majetku. Citlivá místa: jména klientů, struktura portfolií, vnitřní investiční pravidla. Architektura: anonymizace osobních údajů před každým voláním AI, oddělené role podle pozice uživatele, dohledatelný záznam, kdo se ptal na co. Poskytovatel AI neviděl ani jedno klientské jméno za 12 měsíců provozu.

Právní sektor

AI asistent pro daňové a realitní právo

Klient drží mlčenlivost vůči svým klientům dle zákona o advokacii. Architektura odděluje veřejnou doménu (zákony, výklady) od neveřejné (uploadované dokumenty uživatele). Žádný únik mezi případy, zpracovatelská smlouva s poskytovatelem podepsaná, právní odpovědnost mapována od první minuty.

Vědecká instituce

AI průvodce nad granty, smlouvami a interními předpisy

Citlivá místa: pracovní smlouvy, grantové žádosti, interní personální agenda. Architektura: žádný trénink na klientských datech, oddělení administrativní a vědecké domény, dohledatelnost kompatibilní s grantovými povinnostmi. Akceptační kritérium 95 % správnosti na ověřovacím datasetu jako součást smlouvy.

Jak se architektura mapuje na AI Act

AI Act je účinný od srpna 2026. Pro většinu firem to znamená povinnost provozovatele, ne poskytovatele. Konkrétní opatření, která řeším v každém projektu:

Regulační povinnost
Mé opatření

Data governance
Dokumentovaný proces, jak data vstupují do AI, jak se filtrují, jak se zaznamenávají. Žádná černá skříňka pro regulátora.

Technická dokumentace
Architektonický dokument, bezpečnostní analýza, výsledky měření kvality. Sada artefaktů, kterou si můžete předložit při kontrole, ne PDF napsané den před auditem.

Záznamy a dohledatelnost
Neměnný záznam s jednoznačným identifikátorem každé interakce. Retenční pravidla podle vašich interních standardů a regulace. Hashování pro důkaz neměnnosti.

Lidský dohled
Pro citlivé akce AI navrhuje, člověk schvaluje. Žádná autonomní akce bez explicitního potvrzení.

Přesnost a robustnost
Tříúrovňové měření kvality — deterministická kontrola, automatické hodnocení druhým modelem, provozní monitoring. Bez čísel z provozu nelze obhájit, že systém splňuje požadavky.

Co nedělám
Právní výklad jednotlivých článků. To je práce vašeho právníka nebo compliance odborníka. Já dodávám technickou stranu, kterou váš právník může před regulátorem obhájit.

Mapování je orientační. Konkrétní povinnosti závisí na klasifikaci systému (high-risk vs. limited-risk) a vašem byznys kontextu — řešíme případ od případu.

Bezpečnostní stack

Šest vrstev, kterými prochází každý dotaz a každá odpověď. Žádná vrstva není volitelná — vynechání kterékoli z nich znamená, že systém má díru, kterou regulátor nebo útočník najde.

Vstupní vrstva

Anonymizace osobních údajů (jména, čísla účtů, identifikátory), detekce skrytých znaků v dokumentech. Oddělení uživatelského dotazu od systémových instrukcí. Validace na vstupu tam, kde to dává smysl.

Vyhledávací vrstva

Filtr práv probíhá před vyhledáváním, ne po něm. Pre-filter na úrovni dokumentu. AI nikdy nevidí, co uživatel nesmí vidět.

Tool vrstva

Bezpečnostní brána mezi AI a vašimi firemními nástroji. Žádný přímý přístup AI k systémům — vše přes bránu s vlastními pravidly, omezením četnosti volání a kontrolou každé akce.

Výstupní vrstva

Kontrola odpovědí na známé útoky a skryté znaky. Demaskování osobních údajů probíhá až ve výsledku, který se zobrazí uživateli, ne v meziproduktu.

Záznamová vrstva

Neměnný záznam každé interakce, jednoznačný identifikátor napříč voláními, hashování pro důkaz neměnnosti. Strukturovaný formát, importovatelný do vašeho bezpečnostního nástroje.

Provoz

Lokální AI na vašem hardwaru (Llama, Qwen, Mistral), nebo EU cloud (Azure OpenAI EU, Vertex AI EU) — podle vašich požadavků na regulaci a rozpočet.

Jak to probíhá — týden po týdnu

Bezpečnostní analýza a threat model nejsou týden 7, ale součást discovery v týdnu 1. Bezpečnost se nedoporučuje až po MVP, řešíme ji od první minuty.

Týden 1

Discovery a threat model

Mapuji citlivá data, klasifikaci AI systému dle AI Actu, požadavky regulace, hardware možnosti pro lokální variantu. Výstup: architektonický dokument a první návrh scope.

Týden 2–6

MVP s bezpečnostní vrstvou od první minuty

Postavím funkční prototyp nad vašimi hlavními zdroji s anonymizací, oddělením rolí a záznamem od první commitu. Bezpečnost není přídavek po MVP, řešíme ji od první minuty.

Týden 7–10

Měření kvality a bezpečnostní audit

Nastavujeme měření, jak AI v provozu odpovídá. Kompletní bezpečnostní audit architektury. Pokud chcete, koordinuji externí penetrační test se spolehlivým partnerem.

Týden 11–14

Produkční nasazení a dokumentace

Tvrdé spuštění pro pilotní skupinu, monitoring, ladění. Dokumentace pro regulátora a předání vašemu IT a compliance týmu.

Provoz

Měsíční rozvoj a monitoring

Volitelný retainer pro monitoring kvality, aktualizace modelů, audit reporty, řešení incidentů. Bez tohoto systém po půl roce zastará, s ním je každý měsíc o něco lepší.

Kontaktujte mě

Cena

Cena se odvíjí od hodnoty a rozsahu řešení, ne od počtu odpracovaných hodin. Bezpečnostní vrstva není přídavek, je součást ceny.

Typ Cena
Bezpečnostní audit a návrh architektury od 120 000 Kč
Pilotní projekt (MVP) od 250 000 Kč
Plná implementace na míru od 700 000 Kč
Lokální AI infrastruktura na vašem hardwaru (nad rámec plné implementace, dle požadavků) od 150 000 Kč
Provoz, monitoring a rozvoj (není povinný, můžeme se domluvit na předání po 2 měsících od spuštění produkce) od 30 000 Kč / měsíc

První krok pro většinu klientů je bezpečnostní audit. Pokud z něj vyjde smysluplný projekt, audit se započítává do ceny implementace.

Časté otázky

Kde fyzicky běží naše data?

Dvě varianty. Lokální: vlastní hardware ve vaší serverovně, open-source modely, data nikdy neopustí firmu. EU cloud: Azure OpenAI EU nebo Vertex AI EU s privátními endpointy a podepsanou zpracovatelskou smlouvou. Provider neuvádí vaše data pro trénink. Pro většinu klientů je optimální hybridní varianta, kde citlivá retrieval vrstva běží lokálně a generování přes EU cloud s anonymizací.

Lze provozovat AI úplně na našem hardwaru bez cloudu?

Ano. Open-source modely (Llama 3, Qwen, Mistral) běží na serveru ve vaší serverovně. Trade-off: vyšší pořizovací náklad na hardware (server s odpovídajícím výkonem), nižší kvalita oproti špičkovým proprietárním modelům, vyšší provozní nárok. Pro firmy s nejpřísnější regulací nebo strategickou potřebou nezávislosti je to správná volba. V discovery spočítáme, jestli dává smysl ve vašem případě.

Jak řešíte AI Act od srpna 2026?

Architektura počítá s povinnostmi provozovatele AI od první minuty: záznamy, data governance, lidský dohled, technická dokumentace, měření kvality. Klasifikaci systému (high-risk vs. limited-risk) řešíme s vaším compliance týmem nebo právníkem v týdnu 1. Já dodám technickou stranu, kterou váš právník může před regulátorem obhájit.

Co když máme GDPR, DORA a MDR najednou?

Většina opatření se překrývá: dohledatelnost, data governance, oddělení rolí, retence. Architektura není stavěna pro jednu regulaci, ale pro princip „regulátor se zeptá, vy odpovíte do hodiny“. Konkrétní mapování řešíme s vaším právníkem, do právního výkladu nezasahuji, dodávám technickou stranu.

Pošlete naše smlouvy klientů do OpenAI nebo Anthropic?

Ne. Citlivá data s osobními údaji nikdy neopustí váš perimetr v podobě, ve které by je mohl externí poskytovatel přečíst. Je to pevná zásada, kterou držím u všech projektů s citlivými daty, ne marketingové prohlášení.

Pokud zvolíte lokální variantu, data fyzicky neopustí váš hardware. Žádný cloud, žádný externí provider.

Pokud zvolíte cloud variantu (Azure OpenAI EU nebo Vertex AI EU), před každým voláním AI probíhá nahrazení jmen, čísel účtů, identifikátorů smluv placeholderem. Poskytovatel vidí strukturu a typ dotazu, ne obsah. Demaskování proběhne uvnitř vaší firmy. Provider tak nikdy nedostane informaci, na základě které by mohl identifikovat konkrétního klienta nebo dokument.

Spolupracujete s naším IT a bezpečnostním týmem?

Ano, je to standard. Discovery v týdnu 1 zahrnuje review s vaším IT a bezpečnostním týmem. Threat model schvalují společně s vámi a vaším právníkem. V průběhu projektu pravidelný sync, ne jednorázové předání.

Děláte penetrační testy AI aplikací?

Ne přímo. Stavím systémy, které pentest projdou — to je odlišná disciplína. Doporučím spolehlivého partnera, nebo to nasměruji s vaším existujícím dodavatelem bezpečnostních služeb. Pentester a stavitel mají odlišný úhel, obě role v projektu dávají smysl.

Co když odejdete uprostřed projektu?

Pro projekty s citlivými daty je tato obava zvlášť legitimní. Tři opatření: 1) všechno běží na vaší infrastruktuře, ne na mých účtech; 2) průběžná dokumentace na úrovni runbooku, kterou si může převzít interní DevOps; 3) standardní open-source komponenty bez proprietárního kouzla. Riziko sólisty je řešeno designem, ne slibem.

Kolik klientů paralelně zvládnete?

Maximálně tři. Bezpečnostní práce vyžaduje hloubku, kterou se nevyplatí dělat zběžně. U každého klienta mám podepsané přísné NDA, takže veškeré informace nikdy neopustí vaši firmu — ani směrem k jinému klientovi, ani nikam jinam. Pokud zrovna nemám kapacitu, řeknu to upřímně místo abych vás zavázal a poslal juniorský tým.

Vlastníme zdrojový kód?

Ano. Plný kód, dokumentace, infrastruktura jako kód. Žádný vendor lock-in. Pokud projekt převedete na vlastní tým nebo jiného dodavatele, vezmete si vše s sebou.

Kontakt

Pokud řešíte AI v prostředí, kde data nesmí ven, napište mi. Stačí dvě věty o tom, co řešíte. Odpovídám do dvou pracovních dní.

Napsat e-mail