Začnu upřímně. Znáš ten pocit, když nahlédneš do něčeho, co by mělo být otevřené, a najednou je tam mlha? Jako by někdo zhasl světlo. Tohle není jen technický problém. Je to věc moci, odpovědnosti a toho, kdo rozhoduje o našich penězích, pravidlech a životech. A podle mě máme právo vědět víc.
Co jsme ztratili a proč to bolí
Pamatuješ dobu, kdy statistiky, rozpočty a veřejné zakázky byly srozumitelnější? Neříkám, že všechno bylo perfektní. Ale měla jsi možnost najít čísla, porovnat je, zeptat se úředníka a často dostat odpověď. Dneska se setkáš s několika věcmi, které to komplikují. První je roztříštění dat do nesourodých systémů. Druhá je formát, ve kterém jsou data publikovaná — PDF, obrázky, systémy, které nelze dotazovat. A třetí je pravidlo: dostupné neznamená použitelně dostupné.
Pro nás to znamená reálné škody. Nemůžeš zkontrolovat, jak stát hospodaří s daněmi, když rozpočet existuje jen jako kniha plná čísel bez kontextu. Nemůžeš zjistit, kdo vyhrál tendr za podezřele vysokou cenu, když smlouva se skrývá ve složitém portálu, kde ti chybí metadata. A pokud jsi aktivista, novinář nebo prostě jen člověk, který chce odpověď — narazíš na bariéry.
To není jen frustrace. Je to ztráta kontroly. A když kontrola mizí, roste prostor pro chyby, manipulaci a korupci. Tak nějak to myslím.
Kde systém selhává technicky i lidsky
A teď konkrétně. Co se pokazilo a proč se nám to vrací jako bumerang.
První problém: datová lonely islands — ostrůvky informací. Ministerstva a instituce nasadila vlastní portály, každý jinak. Neexistuje jednotný způsob, jak data popsat. Výsledkem je chaos, který znemožňuje rychlé dotazy a porovnání. Když člověk chce vyzkoumat třeba veřejné zakázky napříč kraji, narazí na osm různých struktur, osm různých formátů a často chybějící identifikátory.
Druhá věc: formát. Nechceš to slyšet, ale PDF je často zbraní proti průhlednosti. Někdo vezme tabulky, uloží je jako naskenovaný PDF a řekne: „Hotovo, data jsou zveřejněná.“ Jenže nelze je strojově zpracovat. Přepsat stovky stránek ručně? Kdo to má dělat? Nehledě na chyby, které vzniknou při ručním přepisování.
Třetí problém: metadata a kontext. Data bez kontextu jsou jako recept bez surovin. Potřebuješ vědět, odkud data přišla, kdy byla aktualizovaná, co přesně sloupce znamenají. Bez toho nemůžeš věřit výsledkům analýzy. A často tam tyhle informace chybí.
Čtvrtý problém je právní a kulturní zároveň. Instituce se bojí sankcí, špatného PR nebo prostě ztráty kontroly. Tak raději poskytnou minimální množství informací, nebo ho zkomplikují. Tím se vytváří kultura utajování, která se jen těžko mění.
Pátý bod: komerční překážky. Některé státní systémy využívají externí dodavatele, kteří vytvořili portály na zakázku a teď si účtují za export dat. To znamená, že formálně jsou data „veřejná“, ale prakticky za nimi stojí obchodní bariéra. To je jako kdyby knihovna postavila vratník a chtěla zaplatit za vstup k poličce s encyklopediemi.
Zní to pesimisticky? Je to jen realita. A já věřím, že když rozumíš mechanice, víc toho uděláš.
Kam směřují data a kdo z toho profitoval
Mysli na data jako na tok řeky. Když se tok kontroluje, můžeš napájet mlýn nebo zničit pole. Když proud unikne, nikdo to neřídí. Přesně tak to funguje se státními daty. Ti, kdo mají přístup a umí s nimi pracovat, získávají konkurenční výhodu. Když jsou data zpracovaná v podobě API a otevřených datasetů, vznikají noví hráči — novináři, malé firmy, občanské iniciativy — kteří kontrolu posilují. Když data jsou zamčená, výhodu mají velké firmy s IT know-how, konzultanti a někdy i interní zájmové skupiny.
A nejhorší je, když veřejná data končí v rukou soukromých firem, které je následně obcházejí vlastním řešením za peníze. To ničí konkurenci a vytváří závislost veřejného sektoru na komerčních dodavatelích. Lidem připadá, že systém není pro ně, ale proti nim. Tím se rodí politická nespokojenost. A chápu to — já bych taky chtěl, aby informace o tom, jak se nakládá s mými daněmi, byly volně dostupné.
Pro příklad: pokud by existoval jednoduchý a univerzální registr smluv ve strojově čitelném formátu, mohli by občané i nezávislé skupiny rychle odhalit podezřelé opakované výhry u stejného dodavatele. Když to ale stojí v nedohledném formátu, ten samý proces stojí měsíce práce.
Co už je k dispozici a kde hledat
Nechci být doják. Něco se děje. Česká republika má veřejné iniciativy a portály, které zpřístupňují data. Například Open Data ČR sbírá metadata o tom, co je kde zveřejněno. To je důležité, protože aspoň víš, kde začít hledat. Jenže i s tímto nástrojem je práce daleko od úplnosti. Data jsou často neúplná nebo nekonzistentní.
Podobně mezinárodní instituce poukazují na to, že otevřená data zlepšují efektivitu státní správy a pomáhají odhalovat nesrovnalosti. To není moje osobní přání — to jsou zjištění odborníků. Ale co z toho, když realizace drhne?
Nicméně jsou i malé vítězství — komunitní projekty, které z ubohých PDF vytáhnou tabulky, novinářské týmy, které vytrvale konfrontují úřady, a občanské hnutí, které drží pozornost na veřejných zakázkách. Když lidi sdílejí nástroje a know-how, zvládnou i komplikované systémy.
Praktické kroky, které můžeš udělat hned
Teď k tomu užitečnému. Co můžeš udělat hned teď, pokud tě to trápí a nechceš čekat na zázrak od nahoře.
První: uč se číst data. Ani to není těžké. Existují online kurzy a nástroje, které ukážou, jak převést PDF na tabulky, jak dotazovat API a jak porovnat dataset. Když umíš aspoň základ, hned máš větší šanci vidět nesrovnalosti.
Druhé: zapoj se do komunity. Najdi nezávislé projekty nebo novináře, kteří se zabývají otevřenými daty. Kolektivní práce nese výsledky. Když sdílíš svoje zjištění, pomůže to ostatním a zrychlí to odhalení problémů.
Třetí: piš podněty úřadům a zapojuj veřejnou kontrolu. Nečekej, že se něco stane samo. Pošli konkrétní dotaz: požaduj dataset v otevřeném formátu s popisem sloupců a datem aktualizace. Trvej na tom a sdílej odpověď veřejně. Úřady často odpovídají lépe, když vědí, že to sledují další lidé.
Čtvrté: podporuj legislativní změny. Nejsi to jen ty, ale my. Podpora zákonů o otevřených datech, standardech a sankcích za nevyhovění změní prostředí. Nemusíš být politik; stačí podepsat petici, účastnit se veřejných konzultací nebo podpořit organizace, které se tím zabývají.
Páté: využívej nástroje, které zjednodušují práci. Přes soukromé nástroje, open-source projekty nebo nástroje neziskovek si můžeš zjednodušit analýzu. Takhle se rychleji dostaneš k jádru problému.
Co se může zlepšit bez velkých nákladů
Některé změny nevyžadují miliardové projekty. Jde o pravidla a disciplínu. Co kdyby úřady povinně uveřejňovaly data ve strojově čitelném formátu, například CSV nebo JSON, a zároveň s jasným popisem polí? Co kdyby exporty z interních systémů měly otevřená API jako standard? Co kdyby státní portály nechaly zákaz externímu dodavateli za přístup k datům? To zní jednoduše, ale má to velký dopad.
Dále — zavést pravidlo verzování dat. Když vidíš historii změn datasetu, můžeš sledovat, kdo a kdy upravil informace. To výrazně zvyšuje zodpovědnost. A taky — menší audity dat prováděné nezávislými experty. Nejde o obrovské peníze; jde o rutinu, která postupně mění kulturu.
A co takhle školení úředníků? Naučit lidi, proč se vyplatí data publikovat otevřeně a jak to dělat jednoduše. Když úředník pochopí, že otevřená data snižují dotazy občanů a zlepšují reputaci instituce, bude mít motivaci.
Zvu tě, abys to nebral jen jako teorii. Pokud změníme formáty, zlepšíme metadata a přidáme určitou míru veřejné kontroly, posílíme naši suverenitu nad tím, kdo spravuje informace o nás.
Může se to zdát jako detail, ale detaily dělají systém. A my si zasloužíme systém, kde data skutečně slouží lidem, ne potřebám byrokratických schémat nebo komerčních zájmů.






