A víš ten moment, kdy si sedneš k počítači a zjistíš, že oficiální čísla nedávají smysl? Ten pocit, že někdo něco zamlčuje nebo přibarvuje. To je okamžik, kdy člověk začne hledat data sám. Takhle to myslím: data nejsou nuda. Jsou to stopy po rozhodnutích, chybách a faktických dopadech. A když jsou otevřená, můžeš je použít jako páku proti mlžení.
Proč data nejsou jen čísla
Mě to vzalo, když jsem poprvé porovnal počet úmrtí zaznamenaných podle data úmrtí a podle data nahlášení. Najednou se ukázalo, že skoky a propady v grafech někdy nejsou nástupem choroby, ale zpožděním v hlášení. To je důležité vědět, protože rozhodnutí se dělají z grafů. Když graf zlobí, dělají se špatná rozhodnutí.
Open data ti dávají možnost ověřit, zpochybnit a pochopit. Můžeš zjistit, kde se zvedá hospitalizace, jak se mění podíl pozitivních testů, nebo zda skutečně poklesl počet volných lůžek. A co je lepší — můžeš si to vytáhnout do vlastních tabulek a udělat si vlastní grafy. To není elitní hra statistiků. Stačí základní Excel nebo jednoduchý skript a už vidíš víc než v jedné tiskové zprávě.
A pořádně to bere ten, kdo má pocit, že systém nezaopatří lidi. Když data otevřeš, systém ztrácí možnost vyprávět jen svou verzi příběhu. To je přesně to, co námi, co nejsme slepě věřící, zajímá.
Kde data najdeš a jak s nimi začít
Nečekej, že ti státní weby všechno podají pěkně seřazené. Někde ano, jinde je to chaos. Výborným zdrojem globálních a srovnatelných údajů je Our World in Data coronavirus data. Mají CSV soubory, vizualizace a jasně uvedené definice. Pro Česko se hodí oficiální portál Ministerstva zdravotnictví nebo lokální datové portály, ale vždy si ověř datum a definici proměnné.
Chceš rychlý návod, co dělat první:
1) Najdi dataset formou CSV nebo JSON. Hledej sloupce s datem, lokalitou, počtem případů, počtem PCR testů, pozitivními testy, hospitalizacemi a úmrtími.
2) Zkontroluj licenci. Hledáš něco jako Creative Commons nebo explicitní povolení k použití dat. Není to teorie — bez licence ti data mohou zákonně omezit použití.
3) Podívej se na frekvenci aktualizace a časové razítko. Data aktualizovaná jednou denně se chovají jinak než data, která se doplňují jednou týdně.
4) Ověř integritu: podívej se na nulové hodnoty, extrémy a nesrovnalosti. Některé dny budou nula testů jen proto, že laboratoře neodesílaly.
5) Udělej jednoduchý graf: denní nové případy, sedmidenní průměr, kumulativní počet. Už tady se může objevit smysluplný vzor.
Nejsme všichni programátoři. Ale i v Excelu můžeš filtrovat, kreslit grafy a dělit data podle okresu nebo věku. Když chceš něco pokročilejšího, stačí Python s Pandas nebo R. Nic mystického.
Jak otevřená data mění hru a jak je použít
Představ si to takhle: státní úřad oznamuje, že restrikce už nejsou potřeba. Média to přehrají. Lidé se uklidní. Ale pokud máš otevřená data, podíváš se na trend hospitalizací a víš, že v některých okresech čísla stále stoupají. Můžeš upozornit místní zastupitelstvo, novináře, sousedy. To není teorie; to je jednoduchý občanský dohled.
Praktické použití:
– Lokální aktivismus: udělej mapu případů podle okresů a ukaž, kde riziko roste.
– Ověření vládních tvrzení: porovnej média a oficiální hlášení s primárními daty.
– Pomoc jednotlivcům: zjisti, kde je nejvyšší obsazenost lůžek a navrhni, kam volat urgentně.
– Investigace: sleduj nesrovnalosti v hlášení a pátrej po příčinách — jsou to chyby, změna definice, nebo něco horšího?
A jo, může to být i zábava. Naprogramuješ skript, který ti každý ráno pošle alert, když počet pozitivních testů v tvém okrese překročí určitou hranici. Nebo sleduješ poměr pozitivních testů k provedeným testům a zjistíš, že méně testů znamená vyšší procento pozitivních — což může maskovat reálnou situaci.
Nejsem si jistý, ale možná je to jen mnou, ale často stačí jednoduchá data a trochu zvědavosti k tomu, abys uviděl víc než stovky zpráv a tiskových konferencí.
Praktická varování a etika
– Soukromí: nikdy nevyhledávej nebo nepublikuj informace, které by identifikovaly konkrétní lidi. Open data by měla být anonymizovaná.
– Kontext: nevyvozuj kauzální závěry jenom z korelace. Například pokles případů může být důsledkem méně testování, ne zázračného léku.
– Transparentnost: když vytvoříš vizualizaci, přidej popisek o zdroji a datu poslední aktualizace. Pomáhá to kredibilitě.
Co dělat, když narazíš na manipulaci
A ano, to se stává. Někde budou data upravena, jinde budou definice měněny bez upozornění. Co dělat:
– Archivuj původní dataset. Pokud se později něco změní, budeš mít záznam.
– Porovnej více zdrojů. Pokud oficiální zdroj ukazuje podivný pokles, podívej se na lokální nemocnice, nezávislé registry a mezinárodní databáze.
– Sdílej své nálezy. Pošli to novináři, lokální komunitě, použij sociální sítě opatrně. Dezinformace se řeší daty, ne fňukáním.
A teď něco konkrétního, co můžeš udělat hned
Otevři Our World in Data coronavirus data, stáhni si CSV se statistikou zemí. V Excelu:
1) Vytvoř sloupec s 7denním průměrem nových případů.
2) Vyfiltruj jen Českou republiku.
3) Vykresli graf a přidej svislou čáru v datu, kdy byly zavedeny nebo zrušeny restrikce. Vidíš, jestli změna předcházela změně trendu nebo ne.
Takhle se dá snadno zpochybnit nebo potvrdit oficiální narativ.
Když chceš jít dál, nauč se základům mapování v QGIS. Vezmeš adresní úroveň, přidáš okresy a uděláš heatmapu. Najednou máš mapu, která říká víc než PR oddělení.
Proč to má smysl pro nás, co nejsme systémoví optimisté
My, co se díváme s rezervou na autority, nepotřebujeme konspirační teorie. Potřebujeme důkazy. Open data dávají důkazy. To je moc. Moc psát si vlastní příběh z čísel, nikoli ten, co je servírován narychlo v televizním bloku. A tenhle přístup neznamená, že jsi protivládní pro protest — znamená to, že vyžaduješ pravdu. A pravda se často skrývá ve vrstvách surových čísel.
A ano — cena? Trochu času. Trocha technické zručnosti. A chuť říct: chci vědět sám. Co kdybychom to vzali jako běžnou občanskou dovednost? Jako umět číst faktury nebo rozumět účtům. Data nás neudělají odborníky na medicínu přes noc, ale dají nám odvahu pohlédnout vládě a institucím pod pokličku.
Chci, abys odešel s jedním praktickým úkolem: stáhni jedno dataset, udělej z něj jednoduchý graf, pošli ho někomu, kdo ti věří, a požádej ho o názor. Diskuze z dat je to nejlepší, co máme proti mlžení.






