Jak budeme řešit opendata ve veřejné správě
Michal Rada, Ministerstvo vnitra ČR
Workshop CentraLab a otevřená data, prosinec 2013
OPEN…
Není to jen o samotných datech
Hodně se hovoří o “opendatech” jako otevřených datech
- Příkladem jsou otevřená data RUIAN
Existují ale i “openservices” jako otevřené služby
- Příkladem jsou otevřené služby ČÚZK v oblasti prostorových a geo informací
Jak publikujeme a prezentujeme data
Veřejná správa prezentuje data několika způsoby:
- Jako statické informace na webu
- Jako dokumenty na webových stránkách
- Jako webová rozhraní různých veřejných seznamů a rejstříků
- Jako odpovědi na žádosti o svobodný přístup k informacím
- Jako odpovědi na dotazy formou různých API rozhraní
- Jako strojově čitelná a popsaná data (opendata)
Vysvětlení … lidsky
Otevřená data jsou data, která veřejná správa vypublikuje, jsou k dispozici pro kohokoliv, nikdo o ně nežádá, ale rovnou je využívá a jejich využívání se nijak neomezuje a nekontroluje a nesleduje.
Taková data mohou být využívána jak pro potřeby veřejných služeb, tak pro potřeby občanů, tak pro potřeby komerčního i neziskového využití a dokonce se nad takovými daty dají vytvářet komerční služby a produkty.
Opendata are provided “as is” without any usage limitation and regulation.
…ve veřejné správě
Pro to, aby data veřejné správy byla považována za otevřená tak není striktně vyžadováno, aby navíc byla primární, zveřejněná bez zbytečného odkladu, neomezující přístup a stále dostupná, protože zajištění těchto podmínek nemusí být vždy v prostředí veřejné správy snadné. Protože ale splnění těchto podmínek dále zlepšuje využitelnost dat jejich potenciálními uživateli, je vhodné se o jejich naplnění snažit.
…ve veřejné správě
K vymezení otevřených dat je třeba ještě podotknout, že otevřená data jsou publikována, aby mohla být dále využívána ostatními orgány veřejné správy i dalšími právními subjekty a soukromými osobami. Veřejná správa disponuje ale i celou řadou dat, která ze své podstaty nejsou veřejná, respektive jsou nějakou právní formou chráněna (třeba osobní údaje podle Zákona č. 101/2000 Sb., o ochraně osobních údajů apod.). Takováto data pochopitelně nelze považovat za otevřená data, nicméně statistická a agregovaná data z nich v souladu se zmocněním vytvořená, již otevřenými daty být mohou (například počet obyvatel v obci jako statistické číslo, nikoliv však jako jejich seznam).
Principy otevřených dat
- technická otevřenost: Zveřejnění dat ve standardním strojově čitelném formátu, kde je k dispozici i datová struktura s popisem jednotlivých polí a částí dat
- právní otevřenost: Zveřejnění dat pod otevřenou licencí s jasně vymezeným způsobem užití a způsobem licencování těchto dat
- dostupnost a původnost: Jednotlivé datové sady jsou zveřejňovány jako jeden celek a nezměněné (tj. např. ne statistiky, ale data, na základě kterých se dají statistiky spočítat – s výjimkou dat, u nichž to ze zákona není možné)
- přístup: Katalogizace datových sad v katalogu dat pro usnadnění vyhledávání
Opendata dle…
Otevřená data se dají rozdělit třeba podle formy využití:
- Otevřená data posilující protikorupční prostředí (rozpočty, smlouvy, apod.)
- Aplikační otevřená data (JŘ, mapová data apod.)
- Informativní otevřená data (statistiky, agregovaná apod.)
Dále se dají dělit dle jejich technické formy a složitosti topologie:
- Tabulková data (to, co lze prezentovat jako tabulka stylu Sloupce řádky / Pole hodnoty)
- Strukturovaná data (to, co lze reprezentovat XML a XSD schématy struktury)
- Mamutí data (datové báze rozsáhlé a s vazbami)
Historie otevřených dat
O opakovaně využitelných datech “Reusable data” se začalo hovořit v roce 2000 s rozvojem národních databází členských států EU
Od roku 2003 existuje legislativa (směrnice o opakovaném využívání informací veřejného sektoru) a ta říká, že mají existovat data veřejné správy, která by se nejen napříč veřejné správy sdílela a dala automatizovaně využívat. Stanovuje pár definic a zásad a stanovuje možnost katalogu takových informací v jednotlivých státech.
Od roku 2009 se takovýmto datům říká “Opendata” - tedy otevřená data.
Nejsou to jen “opendata” ale i “Linkeddata” …
Historie po česku
Otevřená data v České republice trochu zprofanoval jednostranný pohled na “opendata” jen jako na protikorupční opatření
Trochu jsme nepochopili smysl otevřených dat a otevřených služeb
Problémy v této oblasti
- Neexistuje regulační rámec pro otevřená data a jejich rozsah
- Neexistuje česká právní definice toho, co to jsou otevřená data
- Veřejná správa neumí s opendaty dostatečně pracovat (neumí je publikovat a neumí je využívat)
- Nejsou dostatečně popsány rozdíly mezi “otevřenými daty” a “daty poskytovanými dle svobodného přístupu k informacím”
- Neexistuje model klasifikace a třídění otevřených dat dle jejich datových sad
- Principy interoperability na úrovni EU se teprve tvoří
- Musíme si uvědomit, že data nepublikujeme pro sebe
Co nás čeká?
- Tvorba regulačního rámce pro otevřená data
- Zakotvení otevřených dat jako zásadního principu publikace v rámci nového pojetí EG
- Tvorba/dobudování prvních zkušebních datasetů
- Tvorba národního katalogu otevřených dat
- Stanovení pravidel pro publikaci dat a záznamů v katalogu
- Realizovat vazbu “data v ISVS budou publikována jako opendata a to jako funkcionalita systému”.
Opendata jako princip
Při tvorbě nového strategického rámce e-governmentu a nastavení nových principů…
- považujeme otevřená data za nedílnou součást
- chceme, aby opendata publikovaly informační systémy
- postupné vymezujeme jednotlivé okruhy dat jako datové sady otevřených dat
- udržujeme katalog pro informace o datových sadách jako součást PVS
Národní legislativa
Problémy současného stavu
V naší legislativě nejsou opendata nijak upravena
- Úřady vlastně nemusí dělat nic (usnesení vlády z akčního plánu OGP je vesměs bezzubé)
- Není vyjasněná otázka toho, zda úřad “smí” dělat “cokoliv navíc”, než mu říká zákon
- Ve veřejné je řada projektů opendat, ale nenazývají se tak a nejsou tak označovány
- Neexistuje definice toho, co jsou opendata a jak to funguje
- Neexistuje právní rámec pro publikování opendat a jejich využívání, včetně licenčních podmínek
Národní legislativa
Jak to má vypadat?
- Obecná právní úroveň - stanoví, že co mohou být opendata, to také mají být a jsou veřejná
- Obecná procesní a technická úprava - definuje, co jsou opendata, jak to vypadá, jak se to publikuje, kde se to hledá apod. - bude v Zákoně o ISVS a souvisejících standardech
- Konkrétní procesy publikace v katalogu a správy (prováděcí vyhláška k Zákonu o ISVS)
- Právní úprava jednotlivých oblastí - v různých právních předpisech bude stanoveno, že něco jsou opendata (odskok na ISVS) a odkud se publikují
Národní legislativa
???
(zvažujeme vazbu mezi publikovanými opendaty/linkeddaty a tím samým pokud si o to žádá někdo dle Zákona o svobodném přístupu k informacím)
Národní legislativa
Úprava v Zákoně o ISVS
Základní právní rámec pro otevřená data
- Definice otevřených dat + definice dalších pojmů
- Opendata primárně jako publikace z ISVS a agregovaných zdrojů
- MV provozuje katalog opendat, ale nezodpovídá za data v datasetech
- Nastavit jednoznačný princip publikování v katalogu, včetně odmítnutí
- Technické podrobnosti publikování opendat vyhláškou
Národní legislativa
Úprava jednotlivých dat
Každý zákon stanovující závazně některá data jako opendata musí říkat něco ve smyslu: “Tato data jsou otevřenými daty veřejné správy dle zvláštního zákona” (vazba na Zákon o ISVS).
Tím se zajistí vazby u jednotlivých dat na obecné principy opendat, se všemi právními, procesními a technickými důsledky.
Realizovat vazbu “data v ISVS budou publikována jako opendata a to jako funkcionalita systému”.
Katalog
…mimochodem sám katalog je datovou sadou opendat
Principy katalogu
- Je provozován na základě zákona (novela ISVS) a zákon vymezuje i jeho obsah
- Je provozován jako součást Portálu veřejné správy a využívá jeho technologii
- Je primárním zdrojem informací o dostupných datových sadách, jejich popisu, jejich správcích a jejich umístěních a o dalších souvisejících skutečnostech
- Správcem katalogu je MV ČR, zodpovědnost za informace v záznamech mají ti, kdo je do katalogu zapsali
- Do katalogu jednotlivá OVM zapisují informace o datových sadách formou záznamů
- Jsou stanovena pravidla pro publikaci informací o datových sadách
Povinné náležitosti záznamu v katalogu
Každý záznam v katalogu bude obsahovat vymezení datové sady, formát a případně informaci o datovém modelu (popis, XSD schéma, apod.), popis dat a jejich využití, OVM které je správcem dat a ISVS z nějž jsou publikovány, informace o aktualizaci dat, formu licencování a užití, samozřejmě URL adresy datových sad, …
Postup pro publikaci záznamů o zdrojích dat v katalogu
- Správce dat (orgán veřejné moci) vyplní příslušný formulář, který je k dispozici na PVS. Ve formuláři uvede veškeré informace o zdroji dat
- Správce dat zašle vyplněný formulář prostřednictvím datové schránky
- V Katalogu otevřených dat na PVS bude zveřejněn záznam o zdroji dat
OVM publikující data
musí vyřešit:
- Zda má legislativní rámec pro to, aby publikovalo opendata
- Jaká data má publikovat jako opendata
- V jakých systémech (ISVS) jsou taková data spravována
- Technickou úpravu ISVS, aby uměly publikovat datových sad opendat
- Zajištění infrastruktury pro publikování datových sad (veřejně dostupný prostor se statickými URL)
- Popis samotných metadat a sběr veškerých požadovaných informací o nich
- Zápis do katalogu opendat a udržování záznamu
…jak na to?
Jedním z konkrétních způsobů, jak připravit informační systémy ve veřejné správě je…
…jako povinnou podmínku pro financování úprav zejména centrálních IS v následujícím období stanovit také úpravy pro publikování otevřených dat jako datových výstupů
Chceme, aby publikování dat také ve formě “opendat” a služeb také ve formě “openservices” bylo povinnou součástí realizace úprav IS v rámci modelu sdílených služeb.