Otvorené údaje (filozofia, legislatíva, transparentnosť)

Práve som sa dozvedel (na superkonferencii), že v ČR v súvislosti s otvorenými údajmi pribudnú už tento rok dve novinky v zákone:

A) Forma zverejňovania dát (s nejakými výnimkami) musí byť rovno vo formáte OpenData,

čo je ale superbomba podľa mňa je

B) Ak sa medzi rôznymi OVMkami zdieľajú údaje (ktoré nie sú osobné, …) ale sú otvorené , tak je najskôr nutné sprístupniť ich ako opendata, až na ne je potrebné vybudovať integráciu.

Ide o tzv. Verejný dátový fond
https://archi.gov.cz/nap:verejny_datovy_fond

(Tým sa aj vyriešil problém, aby OVMko nerozhodovalo komu sa dovolí napojiť na otvorené údaje a komu nie.

Musím ešte pohľadať konkrétne znenia ich zákonov. Kedže teraz finishujeme paragraf otvorené údaje do zákona o údajoch, toto by asi za pokus stálo.

5 Likes

Ad A) Ak chceš do zákona napísať, že sa niečo konkrétne má zverejňovať ako otvorené údaje, tak jednoducho “úrad X zverejňuje údaje Y ako otvorené údaje z)” kde z) je poznámka pod čiarou vedúca na § 52 štandardov ISVS.
Táto formulácia je už v legislatíve použitá, viď. z.211/2000

(všimni si, že pojem “otvorené údaje” sa v zákone použil bez toho, aby bol v ňom, alebo hocakom inom definovaný)

Ad B) som šokovaný, žeby predsa používanie otvorených údajov bolo možné aj bez ich podpisovania? (myslené ironicky)

1 Like

Ten odkaz 27na odkazuje na vtedy platny Vynos 55/2014, ktory to, co su Otvorene údaje upravoval v § 52 a 53:

Vynos bol nahradeny vyhlaskou 78/2020, ktora to upravuje v § 39 a 40

2 Likes

Máš pravdu, o dôvod viac neprečíslovávať § v štandardoch len tak.

OK priatelia, dovoľte mi zdieľať, ako chceme vyriešiť problém zadefinovania povinností zverejňovať opendata cez Zákon o údajoch tak, aby sme nič nepoškodili, resp. aby sme nezaviedli viac neporiadku ale aby sme sa posunuli, nie zase nesystematicky. Verím že sme našli správne riešenie. Dali sme si Vami povedať, ďakujem @Lubor ovi, že ma posunul.

Najskôr napíšem, čo potrebujeme zaviesť (obdobné veci sú aj v ČR). Napíšem to zatiaľ mojím slangom.

A: Povinnosti OVM, ktoré sú pre nás dôležité

  1. aby OVM povinne katalogizovali metadáta všetkých otvorených údajov na centrálnom portály

  2. ak je to ustanované, špecifické datasety musia byť nielen katalogizované na centrálnom portály, ale musia mať aj definovanú štruktúru (publikačné minimum, highvalue datasety) , musia sa zverejňovať v definovanej periodicite a v predpísanej podobe sprístupnenia, tj. buď buď ako opendataapi, alebo na webe OVM, alebo nahratím súboru priamo do portálu (Vyhláška presne určí jednotlivé pravidlá)

  3. súčasťou datasetu musí byť licencia. bez udania sa štandardne udelí CCO.

B: Čo ale z definíciou otvorených dát?
Toto nebudeme pravdepodobne vôbec riešiť,urobíme to podobne ako je to napr. v 211/2000

čiže použijeme odkaz na paragraf definujúci otvorené údaje vo vyhláške 85/2000

a aby to bolo úplne ok, tak aj paragraf sa nebude volať že Otvorené údaje, ale Publikácia otvorených údajov OVM.

Vyzerá to že ako koncept je to priechodné aj u nás. Ak máte k tomu nejaké pripomienky, tak ich prosím zazdielajte. Ja sa to idem pokúsim naformulovať kvalitnejšie a pripraviť aj podrobnosti do vyhlášky k bodu 2 a keď si to tu vyštrngáme, tak to tu hneď zverejníme.

PS: Týmito úpravami nemáme ambíciu transponovať EÚ smernicu o opendátach (ktorá je silnejšia, napr. že opendata by default, atď). To by malo ísť cez novelu infozákona. Verím že budeme na tom spoločne spolupracovať s MinV. Každopádne, uvedené tri body majú pre nás veľký význam a posunú opendata vpred.

Global Data Barometer, Slovensko - Open Data indicators

Ahojte,

Robim za Slovensko vyskum pre novy Global Data Barometer (GDB), ktory nahradi Open Data Barometer. GDB mapuje legislativu, dostupnost dat a ich pouzivanie v praxi v niekolkych oblastiach, a jednou z nich su aj Open Data.

Velmi rada by som si preto overila par veci, ako napriklad skutocnost, ze:

    • Neexistuje strategicky ramec pre trening v oblasti otvorenych dat pre zamestnancov verejnej spravy
    • Neexistuje ramec alebo legislativa vymedzujuca zdielanie a vyuzivanie citlivych, chranenych, alebo inak neotvorenych udajov, vo vnutri vlady a s inymi sektormi
    • Neexistuje ucelena strategia na podporu vyuzivania otvorenych dat (data reuse), ktora by napr. zahrnala hackathony, informacne a financne kampane. Existuju len ojedinele aktivity

Snazila som sa skontaktovat DataLab, hlavne ohladom otazky treningu, ale zatial neuspesne. Ak by ste ma vedeli nasmerovat na relevantne kontaktne osoby alebo ak mate nejake pripomienky k hore uvedenemu, budem velmi vdacna. Mozte mi napisat bud sem alebo na lucia.cizmaziova@gmail.com

Vopred dakujem a ospravdelnujem sa ak postujem do nespravneho vlakna!

Lucia

2 Likes

Lucia, skusime s @liska pripravit odpovede a zasleme.

3 Likes

K Mirovmu plánu:

Toto je zrejme bezkonfliktná vec, ktorá je navyše už dnes povinná podľa štandardov ITVS.

Toto je kľúčová povinnosť že ktoré údaje majú byť povinne OpenData.
Nerozumiem čo znamená “ak je to ustanovené” - kde ustanovené?
Kde bude uvedený konkrétny obsah, čo je to publikačné minimum a ktoré sú to highvalue datasety?
Kde bude definovaná periodicita a predpísaná podoba sprístupnenia?
“Alebo nahratím súboru priamo do portálu” - zrejme si chcel napísať “alebo zverejnením súborov”, keďže nie je žiadny dôvod aby povinne všetci kopírovali svoje súbory na ďalší portál.

“musí byť licencia” - jasné. Už je to aj povinné podľa štandardov ITVS.
“štandardne udelí CCO” - ak to chcete dať do zákona, bude problém odkazovať na CC licencie, keďže sú slabo formalizované
Btw. ako default by som dal CC-BY. Bude to priechodnejšie.

Ničmenej už dnes režim opakovaného použitia údajov v zákone je, a treba ho preto využiť.
Konkrétny návrh: novelizačný bod z.211/2000, ktorým sa §21g ods.1 upraví tak, že namiesto “pokiaľ je to možné a vhodné” sa uvedie že vždy sa sprístupnia ako otvorené údaje, okrem situácie, kedy by týmto postupom bol ohrozený dôležitý hospodársky záujem štátu, čo musí byť písomne odôvodnené.

2 Likes

prvá vec:

Áno. Vo vyhláške 78/2000 sa v § 40 Poskytovanie otvorených údajov úvadza:
Štandardom poskytovania otvorených údajov je-

f) zaevidovanie datasetu s otvorenými údajmi v centrálnom katalógu otvorených údajov „data.gov.sk“,
toto ale nie je naformulované presne ale dosť vágne. správne je použiť slovo metadáta.`

h) poskytovanie metaúdajov pre dataset s otvorenými údajmi priamo na mieste poskytnutia datasetu alebo prostredníctvom katalógu otvorených údajov, ktorým je miesto evidencie otvorených údajov orgánu riadenia, a to najmenej v rozsahu podľa [prílohy č. 5](https://www.slov-lex.sk/pravne-predpisy/SK/ZZ/2020/78/20200501#prilohy.priloha-priloha_c_5_k_vyhlaske_c_78_2020_z_z), na základe profilu Data Catalog Vocabulary - Application profile 1.1 (DCAT-AP 1.1) v rozšírenej podobe DCAT-AP-SK zverejnenej v centrálnom metainformačnom systéme; nepovinné metaúdaje sa uvádzajú vždy, ak je metaúdaj známy; pre priestorové datasety sa metaúdaje poskytujú v rozšírenej podobe GeoDCAT-AP,

a toto hčko síce hovorí o metadátach, ale že ich môže poskytovať aj zdrojový systém, nie len centrálny bod. no dôvod je to, aby to centrálny portál vedel harvestovať aḱo ulahčenie zápisu metadát na centrálny server.

Čiže tu si myslím že keď dáme do zákona ten prvý bod, vec spresníme, zákon má vyššiu silu a v tej vyhláške je to naformulované trošku hmlisto.

čiže v tomto vidím zhodu.

druhá vec:

Tu nechceme hovoriť, ktoré údaje majú byť OpenData. My už počítame so smernicou, že všetko čo nie sú osobné údaje, alebo inak chránené údaje, sú otvorené. Čo chceme povedať je, že pre vybrané skupiny otvorených údajov nestačí len skatalogizovať ich na centrálnom portály ale je nutné dodržať aj štruktúru, ako budú vyzerať. Tu napr. môžete vidieť Publikačné minimum:
https://wiki.vicepremier.gov.sk/pages/viewpage.action?pageId=67152325

a keď si pozriete jeden dataset, napr. Organizačná štruktúra
https://wiki.vicepremier.gov.sk/pages/viewpage.action?pageId=77332919

tak tá predpisuje CSVčkovú reprezentáciu a aj RDFkovú. Ako vidíte, zeleným znamená pre nás že to je povinná forma, resp. 3★, a toto je vo vyhláške 78/2020 v paragrafe a Štandardom označenia údaja ako otvoreného údaja je

a) poskytovanie údaja v datasete v kvalite poskytovaného datasetu najmenej úrovne 3 ...
a toto je dobre naformulovaná technikália a patrí sem.

čiže ešte raz. v tom bode 2 nám ide o to povedať, že vybrané dataset, a tie budú definované vo vyhláške ku zákonu o údajoch, bude presne spísaný ich zoznam, periodicita, predpísaná forma sprístupnenia - viď ten link vyššie, a to je to miesto ustanovenia. Toto mi kolegovia právnici lepšie napíšu. V tejto vyhláške bude definované na začiatku len publikačné minimum. Ale novelou vyhľášky budeme možno upravovať aj highvalue-datasety, resp. iné datasety, a tam chceme mať priestor povedať - toto musí byť API, toto nemusí. atd… Čiže toto je pre nás dôležitý nástroj riadenia kvality vybraných datasetov.

A tá posledná vec,

“Alebo nahratím súboru priamo do portálu” - zrejme si chcel napísať “alebo zverejnením súborov”, keďže nie je žiadny dôvod aby povinne všetci kopírovali svoje súbory na ďalší portál.

to som zle naformuloval. Samozrejme že nechceme tlačiť dáta na centrálny portál ale presne opačne. Chcel som tým len povedať, že metadáta sa povinne musia nachádzať na centrálom portály, ale samotné dáta (distribúcie) môžu byť prístupné cez OpenDataAPI, na OVMku, alebo sa môžu nahrať na portál. Skúsim to lepšie naformulovať.

tretia vec:

OK, uprávim to na CC-BY.

posledná vec + zhnutie

OK rozumiem tomuto. Ak to ale správne chápem, navrhuješ konkrétnu zmenu pre 211/2000, a ja som obsahovo súhlasím. Dúfam že na to nezabudneme, lebo je to dobrá fomulácia. Čo sa ale deje s týmto zákonom ja momentálne neviem, ale info preposuniem.

Čiže keď to zhrniem, opäť iba v hovorovom jazyku, ktorý právnici ešte upravia, do zákona o údajoch navrhujeme pridať paragraf:

§ N Sprístupnenie otvorených údajov OVM

  1. aby OVM povinne katalogizovali metadáta všetkých otvorených údajov na centrálnom portály
  2. špecifické datasety definované vo vyhláške (publikačné minimum, highvalue datasety …) musia zodpovedať predpísanej štruktúre, musia sa zverejňovať v definovanej periodicite predpísaným spôsbom sprístupnenia,
  3. súčasťou datasetu musí byť licencia. bez udania sa štandardne udelí CC-BY.
1 Like

Ešte raz: veci ktoré stačí uviesť v štandardoch ITVS, nepatria do zákona.

Že bez explicitného udelenia licencie sa ex-lege predpokladá CC-BY, je fajn nápad, akurát by ma zaujímalo na ktoré údaje sa to má použiť. Keď niekto napíše “toto sú otvorené údaje” a nedá tam licenciu? (To sa stáva extrémne málokedy.)

Cize ak to spravne chapem, s tymy dvoma bodmi si OK, tj. :

  • povinne metadata na centralnom portaly (co je oprava dvoch bodov f a h v povodnej vyhlaske lebo nie su OK)
  • predpisanie publikovania specifickych datasetov (pub. minimum: struktura, periodicita, sposob spristupnenia)

len toto ma ist do vyhlasky 78/2020 o standardoch pre ITVS a nie do zakona o udajoch? ze?

Čo je nevynutné do zákona a čo nie nech primárne povedia právnici. Ale mne sa teda zdá, že napr. “metadáta na portál”, to je klasická vec na štandardy.
Predpísanie publikovania konkrétnych datasetov - určite v zákone bude MIRRI potrebovať splnomocnenie, že to vôbec môže robiť.
V zásade zákon hovorí o povinnosti, detaily ako presne sa má vykonať tam už byť nemusia. Čiže napr. keď už niečo sú otvorené údaje, aké všetky vecičky okolo toho treba spraviť to doteraz v zákone nebolo a nestretol som sa s tým že by to bola prekážka.

Áno, rozumiem, toto má právnici nabrífovali, a taký je zámer. V zákone sú len príkazy, zákazy atď, a vo vyhláške sú už podrobnosti.

Toto možno zaváňa štandardmi, metadáta, ale ide nám iba o jasné prikázanie. Možno lepšie by bolo to naformulovať (opať hovorovo):

1) OVM je povinné katalogizovať všetky otvorené údaje v centrálnom portály otvorených údajov.

Dnes to tak nie je, je to iba súčasť vyhlášky, a práve tie dva body, ktoré o tom hovoria, sú napísané hmlisto a skôr zavádzajúco. Takto by sme to mali vyriešené hneď, jasne a explicitne.

Áno, presne tak. Na tomto pracujeme s dátovími kurátormi, a oni práveže chcú vidieť v zákone túto povinnosť, aby mohli aj argumentovať, prečo to musia robiť. Opäť, do zákona chceme dať len povinnosť (príkaz),

2) aby OVM povinne sprístupňovali definovanú množinu datasetov predpísanou formou (detaily vo vyhláške)

Obidva body majú pre nás praktický prínos, pretože toto riešime denno-denne. Čiže ja teda vidím v tomto prínos a takto to posuniem našim právnikom.

Super, dakujem! Na mail?

Tym padom ma viac zaujima transpozicia EU smernice.

Plus teda to, aby neboli zrusene, stratene ci zmakcene dnes platne veci, napr.:

+1

A jeden drobny nesuhlas:

Tu sa argumentuje v prospech CC0 tym, ze ak mam apku, v ktorej je 1000 datasetov a tie by boli pod CC-BY, tak ta “BY” by znamenala, ze sa “moja atribucia” (ako posdkytovatela dat) ocitne medzi 1000 dalsimi, zrejme v abecednom poradi. Z pohladu marktingu bezcenne, len teda autor apky by taku stranku robit musel, aj ked je bezcenna.

Zheruba v tejto linii (CC0 by default, v odovodnenych pripadoch CC-BY) teda ide IIRC usmernenie k INSPIRE od MZP SR.

Trvat na tom nebudem, ak by to mala byt povedzme vyhovorka pre UGKK, ze ak nie CC-BY, tak nedaju nic. :slight_smile:

V CR (podla info z ostatnej ich Open Data konferencie minuly tyzden) zbehlo par sudnych sporov, tusim az po Najvyssi ci dokoca Ustravny a vysledkom je, ze niektore veci “vyriesili” tym, ze presne vyumenuvaju, co ako Open Data zverejne byt ma. A teda co v zozname nie je, to sa zverejnovat nebude. To je trochu smutne. Ostava teda dufat, ze challenge na sudoch bude pokracovat aj dalej, aby sa zohladnila ci uz smernica alebo ustavne prava na informacie. Lebo aj mne sa vyrazne viac pozdava rezim “vsetko verejne, okrem uzko ohranicenych a explicitne zdovodnenych vynimiek”. Lebo vieme, ze v SR sa za kazdu nejasnu alebo co i len trosku spornu vec hned radi schovaju aj potmehudi a nasledne sa verejnuje len velmi malo. Vid napr. uroven, akou UKGG lpie na ochrane udajov o shapoch (t…j. tvar a poloha, nie zoznam majitelov) parciel C a E na zaklade GDPR (ako bolo par kat prezentvane ich zastupcami na roznych PS).

v kombinacii s:

Tu dam +1 . Opakovane sme narazili pri Open Data aj na GDPR resp. ochranu sukromia. T.j. napr. udaje z OR ci Katastra. Vsetkym (nam nepravnikom) je jasne, ze su to verejne udaje, ale opakovane je problem, ak trvame na Open Data (=download, machine readable) napriek tomu, ze “uz davno je to na webe”. TL;DR k debate je, ze ak teda zakon hovori “treba zverejnit”, ma to byt spravene tak, aby tym zaroven podchytil aj rezim Open Data a tiez aj definoval aj “ucel” pre potreby GDPR. To je vec na poslancov a zakon(-y). Povedat “zverejnit” ale vynechat “ucel” ci “zdovodnenie” je z pohladu zverejovanych osobnych udajov “odflaknuta robota”, lebo mat na webe napr. Kastater ci OR, ktoreho sa legalne kvoli GDPR nemoze nik poriadne chytit, to nie je zverejnovanie ani transparentnost.

Len teda to naozaj musi byt v zakone(-och), ma to byt slusnou pravnicinou a teda musia to napisat dobri pravnici.

1 Like

Dobry den, zatial mi nic neprislo.

Dobrý deň, ďakujeme za ponuku spolupráce. Ospravedlňujeme sa za pomalú reakciu, myslím že by sme sa na to mohli spoločne pozrieť. Plánujeme prijať akčný plán pre

a mám pocit že sa tie témy prelínajú. Ozvem sa Vám cez mail, pripojím aj kolegov, a môžeme si naplánovať s Vami meeting a dohodneme sa čo ďalej.

Tak či onak, musíme vylepšiť proces spracovania ponúk. Okrem Vás som osobne dostal ponuku od p. Andrei Sulovej, ktorá pracuje v Dánsku vo firme https://www.dhi-gras.com/, ktorá robí pre štát geopriestorové dáta, pričom tiež som to len preposlal ale vec sa nikam nepohla. Ja sa priznám že nemám momentáne kapacitu sa tomu venovať, čo ale môže byť škoda, lebo riešenie môže byť zaujímavé (najmä keď sa používa v nejakej krajine EÚ). Možno by sme mohli v budúcich pracovných skupinách opendata dať aj priestor takýmto ponukám.