Otvorené údaje (filozofia, legislatíva, transparentnosť)

Záznam z Pracovnej skupiny 22.6. 2021 otvorené údaje venujúci sa tejto téme:
Publikovanie osobných údajov ako otvorených
Špeciálny hosť na stretnutí: Judr. Pavel Nechala

1 Like

https://digital-strategy.ec.europa.eu/en/news/new-rules-open-data-and-reuse-public-sector-information-start-apply

1 Like

Takto je to riešené v Česku. Ak som to správne pochopil, je to veľmi jednoduché a efektívne. Nie je potrebné otvárať každý špecifický zákon, ktorý zahrnie možnosť publikovať dáta podľa neho ako otvorené. Je to riešené opačne, tj. existuje taxatívny výčet, že ktoré údaje môžu byť ako opendata zverejnené.

Miro, toto je nariadenie vlády, nie zákon. To je úplne niečo iné.
Ber to tak, že “v rámci platných zákonov, pre tieto údaje (viď. príloha) zariaďte zverejnenie ako OD”.

3 Likes

@Lubor a všetci ostatní prispievateľia, ďakujem za pomoc. Verím že sa táto téma čoskoro utrasie a sfinalizuje, určite to ešte spolu predtým spoločne prejdeme.

Kým sa tak stane, práve som pridal nový dataset dátových kurátorov ÚOŠS, pretože sme mali veľa požiadaviek na jeho zverejnenie.

2 Likes

Ak by ste mali zaujem → prave zacalo online skolenie Publikacne minimum statnej spravy: Online školenie: Tvorba publikačného minima štátnej správy - KOMUNITA | DATALAB vedie ho @liska pekne prehladne a do dost hlbokych detailov. Ktori to nestihete, zaznam pridame na nas youtube channel: https://www.youtube.com/channel/UCF-rmyKJ9pE49CP8-rUi4mQ

3 Likes

Nech sa paci, zaznam skolenia: Video školenie Tvorba publikačného minima štátnej správy - YouTube

3 Likes

Práve som sa dozvedel (na superkonferencii), že v ČR v súvislosti s otvorenými údajmi pribudnú už tento rok dve novinky v zákone:

A) Forma zverejňovania dát (s nejakými výnimkami) musí byť rovno vo formáte OpenData,

čo je ale superbomba podľa mňa je

B) Ak sa medzi rôznymi OVMkami zdieľajú údaje (ktoré nie sú osobné, …) ale sú otvorené , tak je najskôr nutné sprístupniť ich ako opendata, až na ne je potrebné vybudovať integráciu.

Ide o tzv. Verejný dátový fond
https://archi.gov.cz/nap:verejny_datovy_fond

(Tým sa aj vyriešil problém, aby OVMko nerozhodovalo komu sa dovolí napojiť na otvorené údaje a komu nie.

Musím ešte pohľadať konkrétne znenia ich zákonov. Kedže teraz finishujeme paragraf otvorené údaje do zákona o údajoch, toto by asi za pokus stálo.

5 Likes

Ad A) Ak chceš do zákona napísať, že sa niečo konkrétne má zverejňovať ako otvorené údaje, tak jednoducho “úrad X zverejňuje údaje Y ako otvorené údaje z)” kde z) je poznámka pod čiarou vedúca na § 52 štandardov ISVS.
Táto formulácia je už v legislatíve použitá, viď. z.211/2000

(všimni si, že pojem “otvorené údaje” sa v zákone použil bez toho, aby bol v ňom, alebo hocakom inom definovaný)

Ad B) som šokovaný, žeby predsa používanie otvorených údajov bolo možné aj bez ich podpisovania? (myslené ironicky)

1 Like

Ten odkaz 27na odkazuje na vtedy platny Vynos 55/2014, ktory to, co su Otvorene údaje upravoval v § 52 a 53:

Vynos bol nahradeny vyhlaskou 78/2020, ktora to upravuje v § 39 a 40

2 Likes

Máš pravdu, o dôvod viac neprečíslovávať § v štandardoch len tak.

OK priatelia, dovoľte mi zdieľať, ako chceme vyriešiť problém zadefinovania povinností zverejňovať opendata cez Zákon o údajoch tak, aby sme nič nepoškodili, resp. aby sme nezaviedli viac neporiadku ale aby sme sa posunuli, nie zase nesystematicky. Verím že sme našli správne riešenie. Dali sme si Vami povedať, ďakujem @Lubor ovi, že ma posunul.

Najskôr napíšem, čo potrebujeme zaviesť (obdobné veci sú aj v ČR). Napíšem to zatiaľ mojím slangom.

A: Povinnosti OVM, ktoré sú pre nás dôležité

  1. aby OVM povinne katalogizovali metadáta všetkých otvorených údajov na centrálnom portály

  2. ak je to ustanované, špecifické datasety musia byť nielen katalogizované na centrálnom portály, ale musia mať aj definovanú štruktúru (publikačné minimum, highvalue datasety) , musia sa zverejňovať v definovanej periodicite a v predpísanej podobe sprístupnenia, tj. buď buď ako opendataapi, alebo na webe OVM, alebo nahratím súboru priamo do portálu (Vyhláška presne určí jednotlivé pravidlá)

  3. súčasťou datasetu musí byť licencia. bez udania sa štandardne udelí CCO.

B: Čo ale z definíciou otvorených dát?
Toto nebudeme pravdepodobne vôbec riešiť,urobíme to podobne ako je to napr. v 211/2000

čiže použijeme odkaz na paragraf definujúci otvorené údaje vo vyhláške 85/2000

a aby to bolo úplne ok, tak aj paragraf sa nebude volať že Otvorené údaje, ale Publikácia otvorených údajov OVM.

Vyzerá to že ako koncept je to priechodné aj u nás. Ak máte k tomu nejaké pripomienky, tak ich prosím zazdielajte. Ja sa to idem pokúsim naformulovať kvalitnejšie a pripraviť aj podrobnosti do vyhlášky k bodu 2 a keď si to tu vyštrngáme, tak to tu hneď zverejníme.

PS: Týmito úpravami nemáme ambíciu transponovať EÚ smernicu o opendátach (ktorá je silnejšia, napr. že opendata by default, atď). To by malo ísť cez novelu infozákona. Verím že budeme na tom spoločne spolupracovať s MinV. Každopádne, uvedené tri body majú pre nás veľký význam a posunú opendata vpred.

Global Data Barometer, Slovensko - Open Data indicators

Ahojte,

Robim za Slovensko vyskum pre novy Global Data Barometer (GDB), ktory nahradi Open Data Barometer. GDB mapuje legislativu, dostupnost dat a ich pouzivanie v praxi v niekolkych oblastiach, a jednou z nich su aj Open Data.

Velmi rada by som si preto overila par veci, ako napriklad skutocnost, ze:

    • Neexistuje strategicky ramec pre trening v oblasti otvorenych dat pre zamestnancov verejnej spravy
    • Neexistuje ramec alebo legislativa vymedzujuca zdielanie a vyuzivanie citlivych, chranenych, alebo inak neotvorenych udajov, vo vnutri vlady a s inymi sektormi
    • Neexistuje ucelena strategia na podporu vyuzivania otvorenych dat (data reuse), ktora by napr. zahrnala hackathony, informacne a financne kampane. Existuju len ojedinele aktivity

Snazila som sa skontaktovat DataLab, hlavne ohladom otazky treningu, ale zatial neuspesne. Ak by ste ma vedeli nasmerovat na relevantne kontaktne osoby alebo ak mate nejake pripomienky k hore uvedenemu, budem velmi vdacna. Mozte mi napisat bud sem alebo na lucia.cizmaziova@gmail.com

Vopred dakujem a ospravdelnujem sa ak postujem do nespravneho vlakna!

Lucia

2 Likes

Lucia, skusime s @liska pripravit odpovede a zasleme.

3 Likes

K Mirovmu plánu:

Toto je zrejme bezkonfliktná vec, ktorá je navyše už dnes povinná podľa štandardov ITVS.

Toto je kľúčová povinnosť že ktoré údaje majú byť povinne OpenData.
Nerozumiem čo znamená “ak je to ustanovené” - kde ustanovené?
Kde bude uvedený konkrétny obsah, čo je to publikačné minimum a ktoré sú to highvalue datasety?
Kde bude definovaná periodicita a predpísaná podoba sprístupnenia?
“Alebo nahratím súboru priamo do portálu” - zrejme si chcel napísať “alebo zverejnením súborov”, keďže nie je žiadny dôvod aby povinne všetci kopírovali svoje súbory na ďalší portál.

“musí byť licencia” - jasné. Už je to aj povinné podľa štandardov ITVS.
“štandardne udelí CCO” - ak to chcete dať do zákona, bude problém odkazovať na CC licencie, keďže sú slabo formalizované
Btw. ako default by som dal CC-BY. Bude to priechodnejšie.

Ničmenej už dnes režim opakovaného použitia údajov v zákone je, a treba ho preto využiť.
Konkrétny návrh: novelizačný bod z.211/2000, ktorým sa §21g ods.1 upraví tak, že namiesto “pokiaľ je to možné a vhodné” sa uvedie že vždy sa sprístupnia ako otvorené údaje, okrem situácie, kedy by týmto postupom bol ohrozený dôležitý hospodársky záujem štátu, čo musí byť písomne odôvodnené.

2 Likes

prvá vec:

Áno. Vo vyhláške 78/2000 sa v § 40 Poskytovanie otvorených údajov úvadza:
Štandardom poskytovania otvorených údajov je-

f) zaevidovanie datasetu s otvorenými údajmi v centrálnom katalógu otvorených údajov „data.gov.sk“,
toto ale nie je naformulované presne ale dosť vágne. správne je použiť slovo metadáta.`

h) poskytovanie metaúdajov pre dataset s otvorenými údajmi priamo na mieste poskytnutia datasetu alebo prostredníctvom katalógu otvorených údajov, ktorým je miesto evidencie otvorených údajov orgánu riadenia, a to najmenej v rozsahu podľa [prílohy č. 5](https://www.slov-lex.sk/pravne-predpisy/SK/ZZ/2020/78/20200501#prilohy.priloha-priloha_c_5_k_vyhlaske_c_78_2020_z_z), na základe profilu Data Catalog Vocabulary - Application profile 1.1 (DCAT-AP 1.1) v rozšírenej podobe DCAT-AP-SK zverejnenej v centrálnom metainformačnom systéme; nepovinné metaúdaje sa uvádzajú vždy, ak je metaúdaj známy; pre priestorové datasety sa metaúdaje poskytujú v rozšírenej podobe GeoDCAT-AP,

a toto hčko síce hovorí o metadátach, ale že ich môže poskytovať aj zdrojový systém, nie len centrálny bod. no dôvod je to, aby to centrálny portál vedel harvestovať aḱo ulahčenie zápisu metadát na centrálny server.

Čiže tu si myslím že keď dáme do zákona ten prvý bod, vec spresníme, zákon má vyššiu silu a v tej vyhláške je to naformulované trošku hmlisto.

čiže v tomto vidím zhodu.

druhá vec:

Tu nechceme hovoriť, ktoré údaje majú byť OpenData. My už počítame so smernicou, že všetko čo nie sú osobné údaje, alebo inak chránené údaje, sú otvorené. Čo chceme povedať je, že pre vybrané skupiny otvorených údajov nestačí len skatalogizovať ich na centrálnom portály ale je nutné dodržať aj štruktúru, ako budú vyzerať. Tu napr. môžete vidieť Publikačné minimum:

a keď si pozriete jeden dataset, napr. Organizačná štruktúra

tak tá predpisuje CSVčkovú reprezentáciu a aj RDFkovú. Ako vidíte, zeleným znamená pre nás že to je povinná forma, resp. 3★, a toto je vo vyhláške 78/2020 v paragrafe a Štandardom označenia údaja ako otvoreného údaja je

a) poskytovanie údaja v datasete v kvalite poskytovaného datasetu najmenej úrovne 3 ...
a toto je dobre naformulovaná technikália a patrí sem.

čiže ešte raz. v tom bode 2 nám ide o to povedať, že vybrané dataset, a tie budú definované vo vyhláške ku zákonu o údajoch, bude presne spísaný ich zoznam, periodicita, predpísaná forma sprístupnenia - viď ten link vyššie, a to je to miesto ustanovenia. Toto mi kolegovia právnici lepšie napíšu. V tejto vyhláške bude definované na začiatku len publikačné minimum. Ale novelou vyhľášky budeme možno upravovať aj highvalue-datasety, resp. iné datasety, a tam chceme mať priestor povedať - toto musí byť API, toto nemusí. atd… Čiže toto je pre nás dôležitý nástroj riadenia kvality vybraných datasetov.

A tá posledná vec,

“Alebo nahratím súboru priamo do portálu” - zrejme si chcel napísať “alebo zverejnením súborov”, keďže nie je žiadny dôvod aby povinne všetci kopírovali svoje súbory na ďalší portál.

to som zle naformuloval. Samozrejme že nechceme tlačiť dáta na centrálny portál ale presne opačne. Chcel som tým len povedať, že metadáta sa povinne musia nachádzať na centrálom portály, ale samotné dáta (distribúcie) môžu byť prístupné cez OpenDataAPI, na OVMku, alebo sa môžu nahrať na portál. Skúsim to lepšie naformulovať.

tretia vec:

OK, uprávim to na CC-BY.

posledná vec + zhnutie

OK rozumiem tomuto. Ak to ale správne chápem, navrhuješ konkrétnu zmenu pre 211/2000, a ja som obsahovo súhlasím. Dúfam že na to nezabudneme, lebo je to dobrá fomulácia. Čo sa ale deje s týmto zákonom ja momentálne neviem, ale info preposuniem.

Čiže keď to zhrniem, opäť iba v hovorovom jazyku, ktorý právnici ešte upravia, do zákona o údajoch navrhujeme pridať paragraf:

§ N Sprístupnenie otvorených údajov OVM

  1. aby OVM povinne katalogizovali metadáta všetkých otvorených údajov na centrálnom portály
  2. špecifické datasety definované vo vyhláške (publikačné minimum, highvalue datasety …) musia zodpovedať predpísanej štruktúre, musia sa zverejňovať v definovanej periodicite predpísaným spôsbom sprístupnenia,
  3. súčasťou datasetu musí byť licencia. bez udania sa štandardne udelí CC-BY.
1 Like

Ešte raz: veci ktoré stačí uviesť v štandardoch ITVS, nepatria do zákona.

Že bez explicitného udelenia licencie sa ex-lege predpokladá CC-BY, je fajn nápad, akurát by ma zaujímalo na ktoré údaje sa to má použiť. Keď niekto napíše “toto sú otvorené údaje” a nedá tam licenciu? (To sa stáva extrémne málokedy.)