Otvorené údaje (filozofia, legislatíva, transparentnosť)

jasne…a ked ich teda zverejnia vo forme, ktora ulahci dalsie strojove spracuvanie, a niekto nasledne tie zverejnene udaje zacne spracuvat za nejakym inym ucelom, pre ucely svojho biznisu trebars, tak to je ok ?

Tak toto predpokladám že rieši licencia, ktorá je neoddeliteľná súčasť datasetu. Datasety s takými osobnými údajmi (ktoré nejaký zákon stanovil že sa musia zverejniť) predpokladám nebudú v režime CC0, ale v nejakom inom. Toto je možné upraviť vyhláškou, aké licencie sa na aký účel môžu použiť.

dakujem, toto dava zmysel.

K otázke “účelu zverejnenia”: Nuž, zákony, ktoré som doteraz čítal, nemali toto priamo uvedené.
Chápem, že technokraticky by bolo veľmi jednoduché keby sa v zákonoch písalo úplne presne čo kto môže a čo nie. Našťastie to tak nie je.

Čiže naopak: účel si musí stanoviť ten, kto osobné údaje používa. Otvorené údaje sú iba dostupný zdroj. Musí vyhodnotiť, či ho môže použiť a tieto údaje nejakým spôsobom spracúvať. Ak je to na základe oprávneného záujmu (“našiel som zverejnené údaje a mám takýto skvelý nápad čo s nimi robiť”) tak testom proporcionality.

(Toľko môj laický názor, už 6 rokov OOÚ iba sledujem ako používateľ.)

Chalani, licencia je v tomto nepodstatná a v pohode nech zostane CC0/CC-BY. To, že je v nej napísané “môžeš si robiť s údajmi čo chceš” nijako nemení obmedzenia zo zákona na používanie osobných údajov. To si musí každý ošetriť sám, podľa toho zákona. Je to podobné, ako keď vo výnose o štandardoch je napísané, že OpenData sa môžu spájať s inými údajmi - pritom vieme, že na spájanie OÚ si treba špeciálne dávať pozor.
(Kontrola: poznáte v niektorom zo štátov EÚ licenciu “CC+GDPR poučky”? Ja nie.)

Či je nejaké spracúvanie “ok”, alebo “nie ok” si musí vyhodnotiť spracovateľ údajov, dotknuté osoby môžu využiť všetky svoje práva podľa zákona a dohľad nad tým vykonáva ÚOOÚ. Toho, kto údaje zverejnil (podľa zákona), do toho nič nie je. Resp. teda ak narazí na podozrivé využitie údajov ktoré zverejnil (úmyselne sa vyhýbam feudálnemu pomenovaniu “svoje údaje”), môže samozrejme komunikovať so spracovateľom a keď sa nedopracuje k dobrému výsledku, má dať podnet na ÚOOÚ.

Príklad: predajca áut taktiež nerieši, či niekto auto používa “ok” spôsobom, alebo nie. Pri “nie ok” volá policajtov.

Samozrejme zverejňovateľ údajov by nemal priamo navádzať na nelegálne používanie údajov. Napr. reklama “tu sme zverejnili krásne údaje o štatutároch a konečných užívateľoch výhod, pomocou nich môžete plošne profilovať masy ľudu či nerobia niečo zvláštne” je zjavne za čiarou.

Teraz som sa stratil. Načo je zverejňovanie ou opendata, keď sa ďalej s nimi nedá nič robiť lebo gdpr?

1 Like

Toto si kde videl?

Tak včera sme mali skvelé interné stretnutie, kde sme ešte dokončovali práve vzťah otvorených údajov a osobných údajov. Musím povedať že tu i nás nikto nechce nič obmedzovať. Naopak hľadáme systémovú cestu, ktorá by túto tému potisla maximálne dopredu. Nie som právnik, ale pokúsim sa to zhrnúť, aký je výsledok.

Áno, toto som pochopil. Licencia neurobí z dát otvorené údaje, ak tie údaje nie sú skutočne otvorené. Licencia skôr upresní ako sa otvorené údaje môžu použiť. Bez úplnych obmedzení, resp. s uvedením ich tvorcu, atď. Licenciu nedokážem použiť na to, že publikujem osobné údaje a licenciou ich obmedzím, napr. nesmú sa kombinovať, upravovať, atď. Potom by to už neboli otvorené údaje.

Takto isto som to chápal aj ja. Napr. ak mám jablká, tak by nemalo byť v zákone definované, čo sa smie robiť robiť (konzumovať, pestovať, predávať) a čo nesmie (páliť jablkovicu, hádzať jablká do okna). To či ich používam v súlade so zákonom (zákonmi), vyplýva z iných zákonov, napr. nesmie sa páliť slivovica, nesmieš poškodzovať majetok iných …

Avšak ak som správne porozumel, GDPR je veľmi silné kladivo, ktoré by mohlo nejasné, resp. nezákonné definície ľahko rozprášiť, a riskovalo by sa veľa sporov. To kľúčové je, že osobné údaje sa zverejňujú len kvoli nejakým zákonom, najčastejšie v súvislosti s výkonom verejných funkcií, transparentnosťou, a pod. Tu je publikovanie osobných údajov v poriadku (samozrejme len minimálneho rozsahu), ale i tak je ťažko toto všeobecne zadefinovať.

Aby ale dátovka urobila maximum, čo má v svojej kompetencii, navrhnuté riešenie upravuje, že OVM môže poskytovať osobné údaje ako otvorené, len ak na to existuje jasný predpis, alebo ak udelená osoba udelí súhlas. Toto je samozrejme konzistentné s GDPR, ale aspoň to bude v zákone jasne uvedené. Čiže teraz sa v rámci jednodlivých zákonov bude musieť postupne podopĺňať, že tieto a tieto dáta, ktoré sa zverejňujú podľa zákona, je možné publikovať aj ako otvorené údaje.

Takže to znenie paragrafu o otvorených údajov je nasledovné (pridávam aj pojmy, nakoľko tie sa aktualizovali tiež).

§ 3

Vymedzenie základných pojmov

Na účely tohto zákona je

  1. údajom informácia uložená v informačnom systéme orgánu verejnej moci, ktorá svojou povahou neumožňuje členenie na menšie časti,
  2. základným údajom konkrétny údaj o hmotných alebo nehmotných objektoch skutočného sveta definovaných prostredníctvom dátových prvkov,
  3. metaúdajom údaj o údaji, ktorý slúži na reprezentáciu vlastností základných údajov,
  4. dátovým prvkom popisný metaúdaj používaný na definovanie vlastností a vzájomných vzťahov základných údajov,
  5. ontológiou množina dátových prvkov popisujúcich vlastnosti a vzájomné vzťahy údajov,
  6. štrukturálnym metaúdajom klasifikačný metaúdaj alebo dátový prvok,
  7. objektom evidencie množina základných údajov definujúcich konkrétny hmotný objekt alebo konkrétny nehmotný objekt skutočného sveta a jeho vzťahy, ktorý je predmetom evidovania orgánom verejnej moci v rámci jeho pôsobnosti a ktorý je jednoznačne identifikovaný identifikátorom objektu evidencie,
  8. ontológiou objektu evidencie množina metaúdajov definujúcich objekt evidencie a jeho vzťahy,
  9. hodnotou údaja neprázdna a konečná postupnosť znakov, ktoré údaj obsahuje alebo prázdny údaj,
  10. konceptom hodnota údaja reprezentujúca položku údaja číselníka, taxonómie alebo tezauru,
  11. klasifikačným metaúdajom metaúdaj, ktorý jednotne klasifikuje údaje za účelom interoperability údajov, najmä číselník, taxonómia a tezaurus,
  12. číselníkom zoznam prípustných konceptov pre dátový prvok,
  13. taxonómiou spôsob hierarchická kategorizácia konceptov usporiadaných od všeobecnejších ku konkrétnejším prípustných pre dátový prvok,
  14. tezaurom komplexný strojovo spracovateľný slovník konceptov pozostávajúci z množiny prepojených taxonómií,
  15. jednotným referencovateľným identifikátorom je jedinečný referencovateľný identifikátor definovaného údaja alebo metaúdaja jednotne používaný v informačných systémoch verejnej správy vo formáte URI (Uniform Resource Identifier),
  16. datasetom množina údajov zverejnených alebo zostavených orgánom verejnej moci v rámci jeho pôsobnosti podľa osobitných predpisov a dostupných buď prístupom cez aplikačné programové rozhranie informačného systému alebo priamym prístupom na distribúciu datasetu,
  17. distribúciou datasetu konkrétny stojovo-spracovateľný formát datasetu dostupný na uloženie,
  18. katalógom vybraná množina metadát o datasetoch alebo elektronických službách poskytujúcich datasety,
  19. katalogizáciou otvorených údajov proces automatizovaného získavania metaúdajov o otvorených údajoch,
  20. kvalitou údajov merateľná charakteristika údajov v informačných systémoch verejnej správy vyjadrená parametrami kvality údajov, a to presnosťou, konzistentnosťou, správnosťou, kompletnosťou, unikátnosťou, aktuálnosťou, strojovou spracovateľnosťou, interoperabilitou údajov a referenčnou integritou,
  21. zvyšovaním kvality údajov kvalitatívne a kvantitatívne zlepšenia parametrov kvality údajov zaznamenané dvomi alebo viacerými meraniami kvality údajov toho istého údaju v priebehu určitého obdobia, v rámci ktorého boli vykonané nápravné opatrenia alebo zamedzenie vzniku nekvalitných údajov,
  22. riadením kvality údajov proces zahrňujúci najmä opis pravidiel merania kvality údajov, meranie kvality údajov, identifikáciu nedostatkov, nápravné opatrenia, opätovné meranie kvality údajov na vyhodnotenie úspešnosti prijatých nápravných opatrení,
  23. registrom miesto elektronického uchovávania údajov v správe orgánu verejnej moci podľa osobitného predpisu, ktorý vo vzťahu k údajom vytvára, uchováva a vykonáva ďalšie úkony v rámci svojej pôsobnosti,
  24. správcom registra orgán verejnej moci, ktorý vedie register podľa osobitného predpisu,1)
  25. registrátorom orgán verejnej moci, ktorému zákon zveruje právomoc rozhodovať o právach a povinnostiach fyzických osôb alebo právnických osôb v oblasti verejnej správy, a to iba v rozsahu tejto jeho rozhodovacej činnosti a ktorý je podľa osobitného predpisu oprávnený vykonať zápis, zmenu alebo výmaz údajov objektov evidencie z registra,
  26. Centrálnym modelom údajov množina ontológií zverejnená ministerstvom, ktorá sa používa pri opise základných údajov, ich vlastností a vzájomných vzťahov,
  27. Centrálnym inventárom údajov je databáza rezortných inventárov údajov obsahujúcich objekty evidencie vrátane k nim prislúchajúcich dátových prvkov podľa jednotlivých registrov a informačných systémov verejnej správy spravovaných orgánmi verejnej moci.

a samotný paragraf o otvorených údajoch (bod 5 a 8 súvisí práve so vzťahom osobných údajov a otvorených):

ŠIESTA ČASŤ

OTVORENÉ ÚDAJE

§ 19

(1) Otvorený údaj je údaj dostupný voľne, bezplatne a bez časového obmedzenia, ktorý je zároveň

  1. zverejnený a sprístupnený elektronicky v štruktúrovanej forme, v strojovo-spracovateľnom formáte v kvalite umožňujúcej jeho ďalšie neobmedzené spracovanie a použitie, a to aj opakovane,
  2. sprístupnený neobmedzene všetkým osobám za rovnakých podmienok použitia určených pri sprístupnení údaja orgánom verejnej moci, a to aj prostredníctvom anonymného vzdialeného automatizovaného prístupu,
  3. použiteľný aj na účel výkonu podnikateľskej alebo inej zárobkovej činnosti, a
  4. voľne kombinovateľný s inými údajmi a ktorý je možné dopĺňať, opravovať, modifikovať alebo použiť len jeho časť.

(2) Základnými štruktúrami otvorených údajov sú

  1. dataset otvorených údajov,
  2. katalóg otvorených údajov,
  3. distribúcia datasetu,
  4. elektronická služba poskytujúca distribúciu datasetov.

(3) Centrálny portál otvorených údajov je informačný systém verejnej správy, ktorý vykonáva katalogizáciu metaúdajov otvorených údajov verejnej správy a poskytuje priestor na ich zverejnenie. Správcom a prevádzkovateľom Centrálneho portálu otvorených údajov je ministerstvo.

(4) Orgány verejnej moci sprístupňujú otvorené údaje tak, že metaúdaje otvorených údajov zverejňujú na Centrálnom portáli otvorených údajov a k tomu prislúchajúcu distribúciu datasetov zverejňujú

  1. na Centrálnom portáli otvorených údajov, alebo
  2. na príslušnom webovom sídle orgánu verejnej moci, alebo
  3. vo forme dátových elektronických služieb poskytujúcich otvorené údaje.

(5) Pri sprístupnení otvorených údajov podľa odseku 4 orgán verejnej moci je povinný označiť zverejňovaný dataset ako otvorený údaj a pripojiť licenciu umožňujúcu jeho voľné použitie, najmä licenciu Creative Commons CC0.

(6) Orgány verejnej moci zverejňujú otvorené údaje minimálne vo forme štruktúrovaných údajov v otvorenom formáte v súlade so spôsobom sprístupnenia podľa osobitného predpisu.1) Pri zverejňovaní referenčných údajov a štrukturálnych metaúdajov ako otvorených údajov sú orgány verejnej moci povinné vytvoriť aspoň jednu distribúciu datasetu vo formáte Resource Description Framework (RDF) v súlade s princípom interoperability údajov podľa § 18.

(7) Orgány verejnej moci zverejňujú a sprístupňujú otvorené údaje v kvalite, štruktúre a periodicite podľa metodického usmernenia ministerstva, minimálne v rozsahu publikačného minima ustanoveného všeobecne záväzným právnym predpisom, ktorý vydá ministerstvo.

(8) Osobné údaje sa považujú za otvorené údaje:

  1. ak sú zverejňované podľa osobitných predpisov a osobitný predpis ustanoví, že sa môžu použiť ako otvorené údaje alebo**
  2. ak dotknutá osoba udelí písomný súhlas podľa osobitného predpisu na ich použitie ako otvorené údaje.

no, veľa štastia…toto bude asi na dlhú trať.

Prosim nie. Toto by ste celu open data iniciativu uplne pochovali.

1 Like

To je nezmysel. Namiesto toho stačí v zákone o údajoch uviesť, že týmto zákonom nie sú dotknuté pravidlá ochrany osobných údajov podľa osobitných predpisov. Ošetrenie ktoré osobný údaje sa môžu zverejňovať je potrebné spraviť už teraz (napr. v zákone, alebo súhlas atď.).

Tento odsek je úplne zbytočný. Stačí ho nahradiť tým, čo som tu napísal vyššie. Budeme to pripomienkovať.

…celkovo som od začiatku varoval, že byrokratický aktivizmus “napíšme všetko do zákona” pri otvorených údajoch povedie presne k tomu čím to začalo: k väčšej byrokracii, a tým to otvoreným údajom iba uškodí.

1 Like

Vieš byť plís konkrétny, čo máš na mysli tým, že by sme išli otvorené údaje pochovávať?
Aby sme sa mohli niekam od toho reálne posunúť?

My chceme otvorené údaje čo najviac posilniť, pretože si uvedomujeme, že napr. transparentnosť a verejná kontrola je jednou z najlepších vecí ktoré ťahajú slovensko dopredu, a rozhodne toto meniť nechceme.

Momentálna situácia v oblasti osobných údajov je, povedal by som, veľmi nejasná. Ja viem že nemôžes liať chémiu do Dunaja, ty to vieš, vieme to všetci. Ale pri zverejňovaní osobných údajov je názorov snáď toľko ako diskutujúcich. :face_with_monocle:

My sme dokonca aj dostali pripomienku (viď od @Ivet_Fercikova vyššie), aby sa vyjasnilo, kedy sa osobné údaje môžu zverejniť ako otvorené, a kedy nie. To sa od zákona o údajoch očakávalo.

Čiže keď sa vrátim k meritu veci, uvedenú problematiku sa snažíme riešiť v súlade s EÚ.
Tu je na to zaujímavý článok:

Ak nájdete nejakú krajinu ktorá má podľa Vás najlepšie možne riešené údaje, sem s ňou.
Takže teraz hlavne hľadáme názory ako sa to dá vyriešiť aby boli všetci spokojní, aj opendata, transparentnosť, gdpr, …, toto sú všetko veci ktoré do toho vstupujú.

OK, toto beriem ako konkrétny návrh, posuniem ho naším dátovým legislatívcom. Tak či onak otázka zostáva, či to bude na niečo dobré, či týmto pádom sa rozplynú pochybnosti ktoré údaje sa zverejniť môžu a ktoré nie? Obávam sa, že toto ničomu nepomôže.

Chalani, skúsim to inak.Nemôžu si to plís pozrieť aj Vaši právnici? Teraz nie preto aby sme stále oproti sebe, ale aby sme spoločne túto veci pohli ďalej. Ja to osobne ajtacky vnimam myslim ze rovnako Vy. Musim ale priznat ze nasi datovi pravnici mi to vysvetlili ovela sirsie: osobny zaujem vs. verejny zaujem.

Som optimista, ze to dokazeme vsetko zladit. Cim dalej som ale skor konzervativnejsi, ze riesenie bude velmi jednoduche a okamzite (Bez potreby tvorby osobitnych predpisov) . Ale budem sa rad mylit.

A datovi pravnici chapu, ako funguje Google, ktory automatizovane indexuje a uchovava miliony osobnych udajov zverejnenych na weboch statnej spravy? To len na margo extremov, ktore pravnici (ne)maju radi.

Otvorene data (data, nie forma) sa v nicom praxi neodlisuju uz od tych zverejnenych vo formate HTML. Rovnako tak je HTML strojovo spracovatelne a scrapovane. Akurat tymto sposobom postavia dalsiu barieru pre ludi, ktori s datami potrebuju pracovat. Da sa obist, ale na co?

Na to tu majú nás “vecniarov”. Tu myslím máme porozumenie, že či sú už osobné údaje na webe, tj. v HTML, alebo sú publikované v CSV, XML, JSON … tak tento rozdiel je irelevantný.

Problémom je, že otvorené údaje sú obrovsky slobodné, v podstate bez akýchkoľvek obmedzení.

A my ich takto definujeme aj v zákone 1:1. Čo je podľa mňa správne.
Ak by boli osobné údaje publikované ako otvorené dáta, tak by sme im dali význam, ktorý nemôžeme. Môcť ich kombinovať, spájať, atď. Teda aspoň takto mi to bolo vysvetlené, a tomu rozumiem, je to OK.

Otvorené údaje sa teraz definujú presne tak, ako sa majú. Hľadajme spoločne cestu ako sa popasovať s tým, čo sa vynorilo. Tak to vidím. Jednoducho to, že si to každý vysvetľuje inak asi treba vyriešiť a mať v tom jasné pravidlá. Aby sme urobili krok, resp. kam až môžeme v dátovke zájsť, tak zatiaľ najlepšie riešenie je uvedený odsek 8, kde sa spomína osobitný predpis.

V čom sa ale všetci okamžite zhodneme je, že to musí platiť pre účely verejného záujmu, ak ide o politikov, resp. verejné osoby. Aby ich osobné údaje boli aj otvorené. Teda samozrejme iba istý rozsah, niečo ako publikačné maximum verejnej fyzickej osoby. Tieto údaje chceme kombinovať vo verejných registroch. Napr. aké dotácie (Dotačné opendata) berú poslanci (Verejné osoby) a podobne.
Transparentnosť určite potrebujeme, o tom niet pochýb na žiadnej strane. Neviem ale ako je dobre zadefinovaný verejný záujem. Lebo potom by teoreticky mohol znieť daný paragraf takto (pridal som bod 2):

(8) Osobné údaje sa považujú za otvorené údaje:

  1. ak sú zverejňované podľa osobitných predpisov a osobitný predpis ustanoví, že sa môžu použiť ako otvorené údaje, alebo
  2. ak sú zverejňované podľa zákona v súlade s verejným záujmom, alebo
  3. ak dotknutá osoba udelí písomný súhlas podľa osobitného predpisu na ich použitie ako otvorené údaje.

Len toto je čisto moja neprávnicka predstava, nie som si istý či by to takto stačilo.

Toto je na zúfanie.
Ešte raz generálna otázka: prečo, preboha prečo, chcete robiť špeciálne pravidlá pre zverejňovanie osobných otvorených údajov?
OpenData je o forme, forme, forme zverejňovania údajov, nie o rozsahu. Rozsah zverejňovania zostáva rovnaký, rovnaký, rovnaký, ako bol “pred” otvorenými údajmi, podľa rovnakých, rovnakých, rovnakých pravidiel ako bolo doteraz.

Ak má snáď niekto nejasnosti, ktoré údaje môže zverejniť - chápem - pravidlá sú zložité a niekedy aj nejasné - ale môže a má si to vyriešiť mimo úvah o otvorených údajoch.

Špeciálne pre Mira: pozri si obľúbené OpenData schodíky od TBL. Hovorí sa tam niekde “čo sa má zverejniť”? Nič také som tam nevidel.

Pre právnikov a úradníkov (môžeš odkázať): predstavte si to tak, že vždy súčasne, súčasne, súčasne riešite zverejnenie údajov “pozeracím spôsobom” a “OpenData spôsobom”. Celé OpenData sú akoby “ďalšia webstránka, len v inom jazyku” s tými istými údajmi, pre tých istých používateľov, ktorý s nimi budú robiť tie isté veci.

1 Like

Nech sa páči, s týmito úvahami na Ministerstvo spravodlivosti, tam to kompetenčne patrí. Tu sme ITčkari a riešime ITčkarske otázky. Či majú byť zverejnené povedzme údaje o zdravotnom stave ministra financií (evidentne je to mimoriadne predmetom verejného záujmu) ja absolútne netuším a nevidím pražiadny dôvod, prečo by to malo byť “vyjasňované” v rámci témy OpenData.

Táto predstava je lákavá, ale naivná. Samozrejme v platnosti vždy zostane celá plejáda limitov, čo s otvorenými údajmi nemôžeš robiť. Veľmi primitívny príklad: nemôžeš si ich zmeniť/vymyslieť tak, že tým niekoho/niečo ohrozíš. Ak začneš ako OpenData šíriť dáta, že vo Vrakuni je absolútne čistá a pitná podzemná voda (príklad, ktorý sa úmyselne ani vzdialene nepodobá na osobné údaje), tak máš problém.

Keď si na OpenDefinition nebudeš čítať iba super-zjednodušenú definíciu na 1 vetu, ale rozklikneš “plné” znenie, uvidíš, že “robiť všetko” sa nikde nevzťahuje na “zákonom zakázané veci”. A presne preto je prevzatie tejto definície (ešte snáď v jej zjednodušenej forme) do zákona blbosť.

nerozumiem co sa vynorilo, existuje nejaky material kde je napisane ze publikovane data sa nesmu publikovat formou “open dat”? Ak ano, tak ho treba posunut na mssr k vyjadreniu ( pretoze to je na prvy aj druhy pohlad hlupost) A ked to schvali mssr tak to potom napadnut na sude.
A ak tento napad ma nejake racio, tak v tom ze aj open data sa daju zneuzit na minimalne otravovanie ludi. Ale tomu sa neda zabranit formou zverejnenia ale upravou zakonov o priestupkoch alebo este lepsie sudnymi rozhodnutiami