Otvorené údaje (filozofia, legislatíva, transparentnosť)

Ahojte,

dovoľte mi plís založiť toto vlákno, pretože si myslím že je to momentálne veľmi aktuálna téma, a tým že sa v rámci zákona o údajoch vysporiadavame s pripomienkami, je tu istý priestor veci ešte vylepšiť.

V rámci tvorby publikačného minima MIRRI, konkrétne datasetu kontaktné miesta

som narazil na podľa mňa nevydiskutovaný priestor, a to je vzťah otvorených údajov ktoré sa zvyknú vnímať cez katalógy, datasety, distribúcie vs. normálne zverejnené údaje na webových stránkach.

Keď príde na zverejňovanie údajov povedzme o osobách, ako napr. štatutároch firiem (meno, priezvisko, adresa), poslancov, alebo spomenutých kontaktných bodov, tak ak sú tieto údaje zverejnené na webovej stránke, tak s tým problém nie je. Avšak ak by mali byť rovnaké údaje zverejnené ako opendata, povedzme tieto
https://www.mirri.gov.sk/ostatne-kontakty/
ako CSV dataset, tak existujú názory, že toto sa už nesmie a slovenská legislatíva to nedovoľuje. Pretože by sa mohli začať údaje kombinovať s inými, a to by môhol byť problém.

Ja sa priznám tento názor nezastávam, práve naopak. Pre mňa sú opendata v podstate všetky zverejnené údaje, len bohužiaľ slabo, resp. náročne strojovo spracovateľné.

Keby to malo platiť takto rigidne, tak by v podstate nemohla ani existovať transparentnosť, ktorá kombinuje povedzme údaje o poslancoch a údaje o dotáciach (viď nedávne čerpanie korona-dotácií).

Chcem sa spýtať: aký máte na to názor? Prípadne ešte lepšie. Nepoznáte podrobne EU legislatívu v tejto oblasti, ktorá toto nejako upravuje?

Ďakujem za každy názor.

nechcem byt nazigrammar ale fylozofia ma fakt picha v ociach:)
A k tomu druhemu, ak uz data su na webe, tak sa prakticky neda zabranit ich previazaniu. A tak nechapem argumentom ze predspracovanie pri publikovani moze byt v rozpore s legislativou.

Jo, moja chyba.

Musím toto ale pohľadať v nejakej EU legislatíve. Napr. tu sa niečo spomína

What are the implications of GDPR for Open Data?

There is still a misunderstanding about how protecting data and opening data can pursue the same goal. Some even claim GDPR is controversial to the concept of Open Data. GDPR deals exclusively with personal data. The only situation when GDPR directly affects Open Data is when Open Data includes personal data. According to GDPR, European citizens must give their clear and explicit consent to the processing of their data. Therefore, no personal data can be published for re-use without the consent of the affected party.

There are a few exceptions, when personal data can be published:

  1. If there are legitimate reasons to publish data. For example, in the case of a court decision. This rule restricts privacy rights in general.
  2. If the data has been anonymized.

Otázka je: ak existuje právny základ povinnosti zverejniť údaje, napr. štatutáry firiem, …, či toto môže byť zverejnené nie len v HTML, ale aj CSV. Ja som toho názoru že áno, ale viem si predstaviť aj názor, že nie, pretože z HTML je tažšie vytiahnuť tie dáta (hoc stačí urobiť iba copy and paste za jednu sekundu). :thinking:

ahojte, čo sa týka GDPR a open data, skúste pozrieť túto analýzu od Judr. Nechalu: https://www.alvaria.sk/wp-content/uploads/2021/04/Analyza-moznosti-zverejnovania-otvorenych-udajov-v-suvislosti-s-GDPR.pdf

2 Likes

Ale čo je ešte zaujímavejšie: Dávali sme pripomienku v tejto súvislosti k Návrhu zákona o údajoch:

MIRRI pripomienke nevyhovelo s nasledujúcim odôvodnením. Z tej argumentácie vieš pochopiť ako sa k spracovávaniu OÚ z registrov stavajú:

1 Like

Rozumiem. Tu sa ale musím právneho oddelenia dátovky zastať, nakoľko moje osobné skúsenosti sú také, že naopak vedia byť veľmi progresívni. A s dobrými argumentmi sa vždy dá dosiahnuť pokrok, avšak samozrejme musia postupovať podľa zákona.

Kde ja vidím priestor na možný posun, je vysvetľovanie, edukácia, že medzi otvorenými údajmi a údajmi zverejnenými na webe v podstate nie je rozdieľ. Napr. predstavme si príklad členov pracovnej skupiny Otvorené údaje. Ak sú údaje zverejnené na webe, tak je to chápané ako OK, a vyzerá to takto:

Dovolené :+1:
image

Zakázané :thinking:
image

Čiže ak mám dáta, ktoré obsahujú formátovacie HTML značky pre ich zobrazenie do tabuľky tak to je dovolené. Ak ale iba zverejním dáta s oddelením čiarok, tak to je už zakázané.

Podľa mňa sa asi otvorené údaje veľmi preceňujú, že sú nejaké iné ako klasické, ale pritom sú v podstate rovnaké. To čo z pohľadu GDPR sa nesmie zverejňovať ani webe, sa samozrejme nesmie objaviť ani v datasete. Ak existuje právny základ, resp. povinnosť niečo zverejňovať na webe, tak v tom istom rozsahu (nie väčšom) sa to môže zverejniť ako ako otvorené údaje.

1 Like

Zverejnenie ako otvorené údaje je tiež pravny základ na základe ktorého je možné zverejnovat osobne údaje?

To asi nie. Ale zákony sa predsa vedia vyvíjať. To čo tu chcem riešiť je, že ak napr. je štatutár nejakej firmy publikovaný na RPO, povedzme @Lubor v Slovenko.Digital

či je možné urobiť OpenDataAPI tak, že bude existovať služba ktorá vráti údaje len presne v tomto rozsahu, ako je uvedené na stránke. Zatiaľ to vyzerá tak, že je to zakázané, ale mne to príde že by to mohlo byť OK. Ak sa ale mýlim a v celej EÚ je to takto, tak sa prispôsobím.

Čiže podľa mňa s GDPR by to nemuselo byť v rozpore, považujem to že už tieto dáta (zobrazené na webe RPO) sú už GDPR v súlade. A či to vídim v HTMLku, alebo dostanem v CSV, XMLku, je už v podstate jedno, a teda môže existovať taká OpenData API služba.

Asi tam bude problém. Data - osobné údaje su zverejnené na nejakom právnom základe za nejakým účelom spracúvania . Ak ich zverejním ako opendata, tak aky právny zaklad a ucel spracúvania deklarujem?

1 Like

transparentnost, resp verejny zaujem. vsak posledna korona-dotacna kauza je o spojeni udajov o poslancoch a dotaciach. Ja to chapem ako verejny zaujem. Ci nie?

Alebo viem si predstavit aplikaciu, ktora mi podla GPS suradnic vzdy bude vracat zodpovednych poslancov a ich verejny kontakt. len tie iste udaje, ake su povedzme publikovane na strankach obce.

V poslednej dobe tu vnimam take inovativne pristupy, ktore sa ukryvaju pod uslachtilym pojmom “verejny zaujem”. Podla mna ak je nieco verejny zaujem malo by sa to po spolocenskej diskusii najprv objavit v pravnych normach a potom implementovat.

Mozno trochu off-topic, ale zacinam mat celkom obavy ako tu vseobjimajuci princip “verejny zaujem” zacina prevazovat nad pravom.

2 Likes

Dobre, dajme nabok teraz plis diskusiu o tom, čo je verejný záujem a čo nie. Pre mňa je toto čisto praktická téma, napr. publikačné minimum štátnej správy.

a) Ak na strákach ministerstva je zoznam kontaktov, otázka je, či to môže byť dostupné v CSVčku, nielen v HTML na stránke. Vyššie som ukázal, aký je reálny technický rozdiel medzi týmito údajmi. V podstate žiadny.

b) Alebo može byť napr. zoznam členov pracovnej skupiny, či rôznych komisií čo sú zverejnené na stránkach OVM tiež dostupné ako CSV, alebo nie?

c) Tu je výňatok z datasetu hlasovaní poslancov mesta Bratislavy. Znamená to, že tento dataset porušuje zákon? Ja verím že nie.

Ako som už písal ide mi o to, či náhodou niekto nevie ako to funguje niekde v EÚ. Plánujem toto zistiť, ale povedal som si, že sa spýtam i tu.

tu sa ale nebavime o verejnom zaujme, ale ciste o tom ci tieto data z webu moze poskytovat priamo stat alebo len komercny ci nekomercny subjekt. A mne tam chyba zakladna logika. Ak je nieco verejne tak hovorit aka forma je povolena a aka nie, to je pre mna divne. Pretoze kazdy si moze tie data previest do inej formy ale ak to spravi stat tak vsetkym znizi naklady.

2 Likes

To co hrozi je ze uz dnes su pristupne data co pospajanim porusuju gdpr. Ale to nevyriesi format zverejnovania, len zmena primarnych udajov ( bud nezverejnovat, anonymizovat alebo pseudoanonymizovat)

toto je podla mna chybna otazka, za prve gdpr riesi primarne to ze data ukladas a k tomu potrebujes dovod, a gdpr ti neuklada povinnost ich zverejnovat:) skor naopak. zverejnovanie je tak prave bud na zaklade zakona alebo “verejneho zaujmu” ( a rotteast hovori spravne ze pokial to nie je podlozene legislativou tak je to minimalne nesystemove slusne povedane)

1 Like

Tak toto je pre mňa super post, ktorý ma posunul.

Pretože my publikačné minimium robíme tak, že každý dataset má súviaci zákon, ktorý takéto údaje ukladá za povinnosť zverejňovať.

:point_right: Teda cesta smerom, že treba v zákone o údajoch spojiť otvorené údaje s rozsahom, ktorý je definovaný jednotlivymi zákonmi, je nádejná. vtedy sú open data OK, či je to meno poslanca, jeho priezvisko, adresa.

Pretože samozrejme rozdielnosť strojového spracovania webovej stránky, kde sú údaje štruktúrované cez HTML tagy (table, tr, td …) a povedzme CSV, kde sú údaje štruktúrované cez čiarky, je bezpredmentná.

Takto by bolo možné odstrániť aj právnu neistotu, ktorá súhlasím že dnes existuje

Gdpr primárne riesi že údaje spracuvas. Ukladanie dát je iba jedna z viacerých možností ich spracúvania.

1 Like

Nerozumiem Ivan, čo riešiš. Ak je v zákone napísané, že určité údaje sú verejné, tak áno, je to právny základ na ich zverejnenie aj osobných údajov v tom, čo sa má zverejniť. Vidíš nejakú inú možnosť?
Forma zverejenia nie je v tomto dôležitá.

1 Like

jasne…ale za akym ucelom su tie udaje zverejnovane ? len tak? alebo su zverejnovane za ucelom toho, aby ich niekto dalsi mohol spracuvat za nejakym ucelom? a k tomu spracuvaniu uz nemusim dat suhlas ? tak ?

Ja s týmto úplne súhlasím. Vidím to na takýto nejaký formulát:
“Orgány verejnej moci môžu sprístupňovať osobné údaje vo forme otvorených údajov len v rozsahu platných zákonov upravujúcich povinnosti zverejňovať údaje.”

Avšak nie som právnik. Musím sa pozrieť do iných štátov EU.

Podľa mňa účel je zadefinovaný vždy v tých jednotlivých zákonoch. Napr. zverejňovanie štatútárov je kvoli transparenttnosti, atd, a tým by to malo byť vybavené predsa nie? Pretože ak to môže byť zverejnené na RPO vo forme HTML stránky, tak CSVčko povedzme, je to isté len bez zbytočných informácií ako štýly, obrázky, atď. A to mi príde veľmi zvláštne, že keď to má HTML podobu, tak je to OK, ale keď to má očistenú podobu, tak sa to už nesmie. :thinking: