Otvorené údaje (filozofia, legislatíva, transparentnosť)

Cize ak to spravne chapem, s tymy dvoma bodmi si OK, tj. :

  • povinne metadata na centralnom portaly (co je oprava dvoch bodov f a h v povodnej vyhlaske lebo nie su OK)
  • predpisanie publikovania specifickych datasetov (pub. minimum: struktura, periodicita, sposob spristupnenia)

len toto ma ist do vyhlasky 78/2020 o standardoch pre ITVS a nie do zakona o udajoch? ze?

Čo je nevynutné do zákona a čo nie nech primárne povedia právnici. Ale mne sa teda zdá, že napr. “metadáta na portál”, to je klasická vec na štandardy.
Predpísanie publikovania konkrétnych datasetov - určite v zákone bude MIRRI potrebovať splnomocnenie, že to vôbec môže robiť.
V zásade zákon hovorí o povinnosti, detaily ako presne sa má vykonať tam už byť nemusia. Čiže napr. keď už niečo sú otvorené údaje, aké všetky vecičky okolo toho treba spraviť to doteraz v zákone nebolo a nestretol som sa s tým že by to bola prekážka.

Áno, rozumiem, toto má právnici nabrífovali, a taký je zámer. V zákone sú len príkazy, zákazy atď, a vo vyhláške sú už podrobnosti.

Toto možno zaváňa štandardmi, metadáta, ale ide nám iba o jasné prikázanie. Možno lepšie by bolo to naformulovať (opať hovorovo):

1) OVM je povinné katalogizovať všetky otvorené údaje v centrálnom portály otvorených údajov.

Dnes to tak nie je, je to iba súčasť vyhlášky, a práve tie dva body, ktoré o tom hovoria, sú napísané hmlisto a skôr zavádzajúco. Takto by sme to mali vyriešené hneď, jasne a explicitne.

Áno, presne tak. Na tomto pracujeme s dátovími kurátormi, a oni práveže chcú vidieť v zákone túto povinnosť, aby mohli aj argumentovať, prečo to musia robiť. Opäť, do zákona chceme dať len povinnosť (príkaz),

2) aby OVM povinne sprístupňovali definovanú množinu datasetov predpísanou formou (detaily vo vyhláške)

Obidva body majú pre nás praktický prínos, pretože toto riešime denno-denne. Čiže ja teda vidím v tomto prínos a takto to posuniem našim právnikom.

Super, dakujem! Na mail?

Tym padom ma viac zaujima transpozicia EU smernice.

Plus teda to, aby neboli zrusene, stratene ci zmakcene dnes platne veci, napr.:

+1

A jeden drobny nesuhlas:

Tu sa argumentuje v prospech CC0 tym, ze ak mam apku, v ktorej je 1000 datasetov a tie by boli pod CC-BY, tak ta “BY” by znamenala, ze sa “moja atribucia” (ako posdkytovatela dat) ocitne medzi 1000 dalsimi, zrejme v abecednom poradi. Z pohladu marktingu bezcenne, len teda autor apky by taku stranku robit musel, aj ked je bezcenna.

Zheruba v tejto linii (CC0 by default, v odovodnenych pripadoch CC-BY) teda ide IIRC usmernenie k INSPIRE od MZP SR.

Trvat na tom nebudem, ak by to mala byt povedzme vyhovorka pre UGKK, ze ak nie CC-BY, tak nedaju nic. :slight_smile:

V CR (podla info z ostatnej ich Open Data konferencie minuly tyzden) zbehlo par sudnych sporov, tusim az po Najvyssi ci dokoca Ustravny a vysledkom je, ze niektore veci “vyriesili” tym, ze presne vyumenuvaju, co ako Open Data zverejne byt ma. A teda co v zozname nie je, to sa zverejnovat nebude. To je trochu smutne. Ostava teda dufat, ze challenge na sudoch bude pokracovat aj dalej, aby sa zohladnila ci uz smernica alebo ustavne prava na informacie. Lebo aj mne sa vyrazne viac pozdava rezim “vsetko verejne, okrem uzko ohranicenych a explicitne zdovodnenych vynimiek”. Lebo vieme, ze v SR sa za kazdu nejasnu alebo co i len trosku spornu vec hned radi schovaju aj potmehudi a nasledne sa verejnuje len velmi malo. Vid napr. uroven, akou UKGG lpie na ochrane udajov o shapoch (t…j. tvar a poloha, nie zoznam majitelov) parciel C a E na zaklade GDPR (ako bolo par kat prezentvane ich zastupcami na roznych PS).

v kombinacii s:

Tu dam +1 . Opakovane sme narazili pri Open Data aj na GDPR resp. ochranu sukromia. T.j. napr. udaje z OR ci Katastra. Vsetkym (nam nepravnikom) je jasne, ze su to verejne udaje, ale opakovane je problem, ak trvame na Open Data (=download, machine readable) napriek tomu, ze “uz davno je to na webe”. TL;DR k debate je, ze ak teda zakon hovori “treba zverejnit”, ma to byt spravene tak, aby tym zaroven podchytil aj rezim Open Data a tiez aj definoval aj “ucel” pre potreby GDPR. To je vec na poslancov a zakon(-y). Povedat “zverejnit” ale vynechat “ucel” ci “zdovodnenie” je z pohladu zverejovanych osobnych udajov “odflaknuta robota”, lebo mat na webe napr. Kastater ci OR, ktoreho sa legalne kvoli GDPR nemoze nik poriadne chytit, to nie je zverejnovanie ani transparentnost.

Len teda to naozaj musi byt v zakone(-och), ma to byt slusnou pravnicinou a teda musia to napisat dobri pravnici.

1 Like

Dobry den, zatial mi nic neprislo.

Dobrý deň, ďakujeme za ponuku spolupráce. Ospravedlňujeme sa za pomalú reakciu, myslím že by sme sa na to mohli spoločne pozrieť. Plánujeme prijať akčný plán pre

a mám pocit že sa tie témy prelínajú. Ozvem sa Vám cez mail, pripojím aj kolegov, a môžeme si naplánovať s Vami meeting a dohodneme sa čo ďalej.

Tak či onak, musíme vylepšiť proces spracovania ponúk. Okrem Vás som osobne dostal ponuku od p. Andrei Sulovej, ktorá pracuje v Dánsku vo firme https://www.dhi-gras.com/, ktorá robí pre štát geopriestorové dáta, pričom tiež som to len preposlal ale vec sa nikam nepohla. Ja sa priznám že nemám momentáne kapacitu sa tomu venovať, čo ale môže byť škoda, lebo riešenie môže byť zaujímavé (najmä keď sa používa v nejakej krajine EÚ). Možno by sme mohli v budúcich pracovných skupinách opendata dať aj priestor takýmto ponukám.

Ahojte,

práve prebieha 3. pracovná skupina pre prípravu EÚ legislatívy k tzv. HIgh Value Datasetom (datasety s vysokou hodnotou). Prikladám aktuálne znenia návrhu. HVD budú musieť byť prístupné cez API, a súčasne, ak je to vhodné, musia byť stiahnuteľné ako dávka.

Jedná sa o 5 kategórií datasetov:

  1. Geospatial
  2. Earth observation and environment
  3. Meteorological
  4. Statistics
  5. Companies and company ownership

220513_Main Act after ISC_finalLW.docx (84.2 KB)
220513_Annex after ISC_final.docx (158.7 KB)

2 Likes

1)

Neviem či viete, ale od 1.8. 2022 muisa povinné osoby katalogizovať metadáta na data.gov.sk už aj podľa novely zákona o slobodnom prístupe k informáciam a to konkrétne § 21d, odsek 3:

Ak povinná osoba sprístupní informácie na účel ich opakovaného použitia, bezodkladne zverejní v štruktúrovanej podobe údaje o webových sídlach a iných miestach, kde sa zverejňujú skutočnosti týkajúce sa opakovaného použitia informácií najmä podľa § 21e ods. 6, § 21f ods. 7 a 8 a § 21k ods. 6, na portáli určenom Ministerstvom investícií, regionálneho rozvoja a informatizácie Slovenskej republiky (ďalej len „ministerstvo investícií“) pre sprístupňovanie otvorených údajov.

Sme veľmi radi, že sa nám to spolu s Ministerstvom spravodlivosti podarilo presadiť a takto definovať. Veľmi nám pomohlo aj to, že je rovnako definované v českom infozákone.

Aby som vysvetlil dôvod: V súčasnosti je možné nájsť množstvo otvorených údajov zverejnených na rôznych miestach (centrálny portál, lokálny portál, webové sídlo, zdielané úložisko poskytovateľa…). Keď chcete niektorý dataset nájsť, musíte o ňom dopredu vedieť, kde ho hľadať a to je samozrejme veľmi neefekívne. Riešením je používanie centrálneho portálu, nie však na ukladanie súborov otvorených údajov, ale najmä na ich katalogizáciu.

2)

V súčasnosti sa pripravuje zákon o údajoch, kde sa v paragrafe 38 riešia niektoré aspekty otvorených údajov. Nedochádza k predefinovaniu otvorených údajov, referecuje sa vyhláška 78/2020. Súčasne však vzniká zacielená Vyhláška pre sprístupňovanie otvorených údajov verejnej správy. 78čka je skôr vylistovanie opendata štandardov. Pracovnú verziu návrhu môžete nájsť na tejto adrese:

3)

Kam by mali z pohľadu egovernmentu otvorené údaje smerovať, resp. čo je treba rozdiskutovať je podľa mňa zriadenie Verejného dátového fondu (podobne ako v ČR - Verejný dátový fond).
Takmer každý ISVS potrebuje otvorené údaje, najčastejšie adresy, údaje o právnických osobách, lokáciu a podobne. Táto množina otvorených údajov je sprístupňovaná v zabezpečenom úložisku, aby bolo použitie týchto údajov právne záväzné. Toto úložisko sa nazýva Verejný dátový fond (VDF).

A tento VDF sú povinné používať všetky projekty, ktoré potrebujú dáta z rozsahu VDF. Dáta sú tam ukladané ako dávkové súbory platiace k danému času. Medzi datasety ktoré patria do VDF môžeme zaradiť: základné číselníky, referenčné otvorené údaje (register adries, register organizácií). Poskytovatelia ukladajú túto množinu ako súborové exporty do VDF.

Ak si chcú nejaké OVMka vymieňať údaje, ktoré svojou povahou sú otvorené, tak je to nutné riešiť cez Verejný dátový fond!

V tomto prípade sú opendata (a transparentnosť) jadrom v dátach verejnej správy.

2 Likes

Este vyrazne pokuty zosobnene konkretnym riaditelom uradov a ministrom, ktore na to kaslu. Opakovane, kazdy mesiac, az do zverejnenia. Potom tam tie udaje budu k dispozicii. Zakon je zakon, ale tie na Slovensku pravidelne porusuju samotne ministerstva, urady a uradnici. Akurat bez zodpovednosti a dosledkov.

2 Likes

Ahojte,

Dovoľte mi informovať Vás, že dnes je termín hlasovania Za (alebo) Proti návrhu Vykonávacieho aktu publikácie Datasetov s vysokou pridanou hodnotou (HVD).

Návrh znenia a prílohu môžete nájsť na našom metodickom portáli opendata.gov.sk.

7. HVD - Datasety s vysokou hodnotou - Metodika pre otvorené údaje (opendata.gov.sk) - Confluence

Istú množinu údajov, ktorá spadá do HVD musí OVM sprístupniť ako openadata do dvoch rokov. Nejde o to, aby sa začali vyvíjať ISVS, ktoré budú tieto dáta zbierať. Ide o tie dáta, ktoré už sú v ISVS.

OVM bude musieť (s dodávateľom) implementovať API na ich prístup (ak už teraz nemá), prípadne sprístupniť celý súbor na stiahnutie. Potom každé dva roky bude musieť štát vytvoriť report o týchto datasetoch v strojovo-spracovateľnom formáte. Toto zabezpečí nový portál OD, ktorý rozlišuje atribút HVD a vie vytvoriť špecifický report na požiadanie (SPARQL Endpoint). Čiže HVD datasety stačí katalogizovať na nový portál a report sa bude dať zostaviť veľmi jednoducho.

Cez víkend som dostal dve pripomienky, jedna je k spresneniu terminológie pre meteorologické dáta, druhá je požiadavka na rozšírenie implementačného obdobia na 3 roky.

Hlasovať plánujem za prijatie materiálu aj s uvedenými dvoma pripomienkami.

Téma HVD bude zaradená do najbližšej pracovnej skupiny OpenData (nie ešte zajtra do tej Československej)

2 Likes

Krátka informácia k výsledku: 25 krajín hlasovalo za (aj slovensko), 0 proti, 2 krajiny sa zdržali (neviem ktoré). Takže regulácia bude prijatá. O podrobnostiach budeme informovať.

3 Likes

Ahojte,

chcel by som informovať o diskusii, ktorú teraz riešime na MIRRI spolu s OVMkami, ako aj dodávateľom CSRÚ. Je pomerne podstatná, rád by som ju zverejnil a získal prípadne pripomienky.
Kedže viacero OVMiek potrebuje publikovať otvorené údaje (kvoli rôznym projektom/dopytovým výzvam), množstvo z nich buduje (alebo plánuje budovať) OpenDataAPI, tak sa začína jasne profilovať zo samotných OVMiek preferencia buď:

  • jednoduchej katalogizácie zoznamu OpenDataAPI (ktorý sa v čase nemení rýchlo), ako napr. skatalogizované služby ITMS ,
  • alebo harvestácie lokálneho katalógu OVM (podľa DCAT-AP-SK 2.0) v prípade väčšieho počtu datasetov, ktoré vznikajú priebežne a sú rôznej povahy,

pričom samotné opendata sa nebudú ani do Centrálneho portálu nahrávať, a teda pre tento účel nebude potrebné použiť na to CSRÚ. Čo je rovnaký princíp ako v Česku, alebo Anglicku (decentralizované opendata). Jednak sa tým zjednoduchší portál, zeefektívni dátovy prenos (nebudú sa zbytočne prenášať dáta - na portál a potom ku jeho konzumentovi), dáta budú uložené na strane OVMka, ktoré je za neho zodpovedné. Samozrejme, do NKODu sa bude dať pridať katalogizačný záznam aj ručne cez GUI, ale linka už musí smerovať niekde na priestor (webstránku) OVM.

Ja som tento prístup preferoval už od začiatku, a keďže sa naskytla táto príležitosť - jednak kvoli názoru OVM, jednak kvoli potrebe portálu, podporujem tento prístup úplne. Zatiaľ je všetko v rovine diskusií, ale smeruje tadiaľto.

Tu je to možné vidieť na diagrame (ktorý sa dá urobiť ešte presnejšie, ale už by bol menej prehľadný) .

  • Ak má OVM taký ISVS, ktorá má služby OpenData, tak tie stačí ručne skatalogizovať na data.gov.sk, čím sa dajú nájsť hocikým. API ktoré poskytuje privátne API ani nie je skatalogizované, ani nie je verejnosti prístupné. (viď OpenData Publisher 1)

  • Ak má OVM taký ISVS, ktorý produktuje množstvo datasetov, ktoré sú rôzne, a vznikajú neustále v čase, vtedy je lepšie začať ukladať tieto súbory do vlastného úložiska u seba, a vytvoriť ich katalóg (tzv. lokálny katalóg LKOD), ktorý si poskytovateľ nahrá do svojej RDFDatabázy (napr. free), ktorá štandardne poskytuje SPARQL Endpoint. Tento Endpoint sa registruje na data.gov.sk, ktorý si sám automatizovane bude tento katalóg sťahovať k sebe. Tým opäť každý dokáže nájsť v katalógu opendata tohto poskytovateľa.(viď OpenData Publisher 2)

  • Ostatné ISVS môžu pristupovať a konzumovať priamo ľubovoľné OpenDataAPIčka alebo zverejnené opendata súbory u poskytovateľa, alebo Privátne dátové APIčka ak sú oprávnené zo zákona* (či už CSRÚ, alebo iné ISVS).

*Tu vidím v budúcnosti priestor na RPP (Register práv a povinností), ale toto zatiaľ neriešim.

1 Like

Ok, vďaka za info.
K čomu by si teda rád získal pripomienky?

Že pri API sa nebude vytvárať statická kópia údajov? - Áno, samozrejme. Takéto niečo nech sa robí iba ak sa to ukáže ako dôležité pre nejaké konkrétne použitie. Povedzme pri registri adries je online API nad aktuálnou databázou dokonalé, ale mať (denne aktuálny) obyčajný json so všetkými adresami, môže byť pre mnohých prospešné.

Čo mať v katalógu? Nuž, je jasné, že ak je údajov príliš veľa, tak je to neprehľadné. Cesta ďalej sú tematické prezentácie údajov - niežeby to bola novinka, stačí pozrieť do sveta okolo.

1 Like

Určite nad registrom adries by mala byť možnosť stiahnuť si celú databázu a nad tým si robiť vlastné vyhľadávanie/výpočty tak ako to majú tu https://proxy.freemap.sk/minvskaddress/adresy.zip

1 Like

Jasné. Cez API dokážeš stiahnuť aj celý register adries. (Ale áno, práve pomocou API sa dá efektívne brániť plošnému prístupu k údajom.)

1 Like

Bránia aj teraz, ale je to neschopnosťou prejsť na nový https://ckan.org/ namiesto toho z roku 2015.
Register Adries - Register vchodov
Naposledy bola tabuľka vchody publikovaná bez poškodenia 28.3.2023.

Tu som mal na mysli to, že pôvodné plány boli, že sa budú všetky datasety z OVMiek prenášať cez CSRÚ do data.gov.sk, čo z pohľadu efektívnosti je veľmi otázne. Sme radi že samotné OVM preferovali skrátka vystrčenie OpenDataAPI, ktoré sa skatalogizuje a hotovo.

Ja som dokonca chvíľu bol presvedčený, že budú opendata už iba decentralizované, a že nepovolíme už zapisovať súbory do centrálneho úložiska. Nakoniec ma kolega z architektúry správne prehovoril, že by to bol prílišný skok, a nie sme zatiaľ naň pripravený. Aj my MIRRI by sme si museli tvoriť lokálny katalóg, napr. umiestňovať súbory fyzicky napr. na našu webovú stránku a do NKODu by šli opäť iba metadáta. Týkalo by sa to nielen nás ale mnohých poskytovateľov, a to by bolo asi naraz už přespříliž.

Samozrejme, nechcem tým úlne zavrhnúť prenos dát cez CSRÚ, a to aj OpenData do budúcnosti, ale význam by som videl ak by sme išli cestou českého verejného dátového fondu, kde sa datasety akoby 2x publikujú. Raz voľne ako opendata, raz do bezpečného verejnosti neprístupného dátového fondu, ktorý je povinný na naintergrovanie od ostatných ISVS. Riešiť túto problematiku sme cez súčasný projekt OpenData je out of scope. Navyše, týka sa to aj zatiaľ neexistujúceho Registtara práv a povinností, čiže téma je to oveľa širšia.

Samozrejme. Dokonca aj smernica HVD o tom hovorí, že údaje najú byť dostupné cez API a aj cez súbor na stiahnutie, čo je presne prípad Registra adries. Podľa mojich informácií to tak bude aj samozrejme realizované, implementácia API by mala byť pred testovaním. Samotné súbory by mali byť uložené na dostupnom úložisku Registra adries, čiže sa nebudú kopírovať na centrálny portál. Tomuto projektu verím že dopadne veľmi dobre a bude ukážkou ako sa to má robiť.

Používanie CKANu je chýbajúcej podpore DCAT v je súčasnosti neodporúčané, podobne ako v ČR. A rovnako ako tam chceme ísť cestou, aby sa centrálny portál znovapoužil na budovanie lokálnych. CKAN má aj rozšírenia na DCAT, avšak zatiaľ v tomto sme ako v ČR v neodporúčacom móde.

1 Like