Pripomienkovanie štúdie dopadov: Open Data - High Value Datasets

Rene_Valent · July 7, 2020, 12:24pm

Impact assessment study - Európska komisia zverejnila prezentáciu k dopadovej štúdii k zverejňovaniu tzv. datasetov s vysokým potenciálom na znovupoužitie - High Value Datasets, nachádza sa tu: https://datalab.community/wp-content/uploads/2020/06/CNECT_PSI-HVD_Open-Data-Committee_v0.1.pptx.

Prosíme o vaše pripomienky a názory ideálne do 20. júla, ČR už zverejnila pripomienky - nájdete ich tu: https://datalab.community/pripomienky-cr/

Lubor · July 12, 2020, 10:27am

Vyzerá to celkom zaujímavo. Aký má k tomu byť ďalší plán, budú vyhlásené HVD a ďalej? (asi sme si to niekde na PS už hovorili, len si nepamätám)

Veľmi prínosné by bolo, keby sme si k tým tabuľkám spravili slovenské verzie - ako sme na to s príslušnými oblasťami / datasetmi u nás.

Pripomienky má zmysel dávať k čomu: jednotlivé položky v tých tabuľkách, alebo aj niečo pridať/vyradiť a pod.?

Často sa tam spomína “INSPIRE data specifications” a pod. @mtuchyna kde to prosím nájdem?

mtuchyna · July 12, 2020, 8:10pm

@Lubor Tiez to planujem pozriet.
SK prehlad INSPIRE Tem.
(Niekedy treba skusit stranku reloadnut, lebo na prvy pokus ma obcas problemy s nacitanim).
Prve dve temy su abstraktne - nedefinuju vecny obsah udajov.
Ku každej je odkaz na EN verziu údajových špecifikácií a u niektorych aj CZ extrakt - ale tie tiez nie vsetky funguju, preto planujeme pripravit aj nieco podobne v SK.
Komplet EN prehlad udajovych specifikacii je k dispozicii aj na oficialnom EC INSPIRE webe.
Okrem 34 INSPIRE tem sa este definuju aj INSPIRE prioritne datasety (geozdroje z oblasti monitoringu životného prostredia).

pstropko · July 14, 2020, 12:44pm

Keď tak pozerám na dataset Company and company ownership , tak sa mi javí, že väčšinu právnych údajov má RPO. Ekonomické údaje navrhované materiáli sú dostupné za poplatok tu https://finstat.sk/ a tu https://www.sims.sk/. Rozhodne bude potrebné údaje vyskladať z rôznych zdrojov , čo sa musí prediskutovať a na konci dohodnúť celý proces. Rezort MHSR nedisponuje zdrojmi údajov o firmách, je ich konzumentom.
Som tiež za to, že je potrebné k jednotlivým položkám v tabuľkách priradiť primárnych poskytovateľov údajov a potom začať diskutovať o tom, ako a kto bude robiť transformáciu do EU štruktúr. K samotnému dokumentu je ťažké bez, toho dať iné pripomienky ako zjednotenie formátu, ako píšu kolegovia z ČR. Podľa pripomienok kolegov z ČR je jasné, že sa nevyhneme transformácii do jednotnej formy aby sa údaje dali jednoducho konzumovať cezhranične.

Rene_Valent · July 15, 2020, 1:13pm

Prikladám aj pripomienky HU - nájdete ich na nasledovných odkazoch: https://datalab.community/wp-content/uploads/2020/07/HU-comments-on-HVD_Open-Data-Directive_COM-impl-act_20200715.docx

https://datalab.community/wp-content/uploads/2020/07/CNECT_PSI-HVD_Open-Data-Committee_v0.1_GKFO.pptx

hanecak · July 21, 2020, 2:52pm

S tymto plne suhlasim, a skusim zosumarizovat par “high level” uloh z NKIVS a OGP, ktore s tymto myslim najviac suvisia:

NKIVS:
- Automatizované zverejňovanie všetkých možných datasetov: Trello
  - tot aby udaje neboli len “zverejnene dnes”, ale aby boli zverejnene a vzdy aktualne
- Prepojenie inštitúcii verejnej správy s katalógom otvorených dát: Trello
  - kedze sa z pohladu “high value datasets” (HVD) bavime o mnozinach udajov tvorenych X ciastkovymi datasetmi, o to viac je dolezita dohladatelnost → nutnost katalogizovat → PO pripojene a pracujuce s data.gov.sk
- Referenčné údaje budú prístupné ako otvorené dáta: Trello
  - toto spominan najma preto, aby sme HVD nebodaj nevnimali ako nejaky novy “diktat Bruselu”, ale staru povinnost prebalenu do noveho satu
OGP:
- Úloha B.5: Aktualizovať a zverejniť na portáli otvorených dát zoznam všetkých datasetov v gescii ministerstiev a nimi zriadených organizácií a ostatných ústredných orgánov štátnej správy s plánom zverejňovania datasetov aj periodizácie …: Trello
  - toto spominan najma preto, ze tato uloha smeruje (ma byt opakovana a trvaca) k tomu, aby PO a aj mi vsetci sme vedeli “kto co ma”, tot aby sme sa pridlho netocili okolo diskusii, ze kto je “len konzument” a kto “gestor” a teda aby sa dalo rychlo pristupit k tomu, ze kto co k HVD ma, tak obratom zverejni
- Úloha B.3: Zrealizovať školenia pre zamestnancov verejnej správy, ktorých zamestnávateľ poveril zverejňovať otvorené dáta za inštitúciu verejnej správy: Trello
  - tot aby sme sa napr. vyhli “zlej praxi”, vid povedzme Příklady špatné praxe v oblasti otevřených dat - Otevřená data

Aby to malo cele hlavu a patu, tak vyskladavanie by malo prebiehat tak, ze ktokolvek je gestor ktorejkolvek ciastkovej sady udajov, ten zverejnuje to co ma tak ako ma. MIRRI (byvale UPPVII) uz potom pri vykazovani napr. RPO “iba” poukaze na vsetky ciastkove vystupy a pripadne metodicky usmerni tak, aby ciastkove vystupy boli zverejnene v podobe umoznujucej lahko robit “kompilat” (reportovany celok). (Projekty NASES-u okolo CSRU sice slubuju mnohe ohladom integracie dat, ale neslubili Open Data, t.j. na tie by som sa az tak nespoliehal. Resp. to mozeme brat ako podnet na prehodnotenie a vylepsenie tych projektov.) Tym by sme mali ako tak podchyteny “celok”.

Nasledne pride opat na radu najma MIRRI (Datova kancelaria), kedze bude treba strazit a riesit kompletnost a kvalitu zverejnenych udajov. Typicky ako napr. v pripade RPO, kde mnoho organizacii chyba, pri inych su chybajuce ci nespravne udaje. To je v zasade vec, ktora uz bezi (vid napr. MIRRI Pracovná skupina K9.4 Lepšie dáta - #244 by hanecak alebo Register adries - #35 by Val ). Toto uz je ta “mravencia praca” po faze “zverejnili sme = splnili sme regulaciu”. Tato mravencia praca ma za ciel, aby to nebola len “fajocka vo vykaze”, ale aby sa zverejnovalo priebezne (= aktualizacie + vylepsenia) a zmysluplne (=data, ktore sa daju realne pouzit).

K okruhom HVD ako tak nemam velmi komentare, kedze sa do nich busilo uz vela a dlho. Skor by som len rad potesil kolegov z uradov, ze napr. niektore okruhy uz mame davno rovno splnene resp. sme k splneniu uz velmi blizko. Prikladom nech je RPO ci RegisterUZ, kde uz davno nie sme na urovni inych krajin (lebo tie este len debatia ci to vobec otvorit, kym my to uz mame davno otvorene), ale riesime len technicke detaily (t.j. napr. ako presne “pretecu” udaje zo Statistickeho uradu k verejnosti) s tym, ze realny pozitivny “imact” mame uz dnes napr. v podobe FinStat-u, UvoStat-u a pod. Co je myslim velmi pozitivne (az mi je to divnô ).

Val · July 21, 2020, 3:14pm

Dnes prešiel mesiac odkedy NASES prestal zverejňovať register adries aktualizovaný “denne”.

mtuchyna · July 22, 2020, 9:37am

Pár bodov, ktoré dovolil časopriestor:

Comments:

We do strongly support efforts to reuse existing harmonisation initiatives (e.g. INSPIRE, ISA2)
Would be great to get better understanding about main foreseen outcomes, related to the HVD (e.g. legal act/s, recommendations, models/ontologies, networking platforms allowing sharing challenges as well as successful stories, funding opportunities, etc.)
Where possible, HVD linkage to wider picture (as visuals/infographics) of Digital Europe and overall e-government/digital transformation movement would be more than welcome.
SK welcomes closer communication of EC institutions towards more consistent data and ICT management across the thematic areas (e.g. DG ENV, GROW, CONNECT, EUROSTAT, AGRI, JRC, EEA, etc.). Similar communications shall be stimulated also on Member states (MS) level with possibility to easily see the progress in other MS and establish the contacts and networks to faster share and implement examples of good practice to strengthen data re-use also across the borders.

Proposals:

In order to increase the further re-use of HVD, most relevant use-cases shall be identified across all thematic areas. This might help to better demonstrate the benefits and monitor the future use of HVD in MS and across the Europe.
Clear governance frameworks shall be defined both on EC as well as MS level, considering existing governance frameworks (e.g. for INSPIRE, PSI, etc.)
Minimum level of interoperability shall be defined in order to ensure feasible re-use of the HVD across the borders from semantic and technical perspective
Define the monitoring framework, providing an overview about the progress with provision and use of HVD (preferably built upon automatic measurable KPIs, eg. like INSPIRE monitoring built on top of machine processed and validated KPIs generated from metadata and APIs - in near future)
Ensure the possibility for location data linking with Company, Meteorological, EO&ENV, Statistics and Mobility thematic areas
Balance the level of data structure details (amount of attributes) across the thematic areas (reusing existing Pan European models, ontologies and vocabularies)
Support semantic mapping between relevant Pan Europen models (e.g. support the creation of the ontologies for the remaining INSPIRE Annex themes, inline with ISA2 Core Vocabularies)
Distinguish data provision encoding formats for machine processing (APIs for developers) and encoding formats for human processing (e.g. csv, rtf, geopackage…)
Select and support limited amount of encoding formats, fulfilling expectations of the users and utilising the potential of the latest technologies
Narrow down and clarification of the requirements for the documenting the Open data for providers and users
Consider the set of common data quality requirements to be met, ensuring the comparability and usability of the HVD across the borders (national as well as thematic)
Consider the potential of linkages with the voluntary / community driven HVD (e.g. Open street map)

Rene_Valent · September 10, 2020, 11:29am

Prikladám prezentáciu z meetingu EK (DG CNECT) k Štúdii High Value Datasetov zo dňa 4.9.2020

Final event_Study on the high-value datasets_04092020.pdf (4.6 MB)

Rene_Valent · September 10, 2020, 11:52am

Prikladam aj pripomienky Estonska https://datalab.community/wp-content/uploads/2020/09/Estonian-positions-towards-Open-data-availability-of-public-datasets_2020-08-19_FINAL.pdf

mtuchyna · September 11, 2020, 8:08am

@ Rene_Valent
Vďaka za nové info.
Je možné dostať sa aj k sumáru pripomienok za SR, prípadne aj ďalších štátov EÚ (okrem tých z CZ a EE) a ich vyhodnotenie zo strany Európskej komisie? Je aj nejaké info o ďalšom postupe EK v oblasti HVD?
Dosť by to pomohlo k zorientovaniu sa v tom, kde sa proces definície HVD nachádza, plus čo bude a kedy rámcovo nasledovať.
Ďakujem, mt

Rene_Valent · October 5, 2020, 8:51am

@mtuchyna zasielam odkaz na spoločné stanovisko Rakúsko a Estónsko https://datalab.community/wp-content/uploads/2020/10/Joint-Non-Paper-Towards-Open-Data-.docx