MIRRI Pracovná skupina K9.4 Lepšie dáta

15.3.2023 sa konalo on-lince zasadnutie PS Lepsie data. (X stretnuti pomedzi som vynechal a zial neviem, ci a kde sa daju najst zapisy.)

agenda

  • Aktuálny stav OD2.0​
  • Úvod ku HVD
  • HVD vs INSPIRE
  • Plánované školenia​
  • Metodika dopadu otvorených údajov na vybrané oblasti​

poznamky

Aktuálny stav OD2.0​

stary portal este bezi

stary SPARQL endpoint uz bol nahradeny novym: data.gov.sk/sparql

Miro Liska (@liska ) ukazoval aj par jednoduchych dopytov

nasadenim novych casti doslo aj k uprave metadata (t.j. zaznamov o datasetoch) podla novych metodik, co viedlo o.i. k zmene poctu datasetov: z cca 3000 na cca 5000

stav:

  • prace MFF UK na NKOD uz skoncili
  • 9.3.2023 bol k veci Riadiaci vybor, rozhodnutie da odbor obstraravania da coskoro rozhodnutie
    • tyka sa pokracovania k casti “webovy portal pre NKOD”

Gov GIT

sucastou je aj Gov GIT (a.k.a. repozitar zdrojovych kodov, a.k.a. code.gov.sk)

  • 9.3.2023 Riadiaci vybor schvalil
  • ideme po vzore UK
  • pouzite bude nieco na sposob GitLab alebo GitHub
  • vznika aj “metodika bezpecnostnych testov zdrojovych kodov pre ich zverejnenie”
  • existujuce GitHub repozitare (slovak-egov · GitHub, …) neskor prejdu pod novy Gov GIT
  • MIRRI uz disponuje zdroj. kodmi MetaIS, otestuju na nom vyssie spomenutu metodiku a zverejnia

PoC validacny a transformacny modul

adresne transformacie vybranych datasetov

  • nie vsetky resp. hocijake datasety, prioritizacia podla publikacneho minima
  • pouzite riesenie: LinkedPipes

scenare spristupnovania otvorenych udajov:

vid Scenáre sprístupňovania otvorených údajov - Metodika pre otvorené údaje (opendata.gov.sk) - Confluence

  • preferovane: cez SPARQL endpoint
  • preferovane: cez DCAT-AP API
  • preferovane: iba metadata cez API data.gov.sk
  • nepreferovane: CKAN API
  • nepreferovane: metadata + data cez API data.gov.sk

kto chce publikovat a nevie ako, nech sa ozve MIRRI, radi skonzultuju

dalsie

https://interoperabilita.gov.sk/

udaje z Central Economical System (CES) su tesne pred zverejnenim

vylepsenie zverejnovanie Register Adries (RA) je tiez tesne pred spustenim

oba budu do buducna sluzit ako vzorove priklady, ako zverejnovat

otazka od @Lubor : EU riesenie pre “1-krat a dost”?

  • odpoved od @liska : nieco bezi, odprezentuju na dalsom stretnuti PS

otazka od @Lubor : na ostatnej PS si MIRRI dalo ulohu ohladom “mapovania”, termin bol “cca teraz” - co je s tym?

  • ano, mapovanie este bezi, termin sa posuva

otazka od @Lubor : ak nova skupina, tak radsej ako podskupina Lepsie Udaje, o.i. lebo “takmer ti isti ludia”

  • ano, bude podskupina

otazka od @Lubor : reporting do “2024/02” → urcite by nemalo byt od dnes do vtedy “ticho”, aby sa s reportingom necakalo na “poslednu chvilu”

  • ??? (nejak som si nic nepoznacil, asi som nerozumel)

Úvod ku HVD

HVD = “High Value Datasets”

prvy report bude k februaru 2025

  • teraz, v SR, prebieha mapovanie
    • nasledovat ma zverejnenie
    • a potom report
  • paralelne bezia aj EU aktivity, napr. konzultacie ohladom HVD + INSPIRE, atd.

zaklady:

  • vykonavacie nariadenie Komisie c. 2023/138
  • subory udajov s vysokou hodnotou su:
    • dostupne bezplatne (ale existuju vynimky)
    • strojovo citatelne
    • prostrednictvom API alebo (v urcenych pripadoch) hromadne stiahnutie
    • CC0 alebo CC-BY

problemy:

  • chybaju specificke usmernenia od EU
    • typicky zladenie INSPIRE (uz da sa povedat stara zabehnuta tema) a HVD (nova tema)

zriadenie prac. skupiny k HVD

  • MZP, UGKK, SU, SHMU, MV SR, MD SR
  • prebiehaju nominacie zastupcov

HVD vs INSPIRE

(prezentoval Martin Tuchyna @mtuchyna )

INSPIRE sa datuje do 2007, HVD do 2019

  • Regulation HVD - 2023

dotknute subjekty:

  • INSPIRE aj HVD definuju “povinne osoby”
  • podrobnejsi vycet medzi INSPIRE a HVD: su drobne rozdiely

pouzivatelia resp. “cielovka”:

  • beznymi pouzivatelmi su obcania a firmy
  • niektore subjekty (PO/OVM/…) aj poskytuju (nieco) aj pouzivaju (nieco ine)

stale sa vyladuje “governance” v EU aj v SR

  • medzi najnovsie PS patri “INSPIRE/HVD alignment action”
    • podobna by mala vzniknut aj v SR
  • temy na diskusiu:
    • integracia data a geo portalov
      • tok metadat: data portaly vs. geo portaly, …
      • tech. standardy metadata a ich zladenie a mapovanie
      • harvesting (portaly u PO → narodne portaly → EU portaly)
    • zamedzenie duplicitam:
      • aby sa datasety neobjavovali dvojmo: raz ako Open Data/HVD, raz ako INSPIRE
      • aby sa neinvestovalo do duplicitnych tech. rieseni na zverejnovanie
    • kvalita udajov
    • historicke udaje

GreenData4All

priklady dobrej praxe

z pohladu dat je vcelku velky prienik medzi HVD a INSPIRE

  • s INSPIRE suvisi velmi vela: temy geo udajov
  • s INSPIRE suvisi: takmer vsetky HVD temy
  • s INSPIRE suvisi velmi malo: spolocnosti a ich vlastnictvo

technicke poziadavky:

  • INSPIRE ma formaty definovane vcelku podrobne
  • OpenData/HVD naopak formaty (aspon zatial) definuje dost volne
  • mnohe INSPIRE formaty zrejme vyhovuju OpenData/HVD, ale niekedy nie je jasne
  • terminologia: “INSPIRE: sluzby” cca = “HVD: API”

licencie:

  • INSPIRE aj OpenData/HVD sa zhoduju na CC0 a CC-BY

vynutitelnost spristupnenia

pravna podpora

monitoring/reporting

  • v INSPIRE uz takmer plne automatizovane
  • pre HVD skor len “manualy reporting”
    • aj tak by vsak asi bolo lepsie aspon ciastocne automatizovat

Plánované školenia​

tu uz som nebol pritomny, zasadnutie sa niatiahlo nad moje casove schopnosti

Metodika dopadu otvorených údajov na vybrané oblasti​

tu uz som nebol …

4 Likes