MIRRI Pracovná skupina K9.4 Lepšie dáta

Takze zajtra (9.2.2021) bude stretnutie podskupiny Open Data. Program:

  1. Otvorené údaje a NKIVS (návrhy za DK)
  2. Projekt OD2.0 (DCAT-AP-SK)
  3. Publikačné minimum štátnej správy (problémy s centrálnymi ISVS, ktoré nepublikujú otvorené údaje - nedajú sa stiahnuť - crz.sk, …)
  4. Dátová inventarizácia
  5. Najžiadanejsie datasety
  6. Publikačné minimum samosprávy

Par mojich poznamok:

  • bolo nahravane, t.j. neskor bude zapis aj nahravka
  • prezentovalo najma MIRRI, bola aj mensia diskusia ku kazdemu s bodov

Stav open data v SR

velka mnozina dat je, ale tazko hlada: su zavesenie “niekde hlboko” na roznych weboch, chyba linka z data.gov.sk na data a pod.

mnoho dat je, ale tazko sa stahuju: neexistuje machine-readable forma → treba robit harvestery

mnoho dat je, ale tazko sa s nimi pracuje: komplikovana struktura, zle formaty datumov ci cisel, atd.

mnoho dat je, ale tazko sa zistuju aktualizacie: malokey su k dispozicii rozhrania, ktore vedia vratit uaje zodpovedajuce dopytu napr. “daj mi vsetko nove ci pozmenene za ostatny tyzden”

o.i. aj kvoli dezinformaciam je dnes naozaj kriticke spristupnovat udaje tak, aby sa dali najst lahko, pochopit lahko, pouzit lahko

“hviezdicky” (5* = cca RDF) v tomto kontexte su nadalej “riesene”, ale nie ako priorita, t.j.

  • v prvom rade ide o to, aby udaje vobec boli zverejnene (takmer akokolvek),
  • kvalita (a aj “hviezdicky”) sa bude doladovat dodatocne
  • 3* ( = cca CSV) su minimum

zlepsenie Open Data v SR sa o.i. bude odvijat od Open Data Maturity Index, kedze su tam dobre metriky a “tah” na realny uzitok

  • ak spravime dobre, mali by sme v rebricku poskocit resp. aspon ziskat lepsie skore
  • ale teda nmajma by mali vdaka tomu byt badatene vysledky

Slovensko.Digital (S.D): ciele pre Open Data su v zasade vcelku jasne, lebo zakon(-y) definguju, co zverejnene byt ma a co nie, tj. “len” treba plnit

  • pri tomto je dolezite robit (datovy) audit, aby z neho bolo zjavne, ako plnime

MV SR oprava: MS SR (spravodlivost): ma na data.gov.sk datasety, ale zatial neeviduju, ze by ich niekto pouzil resp. mal pripomienky → maju pocit, ze investovat do toho je plytvanie, ak teda nie je zaujem ci vyuzitie

MK SR: je to “oxymoron”, ak sa v pripade Open Data bavime o dokumentoch v proprietarnych formatoch → ak udaje nemaju specialny rezim (utajovane a pod.) tak ich treba rovno od zaciatku vytvarat v otvorenych formatoch, aby neskor mohli byt udaje lahko/lahsie vytiahnute a publikovane (ked vznikne na verejnosti dopyt a pod.)

  • tym sa naraza aj na pracovne pomocky na samotnom MIRRI, ktorymi sa o.i. riadia Open Data konkretne, alebo OPII/eGov celkovo: MIRRI bezne vytvara subory v proprietarnych formatoch → nasledne sa z dokumentov tazko vytazuju informacie a pod.

Projekt Open Data 2.0

SU (studia uskutocnitelnosti) je hotova uz davnejsie, dnes sa upresnuju detaily viazane na zaciatok realizacie

cielom nie je mat najslepsie riesnie na svete, ale dosiahnut realny posun vo veciach, ktore nas teraz brzdia (vid vyssie ciel vylepsit nase skore v “maturity index” a pod.)

CZ data portal za ostatne roky velmi pokrocil v klucovych funkcionalitach:

  • dopytovanie metadat
  • harvestovanie lokalnych portalov

konkretnejsie poziadavky budu skompletovane a zavesene niekam do cca tyzdna, budeme pripomienkovat

MZP, …:

  • volakedy sme robili prieskumy najziadanejsich datasetov a nedopadlo to velmi dobre
  • dnes zase mame od EU “high value datasets” a teda ak nechceme zpakovat tie “nie velmi dobre” vysledky, tak treba lepsie uchopit napr. datovy audit, aby bolo lahsie mapovat “prioritne okruhy” na konkretne datasety, z konktretnych ISVS od konkretnych OVM/PO
  • obdobne “publikacne minimum”

S.D: v Maturity index mame “portal features” nad EU priemer, naopak “impact” mame hlboko pod EU priemer

  • t.j. otazka: kolko casu/zdrojov bude MIRRI venovat OD portalu a kolko publikovaniu impaktovych/dolezitych datasetov?
  • navrh: mat financovanie 20:80, t.j. 20% = data.gov.sk a 80% = OVM/PO na datasety a API
  • vid potom to, ako vznika a vylepsuje sa opendata.bratislava.sk
  • implementovat univerzalne ETL zrejme nema zmysel (tot centralne ETL komponenty a pod.), vyplyva z dlhorocnych skusenosti nsprt. v S.D
    • je lahsie a lacnejsie robit “specialne ETL” pre ten ktory datovy zdroj

zrejme MV SR?: zaujimava myslienka lokalneho katalogu

  • OVM si jednoduchcie zmenezuje data vo vlastnom lokalnom katalogu
  • data.gov.sk zharvestuje lokalny katalog

Publikacne minimum statnej spravy

vid MetaIS

nateraz su tam konkretne priklady v XLS

  • presna schema, t.j. zoznam sltpcov, nazvy, formaty stlpcov
  • neskor vyrobia SW (bude Open Source, bude zvrejneny), ktory bude vyrabat ine formaty (CSV, RDF, …)
  • prva vlna = cierne polozky; druha vlna = sede polozky

teraz je priestor na pripomienky

  • o.i. aj jednotlive OVM/PO mozu “konfrontovat”, ci to, co maju, sa “zmesti” do navrhovanych struktur

ma to byt pomocka, vdaka ktorej:

  1. kto nieco publikuje, rovno ma navod ako
  2. kto nieco spracuva, aby vedel lahsie pochopit a pospajat ata

ak niekto povedzme info o zmluvach realizuje cez CRZ, tak sulad s minimom bude realne implementovat CRZ

Publikacne minimum samospravy

prezentovala Alvaria

NKIVS 2016 mala velke ciele do cca 2020, neplnia sa

  • o.i. preto, ze samosprava o Open Data stale takmer nevie
  • a ked vie, tak chyba prehlad: co, preco, ako, …

toto minimum ma napomoct, aby sa tie ciele plnili lahsie tym, ze okument poskytne informaciu otom, co a ako + voditka na sirsi kontext (legislativa, atd.)

dokument vznikal uz aj s pomocou obci a miest, specificky napr. kontrolorov

aby bolo jasne “co a ako”, dokument zacina uz aj mapovanim, ake vsetky povinnosti samosprava ma v kontexte eGov a Open Data

  • vsetko su to exitujuce povinnosti, nie nove, t.j. publ. minimum neprinasa nove povinnosti, len pomaha lepsie sumarizovat existujuce

plus “sprava” z PS Samosprava: okrem “digitalizacie” a “publikovania” sa urcite treba pozriet aj celkovo na optimalizacie procesov a agiend

  • ak sa vyoptimalizuje agenda, ulahci sa jej digitalizacia a budu sa aj lahsie publikovat udaje

pocas lock-down sa lepsie ukazuje, kde vsade a ako by vedeli pomoct zverejnene udaje

dolezity atribut: data su pomenovane aj terminmy, ktore su pouzite v legislative, aby tomu rozumeli nie len obcania, ale aj uradnici

  • pomocka pri intepretacii legislativy

Najziadanejsie datasety

zoznam je priebezne aktualizovany, vid Prieskum najžiadanejších datasetov - B.8 + B.15 - Google Tabellen

opat bude dalsie kolo konzultacie s verejnostou, v spolupraci s USV ROS

  • vysledky ocakavane najneskor 15.3.2021

Ine

Hanecak (a.k.a. “ja”), navrh konkretnej temy na dalsie stretnutie: velmi dosledne podchytit temu datoveho auditu, lebo:

  • chceme oznacit dolezite datasety, ale opakovane obcania hovoria, ze najprv musime vediet, z coho sa da vyberat; tot aby sme neziadali “hluposti” ci “nemozne” resp. “nesli naslepo”
  • chceme mat v NKIS relevatne KPI, tie teda treba opriet o realny zoznam “toho co mame” aby sme si potom mohli presnejsie povedat “z tohto cheme zvrejenit toto” a na tom aj postavit KPI
  • mame tu zaroven od cca 2016 X kol datovych auditov a planov zverejnovania, ktore az tak dobre nedopadli, o.i. lebo 1) aj tak sa malo publikuje a 2) je z toho “guca” XLS (vid teda aj poznamku od MK ohladom udrziavania inforamcii v uzavretych formatoch)
  • mame tu GDPR, a teda ak mame chranit osobne udaje, musime vediet kde a ake mame → datovy audit
  • make tu kyberneticku bezpecnost a (opat) ak mame chranit udaje (a systemy), musime vediet kde a ake citlive data mame → datovy audit

S.D: lepsie zapisy so stretnuti s OVM/PO, aby sa lepsie dalo dodatocne kontrolovat, ci a ako sa plnia dohody zo stretnuti

  • netreba podrobnejsie a urcite nie “dlhsie”, treba najma dobre podchytit konkretne dolezite veci, teda ktore datasety, kedy, kto

?: otazka/podnet k prieskumom ziadanych datasetov: lepsie povedat, co je chcene

  • priklad: Zoznam execkucii - naozaj vsetko? lebo tam su osobne udaje
  • ja: z pohladu komunity tento komentar trafil “bezny zadrhel” pri mnohych doteraisich dopytoch, spojene s tym, ze operujeme zvycajne iba s nazvom systemu ci datasetu, ale nepozname strukturu
    • navrhujem teda k dopytom pripajat aj informaciu o strukture (=zoznam stlpcov), aby sme mali podklad na lepsiu a presnejsiu definiciu toho, co je ziadane
    • typicky ak vopred vieme, ze su v systeme (povedzme zoznsm exekucii) rodne cisla, tak ich rovno nebudeme chciet (alebo budeme, citujuc specificky poziadavku verejneho zaujmi alebo legislativu)
    • naopak, ak nevieme, povieme “vsetko” a nasledne riskujeme “zakopovu vojnu”, lebo OVM/PO sa bude snazit ochranit rodne cisla tym, ze nic neda → problem
2 Likes

Oh classic. Register adries uz funguje?

2 Likes

MV SR: ma na data.gov.sk datasety, ale zatial neeviduju, ze by ich niekto pouzil resp. mal pripomienky → maju pocit, ze investovat do toho je plytvanie, ak teda nie je zaujem ci vyuzitie

To bol preklep. Namiesto MV SR by malo byt MS SR (Ministerstvo spravodlivosti).

2 Likes

Vdaka, opravujem.

Nový level, tuto je zvukový záznam z PS:

2 Likes

8.4. sa konalo stretnutie/call v podskupine “Open Data”. Kedze on-line a “novy level” (ako spomina Lubor vyssie), tak neskor by mal byt zaznam aj z tohto. Medzicasom par mojich viac ci menej surodych poznamok:

Celková architektúra (ekosystém) otvorených údajov

zakladne pojmy:

  • katalog, dataset, distribucia

priklady:

aktualny stav: Open Data 1.0

  • data (presnejsie: udaje o tom, kde su data = metadata) mame rozbite: nieco na data.gov.sk, nieco na crz.gov.sk, nieco na opendata.bratislava.sk, atd.
  • metadata mame nie uplne dobre (vid tie priklady vyssie)

chceny buduci stav: Open Data 2.0

  • data.gov.sk bude harvestovat metadata z ostanych katalogov/portalov aby …
  • … clovek/pouzivatel/obcan mohol na data.gov.sk najst vsetko …
  • … nech uz su data fyzicky umiestnene/zverejnene kdekolvek
  • metadata budu zaroven lepsie (harmonizovane, kvalitnejsie)
  • t.j. crz.gov.sk, atd. nadalej budu existovat a zverejnovat data, ale teda “po novom” budu data najditelne aj na data.gov.sk (a vdaka nemu aj na EUDP)

Dopytová výzva Manažment údajov

pripravuje sa nova vyzva, ktora ma napomoct mensim rieseniam/subjektom

  • scope: zverejnovanie Open Data, analyticke data, integraciew na CSRU, …
  • o.i. teda aj na pridanie API do vlastnych katalogov/portalov, cez ktore bude neskor data.gov.sk harvestovat metaudaje

vyzva pre OVM/PO: ozvat sa MIRRI, ze asi aky scope ma OVM/PO v plane a v akej sume; tot aby MIRRI spravne nastavilo limity pre “male/mensie projekty”

  • aby sa teda nestalo, ze subjekty potrebuju radovo povedzeme 100k€ ale min. limit vo vyzve by bol 500k€

neskor bude pripraveny aj vzorovy projekt, aby tym MIRRI ulahcilo podavanie ziadosti

Q&A: spodny limit na prokjekty?: vezmime priklad “mesto: dorobime API, aby data.gov.sk mohol harvestovat” → vec za radovo tisice EUR (ak uz mesto nejaky katalog ma)

  • extrem jedna: vela malych projektov → strasne vela byrokracie, ktoru MIRRI nezvladne
  • extrem dva: par velkych projektov → mnoho miest sa nekvalifikuju, zopar ano ale len velkym nafuknutim projektov → vysledky nebudu velmi zodpovedat ocakavaniam
  • mozne riesenie: patnersky projekt, kde povedzme MIRRI spravi jeden projekt a X miest by ako partneri dostali mensie ciastky
  • preco nizky limit, pre ilustraciu: uz cca 4 roky dozadu napr. SU pre data z RPO vycislil naklady na cca 30k€
  • zaroven je chcena aj co najnizsia byrokracia, napr. kvoli samosprave

Q&A: SAP ci ine velke existujuce systemy?

  • moze zastresit povedzme MIRRI, aby sme sa vyhli tomu, ze to iste API bude nekoordiovane obstaravat X OVM od toho isteho dodavatela?

Q&A: financovanie zberu dat?

  • lebo mat katalog a datove ulozisko je fajn, ale castokrat je drahe mat v nom zmysluplne data resp. jezbytocne mat ho prazdny rsp. naplneny nepotrebnymi udajmi
  • zatial nejasne

Publikačné minimum

Publikačné minimum štátnej správy

finalne, vid MetaIS

  • aktualny oficialny stav: “pred zavedenim”

hlavnym cielom standardu je zladit:

  • co sa zverejnuje: temy, datasety
  • ako sa zverejnuje: formaty a struktura

vsetko z publ. minima su datasety a teda maju byt neskor okrem zverejnenia aj evidovane v dat. katalogu data.gov.sk

  • t.j. nie je to nejaky “separatny vesmir” ktory sa katalogizuje ci vykazuje separatne

Q&A: ak PO vyplublikuje povedzme CSV podla tohto standardu, bude neskor k dispozicii nastroj ci sluzba, ktora z toho vyrobi JSON ci RDF?

  • planuje sa tvorba Open Source natroja presne na toto

Q&A: semantika / slovniky, a.k.a. konzistentne pomenuvanie stlpcekov?

  • ano, dolezite, je to v merku
  • bude dolezite aj neskor pri generovani RDF, kedy sa pouziju “pojmy” rovno z centralneho modelu udajov

Publikačné minimum MIRRI

MIRRI aktualne podla vyssie spomenuteho minima pracuje na publikovani svojich datasetov, ktore tym padom posluzia pre tento standard aj ako spravna ukazka

Publikačné minimum samosprávy

vid MetaIS

  • aktualny oficialny stav: zaciatok pripomienkovania

zakladom je navrh od Alvaria, vid Návrh Open Data Publikačného Minima pre samosprávy: Zapojte sa do diskusie. | Alvaria - občianske združenie

Zákon o údajoch a otvorené údaje

nadalej “work in progress”

o.i. sa aktualne pracuje aj na ujasneni povinnosti zverejnovat, tot aby bolo jasne ze crz.gov.sk, atd. ma tiez poskytovat Open Data

Stav projektu Centrálny portál otvorených údajov 2.0

kompletuju fukncne aj nefunkncne poziadavky od verejnosti

skratenie casoveho harmonogramu: 40 → 30 mesiacov, kedze 2023/12 musi byt koniec

uprava rozpoctu: aby bolo minimalne 15% internych kapacit

verejne obstaravanie by malo byt typu “in house”

  • vyhlasenie este len bude

posudenie UHP (kedze je to nad 1M€): jedno uz bolo, ale UHP si vyziadalo opat

formality by mali byt hotove do 2021/06

Špeciálny hosť: Pavol Škápik - Otvorené údaje mesta Bratislavy

hlavny rozdiel oproti inym: nie len “data Bratislavy (vlastnene/spravovane mestom)” ale aj “data o Bratislave (kludne od inych, napr. od SU, len teda podmnozina k BA)”

este pred spustenim portalu:

  • vypracovali smernicu: co a ako s datami, …

inkrementalny postup: katalog, smernica, datasety, … sa pridavaju, vylepsuju, … priebezne

obstaravanie kapacit na spravu a podporu existujucich Open Source riesni (napr. CKAN) vnimane ako komplikovane (v kontexte SR, ale napr. aj CR - referencia z Brna), preto nakoniec zvolili “in-house development”

neskor pribudlo:

  • vizualizacia dat cez PowerBI
    • dovod: ludia chceli vizuzaliacie a PowerBI cena je radovo 8€/mesiac
  • zdrojove kody na GitHub - magistrat-bratislava/opendata
  • preklad do ENG, kedze na zaklade statistik navstevnosti eviduju zaujem zo zahranicia

portal (a data) sluzi nie len verejnosti ale aj interne Magistratu

covid-19 dashboard:

  • najrpv postaveny na rucnom prepisovani udajov zo statnych portalov
  • dnes uz takmer plne automatizovane

prioritizuju zverejnnovanie tych udajov, po ktorych eviduju dopyt

v plane je novy geoportal specificky pre geo-data, na baze existujuceho interneho GIS systemu

naklady na portal doteraz: 20k€, vacsinou mzdove naklady na internych ludi

navstevnost: cca 300k/rocne (nerataju sa dopyty na API)

zaujimave datasety:

  • “vitaz”: hlasovania poslancov
  • cestovne poriadky
  • cykloscitace

v priprave:

  • on-line data z MHD, do cca 2-3 tyzdnov
  • dalsie cykloscitace
  • scitace dopravy
  • kvalita ovzdusia
  • odpad

Q&A: dataset register adries BA vs. register adries narodny?

  • organizacia datasetu BA tak, aby s nim vedeli robit aj menej zdatni uzivatelia
    • lebo eviduju dopyty z Magistratu ci mestskych casti, ze nevedia pracovat s datami z narodneho datasetu
  • je “vyrobeny” z narodneho datasetu

Q&A: ma Magistrat “povolenie” povedzme od SU na prepouzivanie dat?

  • nema, netreba, lebo su to “otvorene udaje”
  • poznamka od zastupcu SU: nemaju namietky, naopak sa tesia, lebo o to pri zverejnovani ide: aby sa udaje prepouzivali a posuvali dalej

BA aj SU a par dalsich hlada riesnie, ako mat prehlad o vyuzivani/pristupoch na API


p.s.: Medzi aprilom a februarom boli este aj ine veci, ale tie som nestihal, t.j. ak sa k tomu dostanem, podopisujem sem neskor.

toto je v zasade konzistetne s “neskorsim vyvojom” (= po tom, ako sme nieco take definovali v nasich standardoch), obdobne pnali napr. v CR: “Základním pravidlem je, že pokud má datová sada více distribucí, liší se pouze formou, nikoliv obsahem” - Špatné dělení dat do distribucí datové sady - Otevřená data

V (opat) CR maju uz dlhsie zavedene pojmy NOKD (=narodny open data katalog) a LKOD (=lokany open data katalog) a k LKOD maju o.i. toto: Zprovoznění lokálního katalogu otevřených dat a jeho registrace v NKOD - Otevřená data (do obrazku sa da klikat … pisem, lebo mna nenapadlo :slight_smile: )

Veľmi jednoduché na používanie je
https://data.gov.sk/dataset/adresy-podla-krajov
alebo čerstvejšie dáta na
http://proxy.freemap.sk/minvskaddress/adresy.zip

1 Like

Pri datach z RA bolo zdovodnenie, ze teda povedzme ludia z bratislavskych mestkych casti nevedia, co s velkymi subormi ci API-nami v Exceli. Ja napr. ten 300MB CSV (z adresy.zip) dam, API na data.gov.sk tiez, ale oni vraj nie. Natiska sa potom otazka, ze pre aku “cielovku” sa ten ktory dataset robi. To by som odbil navratom do minulych debat, ze:

  1. stat nech hlavne da kompletne, aktualne a co najspolahlivejsie data, v otvorenom formate, up-to-date, za primerane peniaze a
  2. vsetky tie rozne dalsie use-cases moze osetrit “trh” = ekosystem firiem, neziskoviek a obcanov, ktori z tych statnych dat vyrobia odvodeniny na osetrenie konkretnych potrieb (chcete to v XLS, nie CSV? chcete to nasekane len pre vas kraj ci mesto? chcete to spojene s ujadmi o lesoch od MZP? …?)

A ono sa to v zasade deje, kedze:

  1. samotny stat napr. v pripade uvedeneho RA dava k dispozicii viacero foriem/odvodenin (CSV, API, kompletky, inkrementy, …),
  2. dalsie odvodeniny vytvara napr. Magistrat BA pre “seba, svojich ale aj inych”,
  3. zapajaju sa aj neziskovky (vid teda pre RA ten uvedeny proxy.freemap.sk alebo napr. pre RPO ekosystem.slovensko.digital) a
  4. nieco urcite riesia a poskytuju aj sukromne firmy (viem napr. o tom, ze Here do svojich produktov zakomponuva napr. adresy priamo z Presovskych datasetov alebo povedzme Finstat poskytuje dalej nie len vylepsene data, ale rovno sluzby/pridanu hodnotu nad nimi).

Open Data Portal Germany (OPAL) Projektergebnisse

Vážené dámy, vážení páni,

dovoľte mi, Vás pozvať na pracovnú skupinu Moje dáta. Pracovná skupina bude podporovať a rozvíjať ďalšiu tému / aktivitu dátovej kancelárie „Moje údaje“.

Dňa 11.5.2021 bola podpísaná zmluva o dielo pre národný projekt Manažment osobných údajov. Tento projekt podporuje a rozvíja spomínanú tému. Projekt je v realizačnej fáze približne 4 mesiace, ale má už za sebou prvé prezentovateľne výstupy, ktoré s Vami chceme zdieľať a súčasne prijímať podnety pre ich zlepšenie.

Agenda na stretnutie bude nasledovná:

Dátový program
Predstavenie projektu - Manažment osobných údajov (MOU)
Zákon o údajoch + časť „Moje údaje“
Aktuálny stav projektu MOU
a) Koncept

b) Rozpracované moduly (POC1 (SP.R1.02) a Modul správy osobných údajov (SP.R1.02))

c) Časový Harmonogram

d) Ďalšie kroky

Prezentácia European Digital Identity / wallet
Proof of concept - POC – fáza 1 (+ partneri)
Q&A
Úlohy na členov pracovnej skupiny

PS bude 7.10.2021 od 13:00 - 15:00

Do všetkých pracovných skupín, aj do tejto, prišiel návrh Akčného plánu NKIVS:

03_Vlastný materiál_AP NKIVS 2022.docx (885.5 KB)

A k tomu nasledovný mail:


Akčný plán realizácie Národnej koncepcie informatizácie verejnej správy Slovenskej republiky je vypracovaný na základe Uznesenia vlády č. 763/2021, úloha B. 2. a vychádza z Národnej koncepcie informatizácie verejnej správy Slovenskej republiky.

Na základe stanovených východísk v NKIVS sme definovali:

  • Opatrenia, ako skupina projektov ktoré sledujú rovnaký, alebo podobný cieľ. Skupina projektov je realizovaná jedným, alebo viacerými organizáciami verejnej moci. Opatrenie má stanovené obdobie počas ktorého by mala prebiehať príprava a realizácia projektov.
  • Míľniky, ako zásadné projektové a organizačné riešenia ktoré majú dopad na väčšinu cieľovej skupiny, či už ide o subjekty verejnej správy, alebo občanov a podnikateľov. Projektové míľniky predstavujú konkrétne výstupy a výsledky prevažne spoločných modulov, alebo systémov ktoré tvoria centrálnu architektúru. Organizačné míľniky majú podobne dopad na väčšinu cieľovej skupiny, avšak nejde o budovanie IT aktív, ale o zavádzanie pravidiel, postupov a legislatívy.

Dovoľujeme sa na Vás obrátiť so žiadosťou o pripomienkovanie návrhu dokumentu v prílohe. Pripomienky predkladajte prosím cez online formulár, ktorý nájdete tu: Pripomienky AP NKIVS pracovne skupiny.xlsx do 4.3.2022


Mail prišiel 26.2. (sobota). Ide o najzásadnejšiu vec, ktorú pracovné skupiny tento rok budú robiť. Potrebné je nie “pripomienkovanie”, ale reálna diskusia o obsahu strategických priorít, aktualizácia ich obsahu a na základe toho určenie, čo v AP má byť. Hovorili sme to už pri prijímaní NKIVS, dostali sme prísľub, že to tak aj bude “v rámci možností”, avšak odvtedy sa neudialo nič - s výnimkou témy otvorených údajov. Teraz dať materiál na “pripomienkovanie”, ktoré má trvať týždeň, cez prázdniny, je absurdné.

15.3.2023 sa konalo on-lince zasadnutie PS Lepsie data. (X stretnuti pomedzi som vynechal a zial neviem, ci a kde sa daju najst zapisy.)

agenda

  • Aktuálny stav OD2.0​
  • Úvod ku HVD
  • HVD vs INSPIRE
  • Plánované školenia​
  • Metodika dopadu otvorených údajov na vybrané oblasti​

poznamky

Aktuálny stav OD2.0​

stary portal este bezi

stary SPARQL endpoint uz bol nahradeny novym: data.gov.sk/sparql

Miro Liska (@liska ) ukazoval aj par jednoduchych dopytov

nasadenim novych casti doslo aj k uprave metadata (t.j. zaznamov o datasetoch) podla novych metodik, co viedlo o.i. k zmene poctu datasetov: z cca 3000 na cca 5000

stav:

  • prace MFF UK na NKOD uz skoncili
  • 9.3.2023 bol k veci Riadiaci vybor, rozhodnutie da odbor obstraravania da coskoro rozhodnutie
    • tyka sa pokracovania k casti “webovy portal pre NKOD”

Gov GIT

sucastou je aj Gov GIT (a.k.a. repozitar zdrojovych kodov, a.k.a. code.gov.sk)

  • 9.3.2023 Riadiaci vybor schvalil
  • ideme po vzore UK
  • pouzite bude nieco na sposob GitLab alebo GitHub
  • vznika aj “metodika bezpecnostnych testov zdrojovych kodov pre ich zverejnenie”
  • existujuce GitHub repozitare (slovak-egov · GitHub, …) neskor prejdu pod novy Gov GIT
  • MIRRI uz disponuje zdroj. kodmi MetaIS, otestuju na nom vyssie spomenutu metodiku a zverejnia

PoC validacny a transformacny modul

adresne transformacie vybranych datasetov

  • nie vsetky resp. hocijake datasety, prioritizacia podla publikacneho minima
  • pouzite riesenie: LinkedPipes

scenare spristupnovania otvorenych udajov:

vid Scenáre sprístupňovania otvorených údajov - Metodika pre otvorené údaje (opendata.gov.sk) - Confluence

  • preferovane: cez SPARQL endpoint
  • preferovane: cez DCAT-AP API
  • preferovane: iba metadata cez API data.gov.sk
  • nepreferovane: CKAN API
  • nepreferovane: metadata + data cez API data.gov.sk

kto chce publikovat a nevie ako, nech sa ozve MIRRI, radi skonzultuju

dalsie

https://interoperabilita.gov.sk/

udaje z Central Economical System (CES) su tesne pred zverejnenim

vylepsenie zverejnovanie Register Adries (RA) je tiez tesne pred spustenim

oba budu do buducna sluzit ako vzorove priklady, ako zverejnovat

otazka od @Lubor : EU riesenie pre “1-krat a dost”?

  • odpoved od @liska : nieco bezi, odprezentuju na dalsom stretnuti PS

otazka od @Lubor : na ostatnej PS si MIRRI dalo ulohu ohladom “mapovania”, termin bol “cca teraz” - co je s tym?

  • ano, mapovanie este bezi, termin sa posuva

otazka od @Lubor : ak nova skupina, tak radsej ako podskupina Lepsie Udaje, o.i. lebo “takmer ti isti ludia”

  • ano, bude podskupina

otazka od @Lubor : reporting do “2024/02” → urcite by nemalo byt od dnes do vtedy “ticho”, aby sa s reportingom necakalo na “poslednu chvilu”

  • ??? (nejak som si nic nepoznacil, asi som nerozumel)

Úvod ku HVD

HVD = “High Value Datasets”

prvy report bude k februaru 2025

  • teraz, v SR, prebieha mapovanie
    • nasledovat ma zverejnenie
    • a potom report
  • paralelne bezia aj EU aktivity, napr. konzultacie ohladom HVD + INSPIRE, atd.

zaklady:

  • vykonavacie nariadenie Komisie c. 2023/138
  • subory udajov s vysokou hodnotou su:
    • dostupne bezplatne (ale existuju vynimky)
    • strojovo citatelne
    • prostrednictvom API alebo (v urcenych pripadoch) hromadne stiahnutie
    • CC0 alebo CC-BY

problemy:

  • chybaju specificke usmernenia od EU
    • typicky zladenie INSPIRE (uz da sa povedat stara zabehnuta tema) a HVD (nova tema)

zriadenie prac. skupiny k HVD

  • MZP, UGKK, SU, SHMU, MV SR, MD SR
  • prebiehaju nominacie zastupcov

HVD vs INSPIRE

(prezentoval Martin Tuchyna @mtuchyna )

INSPIRE sa datuje do 2007, HVD do 2019

  • Regulation HVD - 2023

dotknute subjekty:

  • INSPIRE aj HVD definuju “povinne osoby”
  • podrobnejsi vycet medzi INSPIRE a HVD: su drobne rozdiely

pouzivatelia resp. “cielovka”:

  • beznymi pouzivatelmi su obcania a firmy
  • niektore subjekty (PO/OVM/…) aj poskytuju (nieco) aj pouzivaju (nieco ine)

stale sa vyladuje “governance” v EU aj v SR

  • medzi najnovsie PS patri “INSPIRE/HVD alignment action”
    • podobna by mala vzniknut aj v SR
  • temy na diskusiu:
    • integracia data a geo portalov
      • tok metadat: data portaly vs. geo portaly, …
      • tech. standardy metadata a ich zladenie a mapovanie
      • harvesting (portaly u PO → narodne portaly → EU portaly)
    • zamedzenie duplicitam:
      • aby sa datasety neobjavovali dvojmo: raz ako Open Data/HVD, raz ako INSPIRE
      • aby sa neinvestovalo do duplicitnych tech. rieseni na zverejnovanie
    • kvalita udajov
    • historicke udaje

GreenData4All

priklady dobrej praxe

z pohladu dat je vcelku velky prienik medzi HVD a INSPIRE

  • s INSPIRE suvisi velmi vela: temy geo udajov
  • s INSPIRE suvisi: takmer vsetky HVD temy
  • s INSPIRE suvisi velmi malo: spolocnosti a ich vlastnictvo

technicke poziadavky:

  • INSPIRE ma formaty definovane vcelku podrobne
  • OpenData/HVD naopak formaty (aspon zatial) definuje dost volne
  • mnohe INSPIRE formaty zrejme vyhovuju OpenData/HVD, ale niekedy nie je jasne
  • terminologia: “INSPIRE: sluzby” cca = “HVD: API”

licencie:

  • INSPIRE aj OpenData/HVD sa zhoduju na CC0 a CC-BY

vynutitelnost spristupnenia

pravna podpora

monitoring/reporting

  • v INSPIRE uz takmer plne automatizovane
  • pre HVD skor len “manualy reporting”
    • aj tak by vsak asi bolo lepsie aspon ciastocne automatizovat

Plánované školenia​

tu uz som nebol pritomny, zasadnutie sa niatiahlo nad moje casove schopnosti

Metodika dopadu otvorených údajov na vybrané oblasti​

tu uz som nebol …

4 Likes

23.8.2023 sa konalo dalsie on-line zasadnutie PS Lepsie Data:

Agenda

  1. Dopytová výzva financovaná z programu Slovensko „Lepšie využívanie údajov“

K comu dodatocne este prislo toto:

Poznamky

Vymeskal som prvych cca 30 mint, ale teda nieco bolo aj potom:

Dopytová výzva financovaná z programu Slovensko „Lepšie využívanie údajov“

nateraz je vyzva iba pre statnu spravnu, neskor ale ocakavaju obdobnu vyzvu aj pre samospravu

pripomienky aj mailom smerovat na MIRRI

  • cim skor tym lepsie

cielom je uz konecne, po X rokoch, ziskat poskytovatelov udajov

  • cez CSRU, cez “menezment osobnych udajov”, atd.

a nasledne konecne dostat data k ludom

  • v kontexte “moje udaje” typicky aj ako nejake potvrdenia ci preukazy, ktore bude mat obcan v apke v mobile

pravne analyzy maju viest o.i. k systemu “register pravnych povinnosti”:

  • tam bude vedene napr. to, ze ake registre kto ma a preco (kvoli akym zakonom) ich prevadzkuje

existuju aj ine vyzvy:

  • pre implementaciu veci vyplyvajucich so zmien v legislative
  • architektura
  • Cloud
  • atd.

@Kusyova : bolo komunikovane uz aj na inej PS: vyzva je super, a dufame teda, ze neskor bude obdobna aj pre samospravy

tato vyzva nebude mat priamy efekt na zlepsenie postavenia SR v DESI, ale vytvori podmienky (t.j. cca back-end) pre sluzby, ktore uz nasledne to DESI hodnotenie maju zlepsit

uz odbocenie od temy vyzvy, ale suvisi cez temu “moje udaje”: projekt “manezment osobnych udajov” sa uz blizi ku koncu

  • vysledkom ma byt apka v telefone, kde si bude obcan moct menezovat svoje informacie / informacie o sebe, pripadne ich zdielat dalej

pytal som sa: Ako sa podla MIRRI ma riesit subeh toho, ze ak by chcelo OVM realizovat aj use-case “poskytovat data inym OVM” a aj use-case “poskytovat data obcanom a firmam ako Open Data” specificky v pripade, ak sa oba use-case tykaju tych istych udajov? Povedzme, ze by slo o nejaky jednoduchy nekonfliktny register laviciek, t.j. ziadne osobne udaje ani “moje udaje”. Odpoved, cca:

  • CSRU → CIP (Centralna Informacna Platforma)
    • zmena ci upresnenie nazvu, resp. rozne vrstvy cibule
  • CSRU/CIP sprostredkuva, ale neuklada udaje
  • t.j. CSRU/CIP je len brana medzi poskytovatelom a konzumentom
  • CSRU/CIP zabezpecuje prietok dat a bezpecnost, a zabezpecuje to len pre G2G
    • a teda CSRU/CIP Open Data neriesi
  • Open Data ma riesit Open Data 2.0 a.k.a. data.gov.sk

follow-up: Ak teda ja (ako hypoteticke OVM) pre tie spomenute hypoteticke lavicky spravim Open Data API, postaci to iste API ja na CSRU? Odpoved, cca:

  • ano/nie, rozvedieme
  • ak su to data, ktore su iba Open, tak sa zverejnuju iba cez data.gov.sk
    • formou katalogizacie, t.j. “moj lavickovy register” ma API a na data.gov.sk bude len katalogovy zaznam odkazujuci na toto API
  • ak su to citlive data len pre G2G, tak nesmu ist do data.gov.sk a G2G sa riesi cez CSRU/CIP
  • pre kontext “bolo by to v rezime aj-aj” odpoved ludom na MIRRI nateraz nie je uplne jasna, ale “zrejme asi ano

t.j. ako taketo hypoteticke OVM pre “data v rezime aj-aj” (aj Open Data, aj G2G) tu odpoved zatial interpretujem nasledovne:

  • OpenData API potrebujem (lebo high-value datasets, pravo na informacie, cokolvek) => spravi sa
  • a budem dufat, ze sa to API “as is” (bez uprav, pripadne len s drobnymi upravami) bude dat prepouzit aj pre integraciu na CSRU/CIP, najma ak som samosprava, nemam penazi nazvys a “nakazu mi to z hora”