Tu sa medzičasom deje viacero vecí, postupne to sem nahodím.
Asi najväčšia novinka je, že sa reálne začala príprava nového zákona o údajoch. Detaily a diskusia tu: Zákon o údajoch
Zopár odrážok k ostatnému stretnutiu podskupiny “Referenčné údaje”:
-
Dátová kancelária má nového špecialistu pre kvalitu údajov - Andrej Fukas
-
KPMG dodala finálne výstupy k riadeniu kvality údajov, teraz prebieha formálne schvaľovanie na úrade, ale v podstate je to akceptované, toto je k tomu oficiálny text:
Metodické príručky ÚPVII, ktoré by mali pomôcť správcom údajov, dátovým kurátorom, resp. ostatným zodpovedným osobám nastaviť procesy manažmentu kvality údajov vo vzťahu k registrom, v rámci ktorých sú vedené a to konkrétne:
- identifikovať biznis pravidlá voči určeným ukazovateľom dátovej kvality,
- rozbehnúť procesy merania dátovej kvality,
- identifikovať a riešiť problémy spôsobujúce nedostatočnú kvalitu údajov:
Metodika merania dátovej kvality vo verejnej správe
Výpočet KPI dátovej kvality pre jednotlivé inštitúcie verejnej správy
Zoznam konkrétnych odporúčaní pre inštitúcie verejnej správy z ohľadom zlepšenie dátovej kvality
Návrh datasetu parametrov dátovej kvality vo verejnej správe vo formáte otvorených dát
Prezentácia prvého komplexného merania dátovej kvality vo verejnej správe
(koniec oficiálneho textu)
Tie dokumenty zväčša neuškodia ani nepomôžu. Kto chce vidieť, prečo ani svetovo špičkové konzultačné firmy nezachránia slovenský eGov, pozrite si “prezentáciu prvého komplexného hodnotenie dátovej kvality vo verejnej správe” a tam údaje za RPO - vyšlo že vo všetkých parametroch je kvalita tohto registra nad 99,7%. Haha.
Potom sme diskutovali práve o RPO a jeho známych nedostatkoch kvality údajov tohto registra. Imho toto dostať do poriadku by mala byť priorita, snáď aj väčšia ako pokračovanie reklamne ľúbivých tém quickvíťazstiev.
Viaceré ďalšie úrady, ktorých registre majú byť vyhlásené za referenčné, potom hovorili ako si to predstavujú. Obvykle sa to zaseklo na jednoznačnej identifikácii právnických osôb. Napr. fin. správa nechce plošne zverejňovať DIČ, že to je ich interný identifikátor, ale v IČOách je skrátka zatiaľ príliš veľa chýb…
Keď už sme pri tom, povedať aké “biznis pravidlá dátovej kvality” (terminológia KMPG) treba pri nejakom registri sledovať vedia najlepšie konzumenti údajov z tohto registra. Oni najlepšie vedia čo si musia odkontrolovať skôr než si údaje pustia do svojho systému. Povedzme pre to RPO.
A len tak pre zaujimavost, co su tie problemy RPO, ktore neodhalili? Na druhu stranu, je pravda, ze to hodnotenie bolo trochu simplisticke…
No veď v RPO chýba podstatná časť údajov, najmä z malých registrov. A aj to čo sa tam nahráva z OR+ŽR má podstatné problémy ak nie úplne sedí. A duplicity. A je veľká chybovosť údajov, napr. skutočné adresy. Ja viem že časť z toho sa “iba” prenáša zo zdrojových registrov, ale to ma pri hodnotení kvality vôbec nezaujíma - lebo práve na to RPO slúži, aby všetkých odtienil od detailov zdrojových reg. Pomenujme v čom je problém (ak je - a všetci hovoria že je), a potom bude lepšie vidieť čo treba robiť.
Ešte raz: skús sa na RPO pozrieť ako konzument údajov, povedzme Soc.poisťovňa. Čo potrebuješ a v akom je to stave? Kedy bude môcť SP “stotožňovať”, čiže zahodiť svoju evidenciu a nahradiť ju tým čo je v RPO? Lebo momentálne hovoria že ani náhodou, a to ani keď im to zákon prikazuje - lebo nekvalita údajov.
Mne to prišlo doslova smiešne, že všetci sa dlhodobo sťažujú na nekvalitu RPO a konzultanti si v pohode vykážu 99.X%. Veď aj kebyže nič o RPO neviem tak mi iba pri počívaní o čom sa hovorí na PS zúrivo bliká červená kontrolka.
Pozeram slide 19 a k RA a (po prestudovani detailov = o.i. napr. “V prípade 425669 záznamov
obsahuje zemepisná dĺžka hodnotu NULL (36,086%).”) je teda vysledok pre ukazovatele RA-1 a RA-2 dost zly: 63.9%. Po InspirujmeSe (geo konferencia minuly tyzden v Tatrach) pozeral kolega podobnu metriku pre PSK [1] a vyratal, ze:
- 68% zaznamov ma koordinaty
- 49.9% (z celkoveho poctu) ma koordinaty v PSK
Viac by ma ale zaujimalo, nakolko automatizovane a opakovatelne toto meranie je. Lebo od teraz by bolo velmi zaujimave “kreslit casovy graf” a pozerat, ci a ktore metriky idu hore.
[1] Adresy podľa krajov - Adresy Prešovský kraj -data.gov.sk
Opatrenie c. 32 v zalozke “Odporucania” sa mi velmi paci: “Zabezpečenie jednoduchšieho prístupu k datasetom potrebným pre meranie a riadenie dátovej kvality (napr. Prístupy do všetkych informačných systémom by mali byť na úrovni READ kedykoľvej. Export dát z databázy by mal byť pre zodpovedné osoby ľahšie možný a najlepšie vo formáte SQL).” NA druhu stranu, po skusenostich s data auditmy, ktore prebiehali vramci OGP mi zostava silno dufat, ze KPMG resp. UPVII bude schopne vyrazne lepsie organizaciam vysvetlit, co to presne znamena.
Potom ale trochu nechapem, preco ma “Nastavenie proaktívnych kontrol pre zdrojové systémy – kontrola bude prebiehať už pri vstupe údajov na základe definovaných technologických a procesných požiadaviek.” priotitu iba 2 zatialco “Implementácia a zabezpečenie nástroja na riadenie dátovej kvality (v súčasnosti existuje platforma Talend, ktorá je zabezpečená na úrovni PaaS služby v štátnom cloude).” ma prioritu 1.
OK, ma to niekde niekto spisane presnejsie? Chapem, ze do RA sa kope lahsie (adresne body v Afrike su vcelku jasne, to sa ani Moricom Benovskym neda vysvetlit ), RPO je tazsie. Tak preto vrtam.
A podla tychto bodov sa to mohlo dat odmerat konzultantom…
Poznamka bokom: Kedze vsetky udaje z RPO mame v nasom https://ekosystem.slovensko.digital/ a dokonca mame reportovaci tool. https://bi.ekosystem.slovensko.digital/, tak pokial niekto ma napad co vieme odmerat jednoduchym “selectom”, tak to tam v klude dajme.
Za mna z toho co o RPO viem namatkovo:
- udaje napriec roznymi registrami (ZR a advokati a ine) maju problematicke casove prekryvy osob - nesedia od-do.
- sem tam nejake udaje (historicke) zmiznu (nedosiel som na to podla akeho kluca) a nahradia sa novymi, kde su neni nejake osoby (konatelia, staturari) co tam boli.
- zmeny ico a ich historicke prekryvy (toto som videl ak si spravne spominam iba par krat), nejaka firma mala rovnake ico ako ina firma co davno zanikla.
- podiely na zakladnom imani sa dost blbo stotoznuju s osobami. aj clovek ma niekedy problem to pospajat. mam pocit, ze toto je proste zly datovy model.
- RPO ma nejake interne unikatne ID na zaznamy, ale je to spravene velmi divne (v case pribudaju pre jednu firmu dalsie a dalsie “cez frontend nevyhladatelne zaznamy”, cize ako jednoznacny identifikator PO to rozhodne nie je pouzitelne.
K Registru adries: pred cca. 2 mesiacmi spravil gestor tohto registra skutočne dobrú vlastnú prezentáciu stavu kvality údajov. (Ono gestori obvykle presne vedia v akom stave to majú a kde ich tlačí päta, častokrát však akoby “nebola vôľa” prezentovať si pravdu ani medzi úradmi.)
Že GPS súradnice pre veľa adresných bodov nie sú uvedené je “na počet chýb” asi najvážnejší nedostatok. Aj sa tu už rieši, najmä kvôli sčítaniu obyvateľov, ktoré by malo byť založené práve na údajoch z tohto registra. “Už” znamená, že pol roka vyjednáva MVSR a ŠÚSR, kto zaplatí tých cca.300K Eur, ktoré vraj stojí plošný komerčný nákup doplnenia týchto údajov. V slávnom OPII samozrejme na toto peniaze nie sú.
Každopádne v RA sú aj iné, subtílnejšie chyby a mal som z tej prezentácie pocit že MV ich rieši. Historicky časť problému vznikla tým, že za časť údajov RA “od ulice nižšie” zodpovedajú obce, ktoré však nedostali pokiaľ viem žiadnu priamu podporu pri napĺňaní/riešení kvality svojich údajov, iba zákonnú povinnosť. OPII/OPIS opäť nič, z toho sa platilo iba “vybudovanie” registra.
Keďže celý RA je verejne dostupná ako OpenData, kto chce môže vyrobiť aj denne merané veličiny. Tuším tie query sme aj tu na platforme niekedy písali.
Btw. k meraniu presnosti GPS súradníc by ma zaujímala suma “odchýliek bodu RA a <verejné API> geocoding bodu pre danú adresu”. Verejné API napr. google, here.com, alebo bing. Cieľ je toto mať =0.
K RPO:
no veď presne, očakával som, že ten_kto_robí_komplexný_audit, dá dokopy zmysluplné parametre ktoré je treba merať. Toto je najťažšia robota. No nevadí, ako som písal v Dátovej kancelárii je nový špecialista na kvalitu údajov, tak snáď toto preberie on a dúfam že túto diskusiu aspoň číta. Áno, pri RPO vnímam ako najbližší krok určiť sadu kritérií ktoré chceme sledovať.
Ad “opatrenie c.32” - mal som pocit že aspoň jeden úrad na týchto audítorov hľadel dosť s dešpektom a dával im najavo že veľmi spolupracovať ani nechcú.
Ad “nastavenie proaktívnych kontrol” - čistá všeobecná teória. Častokrát nejaké IT-čkarske “kontroly vstupu” nemôžu brániť zápisu do registra.
Ad “nástroj na riadenie dátovej kvality” - toto hodnotím ako čistú neschopnosť písať skripty v Unixe, alebo rozchodiť si nejaký FOSS analytický nástroj. Plus akonáhle sú v registri nejaké citlivejšie údaje - napr. OÚ, predstava že úrad celý register nakopíruje niekam vedľa kvôli analyzovaniu kvality je smiešna ilúzia, najmä keďže problémy kvality ten úrad obvykle dobre pozná. Viď. predstavy riešiteľov CSRÚ, ako sa všetky údaje nasypú na kopu a tam sa budú “opravovať”.
Alebo práve vidíme vznik zadania pre pekný eurofondový projektík.
Nieco ako:
SELECT sum(cena) FROM studie_uskutocnitelnosti WHERE text ILIKE ‘%licencie Talend%’
?
Relevantne:
Na UPPVII dnes bolo dalsie zasadnutie K9.4 . Program:
- Zhrnutie činnosti Pracovných skupín a Dátovej kancelárie za rok 2019
- Dátová kvalita (meranie dátovej kvality na rezortoch)
- Referenčné údaje (plán vyhlasovania referenčných údajov)
- Otvorené údaje (úlohy, rebríčky; EU regulácia OD a PSI, FFoD)
- Moje údaje (technologické riešenie na otestovanie konceptu)
- Legislatíva (Zákon o údajoch, Stop byrokracii,…)
- Podujatia
- Informácia o stave národných projektov v gescii Dátovej kancelárie a dopytových výzvach v oblasti údajov
- Prerokovanie návrhov na vyhlásenie základných číselníkov a referenčného registra (v prílohe pozvánky):
- Návrh na vyhlásenie referenčného registra adries
- Návrh na vyhlásenie základného číselníka Časť obce
- Návrh na vyhlásenie základných číselníkov Úradu geodézie, kartografie a katastra
- Priority na rok 2020
- Iné, navrhnite
Prilohy:
- Návrh na vyhlásenie nových základných číselníkov_katastra.docx (21.0 KB)
- Návrh na vyhlásenie Registra adries za referenčný register MVSR_V3.docx (27.2 KB)
- Návrh na vyhlásenie základného číselníka MVSR.docx (14.9 KB)
- zc_sablona_v10_casti_obci_OK.xls (550 KB)
Par mojich poznamok:
Zhrnutie činnosti Pracovných skupín a Dátovej kancelárie za rok 2019
dat. kancelaria vznikla cca 2019/03 v pocte cca 5, dnes ich je 10
Dátová kvalita (meranie dátovej kvality na rezortoch)
zakl. vyznam/ucel/ciel: zavedenie exaktnych meratelnych ukazovatelov
zodpovedni su najma spravcovia registrov
- UPPVII je “organ vedenia”
- vid z. 95/2019 a novo pripravovany zakon o udajoch
aktualne vystupy su na stranke UPVII
- pripravovala KPMG
- obsahuje: navody, pilotne merania, …
merania sa budu/maju robit aj opakovane, aby bolo mozne hodnotit dopad vykonanych opatreni
pilotuju na cca 20 dat. zdrojoch/OVM
Referenčné údaje (plán vyhlasovania referenčných údajov)
narazili o.i. na leg. obmedzenia:
- UPPVII moze reagovat iba na navrhy predkladane spravcami, nepredklada sam
- ale ziadne OVM sa zatial neprihlasilo same od seba
- ref. udaje “zverejnovane/poskytovane” cez CSRU: niektore “poskytnutia” su real-time, t.j. dopyt na konkretnu polozku, takze ziaden dataset, cize neexistuje ziadny uceleny zaznam o tom, kedy aka hodnota plati(-la)
plan vyhlasovania:
- RA
- nedopatky na daniach a clach
- nedplatky soc. poist.
- …
bariery pri vyhlasovani: nizka kvalita zdroj. udajov
- “pikoska”: MS prezentovalo ze udaje o skl. odchadzke su ba 99%, neskor ale nedostatocmu kvalitu pouzili ako argument pri pomalom vyhlasovani prisluchajuceho ref. registra
zakon proti byrokracii:
- zajra (18.12.2019) ide na vladu navrh na dasich 9 vypisov
- viazu sa na to urcite data:
- reg. upadcov
- reg. hosp. zvierat
- projemcovia min. st. pomoci
- …
plany na 2021-2022: cca 200 navrhov/napadov
- UDZS, ZVJS, UV SR, …
- napr. ZA a PO VUC planuju rozne registre, ale ostatne VUC nie - mierne otazne, kedze by chybali udaje za ostanych 6 VUC
- pri niektorych planoch chyba predstava, komu by to na co bolo: vcely, krmiva, …
otazka zucastneneho: zislo by sa poskytnut zoznam projektov, kedze mnohe slubuju nejake data
- preco:
- napr. MZP potrebuje vyhodnotit prekryv s INSPIRE
- samotne UPPVII tiez vyhodnocovalo a bude vyhodnocovat urcite atrubuty projektov
- MNO sa tiez radi pozru, vyhodnotia, porovnaju, …
- MetaIS je to miesto, kde su resp. maju byt dostupne dokumenty o schvalenych projektoch, o.i. kvoli analyze/kontrole, ze kto ci slubil
- schvalene projekty maju byt zverejnene uz dnes, bez potreby prihlasenia
- Datalab (a.k.a. datova kancelaria UPPVII) uz ma tabulku/analyzu projektov (cca 30) za prve kolo schvalovania, posnazia sa zverejnit
vyzvy/financovanie: financie uz su takmer vycerpane
Ciselniky
doplnok k tomu, co je v casti “plan vyhlasovania” (vid vyssie)
o.i. katalogizovali udaje o spravcoch a vytipovavali zoznam ref. ciselnikov
vztah. s kvalitou: aby ref. udaje boli zadavane do registrov podla ciselnikov (t.j. nie “free style” ako jezial caste dnes)
Otvorené údaje (úlohy, rebríčky; EU regulácia OD a PSI, FFoD)
plnenie NKIVS cielov:
- niektore metriky su “sialene”: pocet stiahnuti, …
- zatial sa teda pracuje na metodike vykazovania
- dovolil som si pripomenut, ze:
- pre komunitu su vyznamnejsie KPI typu “v top 5 rebricka EUDP”, kedze to ma zmysluplnejsiu a prepracovanejsiu metodiku
- a naopak napr. pocty stiahnuti datasetov povazujeme za bezvyznamne (a nepamatam si, kto to tam pridal)
- plus ze KPI su z 2016, kedy boli velke ambicie, lebo:
- “zhruba dalsia miliarda na IT”
- dokonca data a Open Data boli (a su) jednou z priorit programoveho obdobia a IT balika eurofondov
- (v tom casebolo) 4-7 rokov na implementaciu
v EU rebrickoch sme 4. od konca (vs. ciel “prva 5”)
novy akcny plan OGP:
- USV ROS “odstupuje” od Open Data …
- … “vedenie” prebera “Strategia NASES” (dokument)
publ. minumum pre st. spravu bude UPPVII vypracuvat od 2020/01
- publ. minimum pre samospravu “bolo skusene”, nevyslo
EU regulacia:
- nova PSI: “high value” datasety
Moje údaje (technologické riešenie na otestovanie konceptu)
vystupy:
- koncept
- OpenAPI standard
- autorizacia:
a) vo vlastnej rezii alebo
b) cez CSRU; autorizaciu overuje vo vysledku IAM (cez “mobile ID” od DEUS)
- autorizacia:
- proof of concept aplikacia
- v uzavretom rezime je Datapp apka pre Android uz dnes v AppStore
- je to “vedlajsi produkt” na otestovanie hlavneho vystupu: OpenAPI
- budu zdrojaky?
- budu (v zmysle platneho zakona o ISVS)
- uz dnes by na Datalab mala byt starsia test verzia
- v uzavretom rezime je Datapp apka pre Android uz dnes v AppStore
63 schvalenych nar. projektov → UPVII sa im bude venovat z pohladu spristupnovania osob. udajov
par technickych hintov:
- DEUS: mob. ID
- Digi.me: sifrovany prenos
Legislatíva (Zákon o údajoch, Stop byrokracii,…)
zakon o udajoch
finalizuju MPK k zakonu o udajoch
upravena verzia pojde este raz do MPK
- o.i. teda z toho bude “zakonnik udajov”
- “presuvaju” don niektore “polozky” z inych zakonov:
- ref. registre
- zrejme neskor Open Data (t.j. buduca transpozicia novej PSI bude zrejme v tomto nmvom zakone)
- vacsie previazanie s GDPR: analyticke jednotky, opravnenia a povinnosti dat. kuratorov, moje udaje, …
zakon proti byrokracii
bezi 3. vlna
uspory kol 1 a 2 boli vycislene na 8M€ rocne, uspory 3. kola su odhadnute na 18M€
dalsie vlny: nadalej ist po zivotnych situaciach a pocetnostiach
ale: napr. RFO je uz rok referecny, mnohe urady vsak nadalej nestotoznuju a pytaju potvrdenia od obcanov
naraza sa aj na technologicke limity:
- napr. system dochodkovych davok je z r. 1975 (niesom si isy, ci som dobre pocul) => pre zdielanie sa musi
spravit “udelatko” - inde maju “distribuovanu DB” na baze FoxPro a emailov
Informácia o stave národných projektov v gescii Dátovej kancelárie a dopytových výzvach v oblasti údajov
vyslo na to uz len poslednych cca 3-5 minut
dopytove vyzvy mali uspech, o.i. kvoli vzorovym projektom
UPPVVI ma 4 projekty:
- Open Data 2.0 schvaleny
- EVS Open Data projekt pozastavneny (niekde na MV SR)
- …
pripravuju hackathony
Prerokovanie návrhov na vyhlásenie základných číselníkov a referenčného registra (v prílohe pozvánky):
Návrh na vyhlásenie základných číselníkov Úradu geodézie, kartografie a katastra
11 ciselnikov: udaje o pozemku, stavbe, …
priprava na neskorsie vyhlasenie ref. registra parciel
Návrh na vyhlásenie základného číselníka Časť obce
sucast RA
tiez priprava na neskorsie vyhlasenie RA ako ref. registra
vid navrh
udrzba: ocakava sa cca 5 zmien rocne
- MV SR, v MetaIS
- hlavne miesto zverejnia
- uz je dostupny dnes, na login, v test. verzii
- Stat. Urad, v ich systeme
dolezite su polozky prislusnosti k obci, cez SK NUTS kody - tot aby bolo jasne, kam ktora cast patri
vtah tohto ciselnika k registru zakladnych sidelnych jednotiek (SJ) v gescii MZP?
- neriesili, lebo SJ nie je spravna jednotka
- SJ dnes nema “pravne silne” postavenie
Návrh na vyhlásenie referenčného registra adries (RA)
referencne nebudu vsetky “stlpce”
- typicky sa vynechavaju koordinaty, kedze ich vela chyba, us nespravne a pod.
su tam aj URI: kazdy adresny bod bude mat jednoznacny identifikator
- o.i. budu pouzite pri stotoznovani
ocakacane vyhlasenie registra:
- odhadom 2020/01-02
- po KS a MPK
Priority na rok 2020
nevysiel cas
asi zrejme tu: MetaIS
Tot tu, ak si dobre pamatam: https://www.slovensko.sk/_img/CMS4/strategia_otvorene_udaje.pdf
Resp. historicka referencia aj tu: OpenData stratégia - pripomienkovanie
Dnes na tom pracuje MNO Alvaria, vid napr. Chýbajúce publikačné open data minimum na Slovensku | Alvaria.sk
Nemile, kedze EVS cast ma zabezpecit ludi a IT cast “Open Data 2.0” ma tym ludom zabezpecit adekvatne vybavenie. Len teda ako ta IT cast vie, co bude adekvatne pre ludi, ktori pridu neskor a teda nemaju sancu sa v IT projektu vyjadrit?
Tot use-case na repozitar zdrjovych kodov (aktualne pripravovany projekt “Open Data 2.0”). Ale zase NASES take zvladol uz v minulosti, dokonca pocas vyvoja, vid:
28.1.2020 sa na ÚPVII konalo stretnutie “PS Referenčné údaje”. (Kedze v tom zacinammat chaos, lebo o.i. nepojuzivaju MetaIS ale len maily s “vela ludi v TO:”, tak to dam zatial sem.)
Ohlasena agenda:
-
Informácia o aktuálnom stave návrhu Zákona o údajoch a o zahrnutí témy “Referenčné údaje” do návrhu zákona
- Informácia o aktuálnom procese pri vyhlasovaní Registra adries za referenčný register a o nových číselníkoch
-
Diskusia k vyhláseniu vybraných údajov katastra nehnuteľností ako referenčných údajov a to za nasledovné oblasti:
a) Geografické názvy nesídelných objektov
b) Geografický priebeh administratívnych hraníc, Hranice katastrálneho územia (KÚ), kraja, okresu, obce
c) Údaje o nehnuteľnostiach: Parcelné číslo reg. C a reg. E, druh pozemku reg. C, BPEJ
d) Geometrické a polohové určenie parciel reg. C a reg. E (katastrálna mapa a mapa určeného operátu)
Poznamky nemam, nestihol som sa zucastnit. Zapis neviem ci je resp. ci bude.
Dna 9.6.202 sa konalo dalsie stretnutie PS K9.4 Lepsie Data. Par mojich poznamok:
Administrativne informacie
UPVII -> MIRRI, ICO ostava
dalsie stretnutia: on-line?
- chcu testovat mix model, kedy X ludi je fyzicky pritomnych, Y bude “remote”
- hladaju sa odporucania vhodne na tech. riesenie (kludne napiste aj sem na platforme, kto viete)
novi kolegovia:
- projekt (asi EVS) sa rozbehol, 10 pozicii obdadenych, 3 su este volne -> hladaju sa zaujemci (opat, kludne piste aj sem na platorme, posunieme)
- temy: datova analytika, architektura/modelovanie udajov, …
- platova trieda: najvyssia
Zhrnutie cinnosti resp. stav Datovej kancelarie za 2020
Datova kvalita
robia sa pilotne merania datovej kvality (DQ) na X vybratych IS (vzdy jeden IS za jeden rezort)
- pri kazdom merani sekunduje/spolupracuje aj Dat. kanc. UPVII
- vysledky: do cca 2-3 mesiacov
- feedback nateraz viazne
priebezne pribudaju hodnotiace spravy, vid https://datalab.digital/hodnotiace-spravy/
zistenia posluzia pri priprave noveho zakona o udajoch (tot aby zakon zohladnoval prax)
DQ suvisi s vyhlasovanim ref. udajov (tie musia byt kvalitne skor, nez sa vyhlasia)
Referencne udaje
vyhlasenie novych ref. udajov:
- k 1.5.2020: niektore udaje RA, referencie:
plan dalsieho vyhlasovania:
- priorita: vybrane udaje z Katastra
- udaje, ktore budu priebezne pribudat v CSRU
- prijemcovia st. pomoci
- nedoplatky: uz boli skoro spristupnene, ale kvoli korone existuju odsunute platby a kedze terminy sa posuvali a Soc. p. nestiha posudzovat, udaje maju “znizenu vierohodnost”, preto nateraz pozastavili export do CSRU a teda aj vyhlasovanie
- info o ziakoch a studentoch
projekt datovej integracie meska
pozor pre dat. kuratorov: do roka po vyhlaseni ref. udajov treba spravit stotoznenie
- t.j. teraz uz treba pracovat na stotoznovani fyz. adries voci RA!!!
specialna “vyzva”: ako vyhlasit aj vektorove data Katastra za referencne ked CSRU vektorove udaje nepodporuje?
- vraj vyhlasit ref. udaje bez CSRU “sa neda”
- debata o tomto bude na dalsom stretnuti
robi sa analyza procesov okolo zivotnej situacie narodenie dietata (pred porodom): zrejme prvy krat, kedy je cielom nie len preklopit papierove procesy na formulare, ale aj navrhnut proces optimalne, aj pre obcanov
- neskor z toho (=procesu) maju byt aj data
- v Nemecku riesili “iba” dane a este jednu agendu a trvalo im to 5 rokov
- padol navrhli zriadit k tomuto specialnu PS
- inak sme (ako clenovia PS) samozrejme radi, ze a) UPPVII toto riesi a b) ze nam o tom UPPVII povedalo
Zakladne ciselniky
novo vyhlasene:
- cast obce
- klasifikacia nehnutelnosti
(vid potom aj https://metais.vicepremier.gov.sk/codelists/publiclist?page=1&count=20&sorting[code]=desc )
tesne pred dokoncenim:
- katalog odpadov
rozpracovane:
- regulovane povolania,
- ucel budovy
- …
alokuju uz aj URI
vystupy pojdu na PS Ref. udaje a potom PS1
Zakon o udajoch
kvoli volbam a MPK dost prepracovali
pojde do MPK opat
ciatocne zasiahne aj el. schranky, obc. zakonnik, …
suvisi aj s GDPR, kedze UPVII / CSRU bude spracuvat vela dat
planovany termin ucinnosti: k 1.1.2021
- PS dostane text o par tyzdnov, po schvaleni vedenim UPVII
v buducnosti by sucastou vyhlasky/zakona malo byt aj publikacne minimum pre statnu spravu
Otvorene udaje
publikacne minimum st. spravy: poslu navrh, do 2 tyzdnov
high-value datasets:
- EC uzatvara konzultaciu
rebricky resp. uniestnenie SR v nich:
- DESI, … - povacsinou sme na konci
- co spravit, aby to malo pre obcanov zmysel a aj aby to pomohlo zlepsit umiestnenie?
opatovne sa mapuje “datovy inventar” (znamy aj ako “nulty dataset”, t.j. zoznam IS a udajov v nich), aby bol presny podklad pre dalsie debaty o tom zverejnovani
Open Data je vcelku vysadne spominane v prog. vyhlaseni Vlady
konkretny podnet: Covid-19 data z NCZI (per okres, s historiou)?
- “zdovodnenie”, ze preco zatial nie je otvorene: data vraj “vlastni” niekto iny ako NCZI, atd., atd.
- z medzinarodnych dat vieme o SR viac nez z *.gov.sk
El. schranky
k 1.6.2020 NASES aktivoval aj “pravnickym osobam, ktore nie su v obch. registri”
- formulacia vcelku zakerna, kedze stat vlastne nevie co presne su to a teda ani ktore presne su to (ake su vsetky typy organizacii, ktory typ organizacii je vedeny kde, atd.)
- UPVII sa teda pustilo do patrania po udajoch a ich cistenia
- cca 30 typov org.
- X registrov je na MV SR, pricom integracia na RPO a nasledne NASES je vcelku OK
- Y registrov ma Statisticku urad, …
- vidno, ze kvalita dat je rozna
ovplyvnuje stav aktivacie schranok:
- napr. zakonny zastupca v NASES: chyba informacia o statutaroch k cca 34k organizaciam
niekde su dokonca pravne problemy:
- napr. statutar spolocenstva vlastnikov bytov: nezapisuje sa RC -> v NASES sa neda stotoznit -> riesia v novom zakone o udajoch
Stav projektov
Dat. kanc. mala byt v 5 projektoch
- robi sa audit projektov, nie je zatial ani “stop” ani “go” (tyka sa 4 projektov v OPII)
- EVS OpenData projekt nebude, kedze paniaze sli na Min. soc. veci na riesenie pandemie (ak som dobre pochopil)
dopytovky: vid na webe (asi https://www.vicepremier.gov.sk/projekty/projekty-esif/ )
- 41 schvalene
- dalsie? posudi sa po audite
pikoska na zaver: pri odchode sme poniektori letmo pozreli spravodajstvo a tam: “razia NAKA na Urade Vlady, UPVII a NASES” - update: je tu k tomu aj vlakno: NAKA v UV, UPVII a NASESe
Debatu teda mozem nacnut (aj) tu: Specificky teda ide napr. o vektorove udaje z Katastra (napr. obrysy parciel, okresov a pod.) a ja napr. problem vidim v tom, ze CSRU v tomto vystupuje ako “zbytocna komplikacia”:
-
Uz dnes vieme (niektore) vektorove udaje Katastra spracuvat v GIS systemoch (napr. programe QGIS) vdaka tomu, ze su poskytovane cez INSPIRE sluzby (WMS, a pod.) T.j. vyhlasenie za referencne je skor len formalita, aby sa formalne mohlo zacat stotoznovanie a aby UGKK pripadne doladilo existujuce servisy (tam, kde nefunguju dost dobre resp. ak niektrore data este chybaju + pridanie metaudajov do RPI a data.gov.sk).
-
Ak by vyhlasenie udajov za referencne bolo podmienene “implementaciou v CSRU”, tak by sme si (IMHO zbytocne) pripdavali pracu navyse ohladom specificky slovenskej implementaciu postavenej na uz existujucich nadnarodnych INSPIRE standardoch a implementaciach. Urcite by trvalo by dlhsie. A tazko povedat, ci by bolo lepsie. T.j. “pridana hodnota” je nejasna.
Zaroven “definicia” CSRU v zakone nevyzera byt uplne jasna, kedze je to pojem zastresujuci X systemov/modulov/… a teda je mozne, ze na CSRU sa s vyhlasovanim vobec cakat nemusi.
Poslal som na UPVII aj ako “quick win” (vid aj Výzva ÚPVII: Zber quick winov ) a pre istotu poznacil aj sem: Covid-19 udaje · Issue #12 · OpenDataSk/data-requests · GitHub
K casti Open Data uz prislo na review: Analýza zverejňovania datasetov ústredných orgánov štátnej správy na portáli otvorených dát 2020
Je vonku draft: Open Data Publikačné Minimum pre samosprávy
Pripomienky mozno pridavat k samotnemu dokumentu. Vopred vdaka.
Seva Peto. Bohuzial som na tom stretnuti nebol a az teraz som zachytil tieto poznamky. Isto to bude treba prediskutovat na tom dalsom stretnuti aj s kolegami z UGKK SR, lebo sme zaciatkom roku s kolegami z UPVII/MIRI brainstormovali moznosti a predbezny outlook bol, ze by sme pre geozdroje mali zabezpecit konsolidaciu cez Narodne projekty zamerane na podporu INSPIRE a tym aj podporu pre dataflow geozdrojov cez ISCRSU. Dovtedy by sa dali navrhnut aj docasne riesenia, ako napriklad rozsirenim sucasnych INSPIRE sluzieb pre temu I.6 Parcely katastra nehnuteľností aj o dalsie polozky tak ako to urobili kolegovia v CR.
To znie koncepcne a rozumne. Slabou strankou je ale to, ze kedy to bude hotove a data/sluzby dostupne? Tipujem roky?
T.j. aby sme dalsie roky neboli na nule, tak ma zaujimaju aj tie “docasne riesenia”.
12.1.2021 sa konalo on-line stretnutie K9.4 . Par mojich poznamok:
uvod
plan vytvorit podskupiny:
- otvorene udaje
- referencne udaje
- moja udaje (nove)
- analyticke udaje (nove)
- legislativa (obnovene)
- datova kvalita
- datovi kuratori (obnovene)
ak su novi zaujemci o vyssie uvedene (okrem “kuratori”), mozu sa hlasit
cinnost K9.4
Open Data
2020
publikacne minimum pripravene - vid MetaIS: MetaIS
prebehli stretnutia s dat. kuratormi
novy Open Data 2.0 projekt:
- aktualny data.gov.sk vela naumoznuje
- novy projekt ma dodat novy lepsi portal
ziadane datasety / high value datasets:
- zdrziava “vybavovanie” (ci sa musi resp. moze zverejnovat a pod.)
- zdrziava tiez “ako”, kedze od napr. “dajte Kataster” k “X datasetov s konkretnou strukturou” je vcelku dlha cesta
2021
spustit Open Data 2.0
- otazka: interne MIRRI alebo VO?
- odpoved: MIRRI zistuje, ci a ako vyuzit “Slovensko IT”
- cielom je v novom rieseni co najviac vyuzit existujuci kod od EUDP
- plan spustenia: ASAP, radovo najblizsie dni
- otazka: personalne obsadenie? tot data.gov.sk aj praveze kopu veci vie a vedel, len nik v NASES nevedel inym PO poradit, co a ako pouzit => buduce personalne kapacity?
- odpoved:
- “teraz” (po zluceni MIRRI + NASES a posilneni Datovej kancenalrie na MIRRI) toto bude riesit tento team, teraz 4 ludia
- EVS projekt nebude (peniaze slo na Covid), t.j. personal bude v rezii MIRRI, prislub je este na cca 5 ludi
- plus MIRRI pri projektoch tlaci poziadavku na “15% vykonu internymi kapacitami”
- odpoved:
semanticka interoperabilita
pokracovat v podpore publikovania najziadanejsich datasetov
- k tomu sa pripoja “high value datats”, vid novu verziu PSI
- o.i. aj pokracovanim v stretnutiach z org. VS s tym, ze Dat. kancelaria MIRRI realne pomoze s prvymi krokmi pri publikovani (analyza toho, co je, navrh uvodnych krokov a struktury a pod.)
- MIRRI ma o.i. v plane zverejnit Java kod, ktory sluzi na konvertovanie dat z roznych formatov do “zverejnovacej formy”
- MIRRI pripravi aj zoznam natrojov, ktore sa na zverejnovane a menezovanie zverejnovania pozuvaju resp. mozu pouzit
- povacsinou pojde o existujuce a najma Open Source natroje pouzivane v EU
rebricky:
- SR sa v nich velmi nedari
- ale aspon sa “zrealnili” reportovane udaje → dobre vychodisko na hladanie rieseni
- vid zrejme Recenzne konanie: kDE SI Slovensko?
ziadane datasety / high value datasets
ETL:
- napr. Ministerstvo hospodarstva: vsetko maju v XLS → treba ETL nastroje (aj) v data.gov.sk
- p. Liska: MIRRI pomoze s katalogizaciou
p. Hajduch: CSRU je pred spustenim a mal by umoznovat stahovanie datasetov + nejake transformacie
- Hanecak: presne take v bledo-ruzovom ma aj data.gov.sk (od 2016) → “vyzva” pre NKIVS 2021 a MIRRI, aby sa a) nerobilo N-krat to iste, b) sa vedelo co je urobene a c) boli ludia, ktori poskytnu support k nastrojom ktore mame naimplementovane, nech sa teda aj pouzivaju
referencne udaje
2020: Register Adries
2021: ZBGIS, informacie o zarucenej konverzii, udaje k potvrdeniam o navsteve skoly
p. Suja (MV SR): k RA:
- PSC sa planuje vyhlasit za ref. udaj tohto roku
- adresny bod sa planuje vyhlasit neskor
- chyba este cca 10% adr. bodov, po doplneni zacnu vyhlasovanie
otazka: co je to referencny udaj?
- vraciame sa k starym temam, ale teda s ohladom na nedavne vetovanie navrhu ohladom vyhlasenia ref. udajov si treba ujasnit, ktore udaje chceme referecne a ktore netreba (priority a pod.)
- referencia: MetaIS
- toto teda bude tema na cinnost pre 2021: ujasnit “co” a “preco” ohladom ref. udajov
- p. Illek: ref. udaje nemaju byt o “G2G vymene vypisov” (=oversi.sk) a ale o “vymene udajov” (t.j. ktokolvek chce nieco referencovat ci validovat, ma pracovat priamo so zdroj. datami)
- p. Illek: nadalej je nedorieseny vcelku zasadny problem “identifikator fyzickej osoby”
identifikator fyzickej osoby:
- tot aj nedavno pri rieseni “autorizacia klikom” bola otazka “co dat do zaznamu o autorizacii do casti osoba”: rodne cislo? rodne cislo plus nieco? nejake cislo? ake cislo? cele meno a adresu?
- k autorizacii klikom: Komisia pre štandardy ISVS - PS2 - Bezpečnostné štandardy - #54 by hanecak
- obdobne zrejme bude temou aj pre scitanie obyvatelov
napr. MŠ SR bude potrebovat riesit “zakonny zastupcovia”:
- typicky to je rodic, ale nie vzdy → citlivy ale dolezity problem/register
- p. Illek:
- legislativa existuje uz cca 5 rokov: register splnomocneni
- MV SR ho ma realizovat
- register este neexistuje
ciselniky
2020: MZP, UGKK
2021: dalsie ciselniky od UGKK, …
analyticke udaje
projekt Konsolidovana analyticka vrstva
zladenie projektu s pripravovanym Zakonom o udajoch
priprava koncepcie vyuzivania analytickych udajov vo verejnej sprave
- navod, ako dobre vyuzivat udaje vo VS
Moje udaje
2020: priprava CIP/MOU
2021:
- spustenie CIP/MOU
- plan spristupnovania Moje udaje
koncepcne sa vzdy pocita so spristupnovanim aj pomocou Open API, aby aj 3rd party aplikacie (s povolenim uzivatela) mohli s danymi udajmi pracovat
principialne sa toto podoba na “prioritne datasety”, t.j. ze “niekto” musi povedat “toto su Moje udaje a budu sa poskytovat obcanom” + povedat “takto sa budu poskytovat”
datova kvalita
2020:
- …
- dost vela energie islo do riesenia problemov okolo aktivovania el. schranok: Dat. kancelaria riesila, kde su registre, v akom su stave, atd. tot aby NASES ako zriadovetel schranok mal relevatne udaje na zaklade ktorych zriaduje
2021:
- skolenia pre kuratorov
- doraz na ref. udaje
- budovanie automtizovanych merani dat. kvality
p. Ilek + MZP: kvalita je dolezita, kedze a) nie je to uplne jasne (co a ako) a b) nizka kvalita negativne ovplyvnuje uzitok, ktory z dat je/moze byt
aktualne sa velmi intenzivne riesi RPO
- najviac chyb je v samotnych zdrojovych registroch (RO, …)
- cast chyb je len v RPO (=zle prevzate data zo zdroj. registrov)
legislativa
2020:
- rozpracovany Zakon o udajoch
- Zakon proti byrokracii
2021:
- Zakon o udajoch + rozsirenia
- nadalej ako “maly zakon”, kedze riesi iba statnu spravu a vynechava samospravu, firmy, atd.
- Zakon proti byrokracii
- Zakon e eGovernmente
- implementacia EU regulacii: Open Data a PSI, FFoD, DGA
skolenia, komunita
skolenia, newsletter, diskusie na platofrma.slovensko.digital
hackathony s ohladom na pandemiu zatial pozastavene
Analiticka jednotka: planuju predstavit (videokonferencia a pod.) “KO” (asi som prepocul nazov)
ine
vacsina/vsetky OPII projekty maju byt spustane v najblizsich dnoch az tyzdnoch, kedze cely OPII ma jasny dead-line v 2023
projekty
Datova integracia:
- CSRU
- masivne zvysenie zapojenia organizacii
Centralna integracna platforma a Menezment osobnych udajov
- realne obcanom spristupnit niekolko desiatok “datasetov”
Konsolidovana analyticka vrstva
Open Data 2.0
Centralna API menezment platforma
- zatial caka, kvoli kapacitam Dat. kancelarie
k niektorym: uz bol riadiaci vybor => coskoro vypublikuju zapisy
NKIVS 2021
na toto nevyslo vela casu
ciele:
- mat hotove do maja
- mat koncepciu do 2030, s niekolkymi milnikmi (cca 2023, 2026 a 2030)
vychodiska:
- ma to nadvazovat na NKIVS 2016
- ma to vyhodnotit nesplnene ciele
- ma to aktualizovat uz neaktualne veci
z komentarov:
- v2021 pisu ludia, ktori neboli pri v2016 → zle
- po NKIVS 2016 boli dopracuvane “strategicke dokumenty”, ktore NKIVS 2016 doplnili pripadne poopravili → treba s nimi pocitat do buducna
- NKIVS 2008 ma lepsiu strukturu a citatelnost nez v2016 a v2021
- ciele: mnohe z cielov v2008 a v2016 nadalej nie su splnene ale nadalej su dobre a relevantne → urcite nemame vymyslat nove + …
- … ciele do r. 2030 urcite treba podlozit vyhodnotenim, ako boli plnene ciele v2016
- v2021 sa ma naozaj vyrobit rezimom “doplnit a zrevidovat v2016”, nie prepisovat
otazka: co po NKIVS 2021? budu updaty strategickych dokumentov?
- odpoved: predpoklada sa vytvorenie nadvazujucich ciastkovych kratkodobejsich planov
k NKIVS 2016 su pre data dva strategicke dokumenty:
- menezment udajov (zrejme http://www.informatizacia.sk/ext_dok-uppvii_sp_manazment_udajov_vfinal/24196c )
- otvorene udaje (zrejme http://www.informatizacia.sk/index/open_file.php?ext_dok=26035 )
otazka: datovy audit? datovy inventar, datovy katalog
- Hanecak: toto by malo sluzit ako zaklad na zmysluplny KPI typu “z tohto su tieto high value → z high value chceme X% vypublikovanych ako Open Data”
- tot aby sa to neratalo z “len nove projekty” ale naozaj “% zo vsetkych realne existujucich”
- audit treba spravit aj kvoli kybernetickej bezpecnosti, aj kvoli GDPR, t.j. nie je to samoucelne
- ref: vid Aktualizácia NKIVS 2021 - #14 by hanecak
- odpoved: (som zial nezachytil do pisanych poznamok, aj ked som sa teda pytal → kto pamatate, doplnte prosim)