MIRRI Pracovná skupina K9.4 Lepšie dáta

Tu sa medzičasom deje viacero vecí, postupne to sem nahodím.
Asi najväčšia novinka je, že sa reálne začala príprava nového zákona o údajoch. Detaily a diskusia tu: Zákon o údajoch

Zopár odrážok k ostatnému stretnutiu podskupiny “Referenčné údaje”:

  • Dátová kancelária má nového špecialistu pre kvalitu údajov - Andrej Fukas

  • KPMG dodala finálne výstupy k riadeniu kvality údajov, teraz prebieha formálne schvaľovanie na úrade, ale v podstate je to akceptované, toto je k tomu oficiálny text:

Metodické príručky ÚPVII, ktoré by mali pomôcť správcom údajov, dátovým kurátorom, resp. ostatným zodpovedným osobám nastaviť procesy manažmentu kvality údajov vo vzťahu k registrom, v rámci ktorých sú vedené a to konkrétne:

  • identifikovať biznis pravidlá voči určeným ukazovateľom dátovej kvality,
  • rozbehnúť procesy merania dátovej kvality,
  • identifikovať a riešiť problémy spôsobujúce nedostatočnú kvalitu údajov:

Metodika merania dátovej kvality vo verejnej správe

Výpočet KPI dátovej kvality pre jednotlivé inštitúcie verejnej správy

Ako zlepšiť kvalitu údajov?

Zoznam konkrétnych odporúčaní pre inštitúcie verejnej správy z ohľadom zlepšenie dátovej kvality

Návrh datasetu parametrov dátovej kvality vo verejnej správe vo formáte otvorených dát

Prezentácia prvého komplexného merania dátovej kvality vo verejnej správe

(koniec oficiálneho textu)

Tie dokumenty zväčša neuškodia ani nepomôžu. Kto chce vidieť, prečo ani svetovo špičkové konzultačné firmy nezachránia slovenský eGov, pozrite si “prezentáciu prvého komplexného hodnotenie dátovej kvality vo verejnej správe” a tam údaje za RPO - vyšlo že vo všetkých parametroch je kvalita tohto registra nad 99,7%. Haha.

Potom sme diskutovali práve o RPO a jeho známych nedostatkoch kvality údajov tohto registra. Imho toto dostať do poriadku by mala byť priorita, snáď aj väčšia ako pokračovanie reklamne ľúbivých tém quickvíťazstiev.

Viaceré ďalšie úrady, ktorých registre majú byť vyhlásené za referenčné, potom hovorili ako si to predstavujú. Obvykle sa to zaseklo na jednoznačnej identifikácii právnických osôb. Napr. fin. správa nechce plošne zverejňovať DIČ, že to je ich interný identifikátor, ale v IČOách je skrátka zatiaľ príliš veľa chýb…

Keď už sme pri tom, povedať aké “biznis pravidlá dátovej kvality” (terminológia KMPG) treba pri nejakom registri sledovať vedia najlepšie konzumenti údajov z tohto registra. Oni najlepšie vedia čo si musia odkontrolovať skôr než si údaje pustia do svojho systému. Povedzme pre to RPO.

A len tak pre zaujimavost, co su tie problemy RPO, ktore neodhalili? Na druhu stranu, je pravda, ze to hodnotenie bolo trochu simplisticke…

No veď v RPO chýba podstatná časť údajov, najmä z malých registrov. A aj to čo sa tam nahráva z OR+ŽR má podstatné problémy ak nie úplne sedí. A duplicity. A je veľká chybovosť údajov, napr. skutočné adresy. Ja viem že časť z toho sa “iba” prenáša zo zdrojových registrov, ale to ma pri hodnotení kvality vôbec nezaujíma - lebo práve na to RPO slúži, aby všetkých odtienil od detailov zdrojových reg. Pomenujme v čom je problém (ak je - a všetci hovoria že je), a potom bude lepšie vidieť čo treba robiť.

Ešte raz: skús sa na RPO pozrieť ako konzument údajov, povedzme Soc.poisťovňa. Čo potrebuješ a v akom je to stave? Kedy bude môcť SP “stotožňovať”, čiže zahodiť svoju evidenciu a nahradiť ju tým čo je v RPO? Lebo momentálne hovoria že ani náhodou, a to ani keď im to zákon prikazuje - lebo nekvalita údajov.

Mne to prišlo doslova smiešne, že všetci sa dlhodobo sťažujú na nekvalitu RPO a konzultanti si v pohode vykážu 99.X%. Veď aj kebyže nič o RPO neviem tak mi iba pri počívaní o čom sa hovorí na PS zúrivo bliká červená kontrolka.

Pozeram slide 19 a k RA a (po prestudovani detailov = o.i. napr. “V prípade 425669 záznamov
obsahuje zemepisná dĺžka hodnotu NULL (36,086%).
”) je teda vysledok pre ukazovatele RA-1 a RA-2 dost zly: 63.9%. Po InspirujmeSe (geo konferencia minuly tyzden v Tatrach) pozeral kolega podobnu metriku pre PSK [1] a vyratal, ze:

  • 68% zaznamov ma koordinaty
  • 49.9% (z celkoveho poctu) ma koordinaty v PSK

Viac by ma ale zaujimalo, nakolko automatizovane a opakovatelne toto meranie je. Lebo od teraz by bolo velmi zaujimave “kreslit casovy graf” a pozerat, ci a ktore metriky idu hore.

[1] https://data.gov.sk/dataset/adresy-podla-krajov/resource/03785168-1b0b-45e3-b6ba-be3884ada2b8

Opatrenie c. 32 v zalozke “Odporucania” sa mi velmi paci: “Zabezpečenie jednoduchšieho prístupu k datasetom potrebným pre meranie a riadenie dátovej kvality (napr. Prístupy do všetkych informačných systémom by mali byť na úrovni READ kedykoľvej. Export dát z databázy by mal byť pre zodpovedné osoby ľahšie možný a najlepšie vo formáte SQL).” NA druhu stranu, po skusenostich s data auditmy, ktore prebiehali vramci OGP mi zostava silno dufat, ze KPMG resp. UPVII bude schopne vyrazne lepsie organizaciam vysvetlit, co to presne znamena.

Potom ale trochu nechapem, preco ma “Nastavenie proaktívnych kontrol pre zdrojové systémy – kontrola bude prebiehať už pri vstupe údajov na základe definovaných technologických a procesných požiadaviek.” priotitu iba 2 zatialco “Implementácia a zabezpečenie nástroja na riadenie dátovej kvality (v súčasnosti existuje platforma Talend, ktorá je zabezpečená na úrovni PaaS služby v štátnom cloude).” ma prioritu 1.

OK, ma to niekde niekto spisane presnejsie? Chapem, ze do RA sa kope lahsie (adresne body v Afrike su vcelku jasne, to sa ani Moricom Benovskym neda vysvetlit :slight_smile: ), RPO je tazsie. Tak preto vrtam.

1 Like

A podla tychto bodov sa to mohlo dat odmerat konzultantom…

Poznamka bokom: Kedze vsetky udaje z RPO mame v nasom https://ekosystem.slovensko.digital/ a dokonca mame reportovaci tool. https://bi.ekosystem.slovensko.digital/, tak pokial niekto ma napad co vieme odmerat jednoduchym “selectom”, tak to tam v klude dajme.

Za mna z toho co o RPO viem namatkovo:

  • udaje napriec roznymi registrami (ZR a advokati a ine) maju problematicke casove prekryvy osob - nesedia od-do.
  • sem tam nejake udaje (historicke) zmiznu (nedosiel som na to podla akeho kluca) a nahradia sa novymi, kde su neni nejake osoby (konatelia, staturari) co tam boli.
  • zmeny ico a ich historicke prekryvy (toto som videl ak si spravne spominam iba par krat), nejaka firma mala rovnake ico ako ina firma co davno zanikla.
  • podiely na zakladnom imani sa dost blbo stotoznuju s osobami. aj clovek ma niekedy problem to pospajat. mam pocit, ze toto je proste zly datovy model.
  • RPO ma nejake interne unikatne ID na zaznamy, ale je to spravene velmi divne (v case pribudaju pre jednu firmu dalsie a dalsie “cez frontend nevyhladatelne zaznamy”, cize ako jednoznacny identifikator PO to rozhodne nie je pouzitelne.
1 Like

K Registru adries: pred cca. 2 mesiacmi spravil gestor tohto registra skutočne dobrú vlastnú prezentáciu stavu kvality údajov. (Ono gestori obvykle presne vedia v akom stave to majú a kde ich tlačí päta, častokrát však akoby “nebola vôľa” prezentovať si pravdu ani medzi úradmi.)
Že GPS súradnice pre veľa adresných bodov nie sú uvedené je “na počet chýb” asi najvážnejší nedostatok. Aj sa tu už rieši, najmä kvôli sčítaniu obyvateľov, ktoré by malo byť založené práve na údajoch z tohto registra. “Už” znamená, že pol roka vyjednáva MVSR a ŠÚSR, kto zaplatí tých cca.300K Eur, ktoré vraj stojí plošný komerčný nákup doplnenia týchto údajov. V slávnom OPII samozrejme na toto peniaze nie sú. :wink:
Každopádne v RA sú aj iné, subtílnejšie chyby a mal som z tej prezentácie pocit že MV ich rieši. Historicky časť problému vznikla tým, že za časť údajov RA “od ulice nižšie” zodpovedajú obce, ktoré však nedostali pokiaľ viem žiadnu priamu podporu pri napĺňaní/riešení kvality svojich údajov, iba zákonnú povinnosť. OPII/OPIS opäť nič, z toho sa platilo iba “vybudovanie” registra.

Keďže celý RA je verejne dostupná ako OpenData, kto chce môže vyrobiť aj denne merané veličiny. Tuším tie query sme aj tu na platforme niekedy písali.

Btw. k meraniu presnosti GPS súradníc by ma zaujímala suma “odchýliek bodu RA a <verejné API> geocoding bodu pre danú adresu”. Verejné API napr. google, here.com, alebo bing. Cieľ je toto mať =0.

K RPO:
no veď presne, očakával som, že ten_kto_robí_komplexný_audit, dá dokopy zmysluplné parametre ktoré je treba merať. Toto je najťažšia robota. No nevadí, ako som písal v Dátovej kancelárii je nový špecialista na kvalitu údajov, tak snáď toto preberie on a dúfam že túto diskusiu aspoň číta. Áno, pri RPO vnímam ako najbližší krok určiť sadu kritérií ktoré chceme sledovať.

Ad “opatrenie c.32” - mal som pocit že aspoň jeden úrad na týchto audítorov hľadel dosť s dešpektom a dával im najavo že veľmi spolupracovať ani nechcú.

Ad “nastavenie proaktívnych kontrol” - čistá všeobecná teória. Častokrát nejaké IT-čkarske “kontroly vstupu” nemôžu brániť zápisu do registra.

Ad “nástroj na riadenie dátovej kvality” - toto hodnotím ako čistú neschopnosť písať skripty v Unixe, alebo rozchodiť si nejaký FOSS analytický nástroj. Plus akonáhle sú v registri nejaké citlivejšie údaje - napr. OÚ, predstava že úrad celý register nakopíruje niekam vedľa kvôli analyzovaniu kvality je smiešna ilúzia, najmä keďže problémy kvality ten úrad obvykle dobre pozná. Viď. predstavy riešiteľov CSRÚ, ako sa všetky údaje nasypú na kopu a tam sa budú “opravovať”.
Alebo práve vidíme vznik zadania pre pekný eurofondový projektík.

Nieco ako:

SELECT sum(cena) FROM studie_uskutocnitelnosti WHERE text ILIKE ‘%licencie Talend%’

? :slight_smile: :confused:

Relevantne:

Na UPPVII dnes bolo dalsie zasadnutie K9.4 . Program:

  1. Zhrnutie činnosti Pracovných skupín a Dátovej kancelárie za rok 2019
    • Dátová kvalita (meranie dátovej kvality na rezortoch)
    • Referenčné údaje (plán vyhlasovania referenčných údajov)
    • Otvorené údaje (úlohy, rebríčky; EU regulácia OD a PSI, FFoD)
    • Moje údaje (technologické riešenie na otestovanie konceptu)
    • Legislatíva (Zákon o údajoch, Stop byrokracii,…)
    • Podujatia
  2. Informácia o stave národných projektov v gescii Dátovej kancelárie a dopytových výzvach v oblasti údajov
  3. Prerokovanie návrhov na vyhlásenie základných číselníkov a referenčného registra (v prílohe pozvánky):
    • Návrh na vyhlásenie referenčného registra adries
    • Návrh na vyhlásenie základného číselníka Časť obce
    • Návrh na vyhlásenie základných číselníkov Úradu geodézie, kartografie a katastra
  4. Priority na rok 2020
  5. Iné, navrhnite

Prilohy:

Par mojich poznamok:

Zhrnutie činnosti Pracovných skupín a Dátovej kancelárie za rok 2019

dat. kancelaria vznikla cca 2019/03 v pocte cca 5, dnes ich je 10

Dátová kvalita (meranie dátovej kvality na rezortoch)

zakl. vyznam/ucel/ciel: zavedenie exaktnych meratelnych ukazovatelov

zodpovedni su najma spravcovia registrov

  • UPPVII je “organ vedenia”
  • vid z. 95/2019 a novo pripravovany zakon o udajoch

aktualne vystupy su na stranke UPVII

  • pripravovala KPMG
  • obsahuje: navody, pilotne merania, …

merania sa budu/maju robit aj opakovane, aby bolo mozne hodnotit dopad vykonanych opatreni

pilotuju na cca 20 dat. zdrojoch/OVM

Referenčné údaje (plán vyhlasovania referenčných údajov)

narazili o.i. na leg. obmedzenia:

  1. UPPVII moze reagovat iba na navrhy predkladane spravcami, nepredklada sam
    • ale ziadne OVM sa zatial neprihlasilo same od seba
  2. ref. udaje “zverejnovane/poskytovane” cez CSRU: niektore “poskytnutia” su real-time, t.j. dopyt na konkretnu polozku, takze ziaden dataset, cize neexistuje ziadny uceleny zaznam o tom, kedy aka hodnota plati(-la)

plan vyhlasovania:

  • RA
  • nedopatky na daniach a clach
  • nedplatky soc. poist.

bariery pri vyhlasovani: nizka kvalita zdroj. udajov

  • “pikoska”: MS prezentovalo ze udaje o skl. odchadzke su ba 99%, neskor ale nedostatocmu kvalitu pouzili ako argument pri pomalom vyhlasovani prisluchajuceho ref. registra

zakon proti byrokracii:

  • zajra (18.12.2019) ide na vladu navrh na dasich 9 vypisov
  • viazu sa na to urcite data:
    • reg. upadcov
    • reg. hosp. zvierat
    • projemcovia min. st. pomoci

plany na 2021-2022: cca 200 navrhov/napadov

  • UDZS, ZVJS, UV SR, …
  • napr. ZA a PO VUC planuju rozne registre, ale ostatne VUC nie - mierne otazne, kedze by chybali udaje za ostanych 6 VUC
  • pri niektorych planoch chyba predstava, komu by to na co bolo: vcely, krmiva, …

otazka zucastneneho: zislo by sa poskytnut zoznam projektov, kedze mnohe slubuju nejake data

  • preco:
    • napr. MZP potrebuje vyhodnotit prekryv s INSPIRE
    • samotne UPPVII tiez vyhodnocovalo a bude vyhodnocovat urcite atrubuty projektov
    • MNO sa tiez radi pozru, vyhodnotia, porovnaju, …
  • MetaIS je to miesto, kde su resp. maju byt dostupne dokumenty o schvalenych projektoch, o.i. kvoli analyze/kontrole, ze kto ci slubil
    • schvalene projekty maju byt zverejnene uz dnes, bez potreby prihlasenia
    • Datalab (a.k.a. datova kancelaria UPPVII) uz ma tabulku/analyzu projektov (cca 30) za prve kolo schvalovania, posnazia sa zverejnit

vyzvy/financovanie: financie uz su takmer vycerpane

Ciselniky

doplnok k tomu, co je v casti “plan vyhlasovania” (vid vyssie)

o.i. katalogizovali udaje o spravcoch a vytipovavali zoznam ref. ciselnikov

vztah. s kvalitou: aby ref. udaje boli zadavane do registrov podla ciselnikov (t.j. nie “free style” ako jezial caste dnes)

Otvorené údaje (úlohy, rebríčky; EU regulácia OD a PSI, FFoD)

plnenie NKIVS cielov:

  • niektore metriky su “sialene”: pocet stiahnuti, …
  • zatial sa teda pracuje na metodike vykazovania
  • dovolil som si pripomenut, ze:
    • pre komunitu su vyznamnejsie KPI typu “v top 5 rebricka EUDP”, kedze to ma zmysluplnejsiu a prepracovanejsiu metodiku
    • a naopak napr. pocty stiahnuti datasetov povazujeme za bezvyznamne (a nepamatam si, kto to tam pridal)
    • plus ze KPI su z 2016, kedy boli velke ambicie, lebo:
      1. “zhruba dalsia miliarda na IT”
      2. dokonca data a Open Data boli (a su) jednou z priorit programoveho obdobia a IT balika eurofondov
      3. (v tom casebolo) 4-7 rokov na implementaciu

v EU rebrickoch sme 4. od konca (vs. ciel “prva 5”)

novy akcny plan OGP:

  • USV ROS “odstupuje” od Open Data …
  • … “vedenie” prebera “Strategia NASES” (dokument)

publ. minumum pre st. spravu bude UPPVII vypracuvat od 2020/01

  • publ. minimum pre samospravu “bolo skusene”, nevyslo

EU regulacia:

  • nova PSI: “high value” datasety

Moje údaje (technologické riešenie na otestovanie konceptu)

vystupy:

  1. koncept
  2. OpenAPI standard
    • autorizacia:
      a) vo vlastnej rezii alebo
      b) cez CSRU; autorizaciu overuje vo vysledku IAM (cez “mobile ID” od DEUS)
  3. proof of concept aplikacia
    • v uzavretom rezime je Datapp apka pre Android uz dnes v AppStore
      • je to “vedlajsi produkt” na otestovanie hlavneho vystupu: OpenAPI
      • budu zdrojaky?
        • budu (v zmysle platneho zakona o ISVS)
        • uz dnes by na Datalab mala byt starsia test verzia

63 schvalenych nar. projektov -> UPVII sa im bude venovat z pohladu spristupnovania osob. udajov

par technickych hintov:

  • DEUS: mob. ID
  • Digi.me: sifrovany prenos

Legislatíva (Zákon o údajoch, Stop byrokracii,…)

zakon o udajoch

finalizuju MPK k zakonu o udajoch

upravena verzia pojde este raz do MPK

  • o.i. teda z toho bude “zakonnik udajov”
  • “presuvaju” don niektore “polozky” z inych zakonov:
    • ref. registre
    • zrejme neskor Open Data (t.j. buduca transpozicia novej PSI bude zrejme v tomto nmvom zakone)
  • vacsie previazanie s GDPR: analyticke jednotky, opravnenia a povinnosti dat. kuratorov, moje udaje, …

zakon proti byrokracii

bezi 3. vlna

uspory kol 1 a 2 boli vycislene na 8M€ rocne, uspory 3. kola su odhadnute na 18M€

dalsie vlny: nadalej ist po zivotnych situaciach a pocetnostiach

ale: napr. RFO je uz rok referecny, mnohe urady vsak nadalej nestotoznuju a pytaju potvrdenia od obcanov

naraza sa aj na technologicke limity:

  • napr. system dochodkovych davok je z r. 1975 (niesom si isy, ci som dobre pocul) => pre zdielanie sa musi
    spravit “udelatko”
  • inde maju “distribuovanu DB” na baze FoxPro a emailov

Informácia o stave národných projektov v gescii Dátovej kancelárie a dopytových výzvach v oblasti údajov

vyslo na to uz len poslednych cca 3-5 minut

dopytove vyzvy mali uspech, o.i. kvoli vzorovym projektom

UPPVVI ma 4 projekty:

  • Open Data 2.0 schvaleny
  • EVS Open Data projekt pozastavneny (niekde na MV SR)

pripravuju hackathony

Prerokovanie návrhov na vyhlásenie základných číselníkov a referenčného registra (v prílohe pozvánky):

Návrh na vyhlásenie základných číselníkov Úradu geodézie, kartografie a katastra

11 ciselnikov: udaje o pozemku, stavbe, …

priprava na neskorsie vyhlasenie ref. registra parciel

Návrh na vyhlásenie základného číselníka Časť obce

sucast RA

tiez priprava na neskorsie vyhlasenie RA ako ref. registra

vid navrh

udrzba: ocakava sa cca 5 zmien rocne

  1. MV SR, v MetaIS
    • hlavne miesto zverejnia
    • uz je dostupny dnes, na login, v test. verzii
  2. Stat. Urad, v ich systeme

dolezite su polozky prislusnosti k obci, cez SK NUTS kody - tot aby bolo jasne, kam ktora cast patri

vtah tohto ciselnika k registru zakladnych sidelnych jednotiek (SJ) v gescii MZP?

  • neriesili, lebo SJ nie je spravna jednotka
  • SJ dnes nema “pravne silne” postavenie

Návrh na vyhlásenie referenčného registra adries (RA)

referencne nebudu vsetky “stlpce”

  • typicky sa vynechavaju koordinaty, kedze ich vela chyba, us nespravne a pod.

su tam aj URI: kazdy adresny bod bude mat jednoznacny identifikator

  • o.i. budu pouzite pri stotoznovani

ocakacane vyhlasenie registra:

  • odhadom 2020/01-02
    • po KS a MPK

Priority na rok 2020

nevysiel cas

1 Like

asi zrejme tu: https://metais.vicepremier.gov.sk/studia/list

Tot tu, ak si dobre pamatam: https://www.slovensko.sk/_img/CMS4/strategia_otvorene_udaje.pdf

Resp. historicka referencia aj tu: OpenData stratégia - pripomienkovanie

Dnes na tom pracuje MNO Alvaria, vid napr. https://www.alvaria.sk/chybajuce-publikacne-open-data-minimum/

Nemile, kedze EVS cast ma zabezpecit ludi a IT cast “Open Data 2.0” ma tym ludom zabezpecit adekvatne vybavenie. Len teda ako ta IT cast vie, co bude adekvatne pre ludi, ktori pridu neskor a teda nemaju sancu sa v IT projektu vyjadrit?

Tot use-case na repozitar zdrjovych kodov (aktualne pripravovany projekt “Open Data 2.0”). Ale zase NASES take zvladol uz v minulosti, dokonca pocas vyvoja, vid:

28.1.2020 sa na ÚPVII konalo stretnutie “PS Referenčné údaje”. (Kedze v tom zacinammat chaos, lebo o.i. nepojuzivaju MetaIS ale len maily s “vela ludi v TO:”, tak to dam zatial sem.)

Ohlasena agenda:

  1. Informácia o aktuálnom stave návrhu Zákona o údajoch a o zahrnutí témy “Referenčné údaje” do návrhu zákona

    1. Informácia o aktuálnom procese pri vyhlasovaní Registra adries za referenčný register a o nových číselníkoch
  2. Diskusia k vyhláseniu vybraných údajov katastra nehnuteľností ako referenčných údajov a to za nasledovné oblasti:

    a) Geografické názvy nesídelných objektov

    b) Geografický priebeh administratívnych hraníc, Hranice katastrálneho územia (KÚ), kraja, okresu, obce

    c) Údaje o nehnuteľnostiach: Parcelné číslo reg. C a reg. E, druh pozemku reg. C, BPEJ

    d) Geometrické a polohové určenie parciel reg. C a reg. E (katastrálna mapa a mapa určeného operátu)

Poznamky nemam, nestihol som sa zucastnit. Zapis neviem ci je resp. ci bude.

Dna 9.6.202 sa konalo dalsie stretnutie PS K9.4 Lepsie Data. Par mojich poznamok:

Administrativne informacie

UPVII -> MIRRI, ICO ostava

dalsie stretnutia: on-line?

  • chcu testovat mix model, kedy X ludi je fyzicky pritomnych, Y bude “remote”
  • hladaju sa odporucania vhodne na tech. riesenie (kludne napiste aj sem na platforme, kto viete)

novi kolegovia:

  • projekt (asi EVS) sa rozbehol, 10 pozicii obdadenych, 3 su este volne -> hladaju sa zaujemci (opat, kludne piste aj sem na platorme, posunieme)
  • temy: datova analytika, architektura/modelovanie udajov, …
  • platova trieda: najvyssia

Zhrnutie cinnosti resp. stav Datovej kancelarie za 2020

Datova kvalita

robia sa pilotne merania datovej kvality (DQ) na X vybratych IS (vzdy jeden IS za jeden rezort)

  • pri kazdom merani sekunduje/spolupracuje aj Dat. kanc. UPVII
  • vysledky: do cca 2-3 mesiacov
  • feedback nateraz viazne

priebezne pribudaju hodnotiace spravy, vid https://datalab.digital/hodnotiace-spravy/

zistenia posluzia pri priprave noveho zakona o udajoch (tot aby zakon zohladnoval prax)

DQ suvisi s vyhlasovanim ref. udajov (tie musia byt kvalitne skor, nez sa vyhlasia)

Referencne udaje

vyhlasenie novych ref. udajov:

plan dalsieho vyhlasovania:

  • priorita: vybrane udaje z Katastra
  • udaje, ktore budu priebezne pribudat v CSRU
  • prijemcovia st. pomoci
  • nedoplatky: uz boli skoro spristupnene, ale kvoli korone existuju odsunute platby a kedze terminy sa posuvali a Soc. p. nestiha posudzovat, udaje maju “znizenu vierohodnost”, preto nateraz pozastavili export do CSRU a teda aj vyhlasovanie
  • info o ziakoch a studentoch

projekt datovej integracie meska

pozor pre dat. kuratorov: do roka po vyhlaseni ref. udajov treba spravit stotoznenie

  • t.j. teraz uz treba pracovat na stotoznovani fyz. adries voci RA!!!

specialna “vyzva”: ako vyhlasit aj vektorove data Katastra za referencne ked CSRU vektorove udaje nepodporuje?

  • vraj vyhlasit ref. udaje bez CSRU “sa neda”
  • debata o tomto bude na dalsom stretnuti

robi sa analyza procesov okolo zivotnej situacie narodenie dietata (pred porodom): zrejme prvy krat, kedy je cielom nie len preklopit papierove procesy na formulare, ale aj navrhnut proces optimalne, aj pre obcanov

  • neskor z toho (=procesu) maju byt aj data
  • v Nemecku riesili “iba” dane a este jednu agendu a trvalo im to 5 rokov
  • padol navrhli zriadit k tomuto specialnu PS
  • inak sme (ako clenovia PS) samozrejme radi, ze a) UPPVII toto riesi a b) ze nam o tom UPPVII povedalo

Zakladne ciselniky

novo vyhlasene:

  • cast obce
  • klasifikacia nehnutelnosti

(vid potom aj https://metais.vicepremier.gov.sk/codelists/publiclist?page=1&count=20&sorting[code]=desc )

tesne pred dokoncenim:

  • katalog odpadov

rozpracovane:

  • regulovane povolania,
  • ucel budovy

alokuju uz aj URI

vystupy pojdu na PS Ref. udaje a potom PS1

Zakon o udajoch

kvoli volbam a MPK dost prepracovali

pojde do MPK opat

ciatocne zasiahne aj el. schranky, obc. zakonnik, …

suvisi aj s GDPR, kedze UPVII / CSRU bude spracuvat vela dat

planovany termin ucinnosti: k 1.1.2021

  • PS dostane text o par tyzdnov, po schvaleni vedenim UPVII

v buducnosti by sucastou vyhlasky/zakona malo byt aj publikacne minimum pre statnu spravu

Otvorene udaje

publikacne minimum st. spravy: poslu navrh, do 2 tyzdnov

high-value datasets:

  • EC uzatvara konzultaciu

rebricky resp. uniestnenie SR v nich:

  • DESI, … - povacsinou sme na konci
  • co spravit, aby to malo pre obcanov zmysel a aj aby to pomohlo zlepsit umiestnenie?

opatovne sa mapuje “datovy inventar” (znamy aj ako “nulty dataset”, t.j. zoznam IS a udajov v nich), aby bol presny podklad pre dalsie debaty o tom zverejnovani

Open Data je vcelku vysadne spominane v prog. vyhlaseni Vlady

konkretny podnet: Covid-19 data z NCZI (per okres, s historiou)?

  • “zdovodnenie”, ze preco zatial nie je otvorene: data vraj “vlastni” niekto iny ako NCZI, atd., atd.
  • z medzinarodnych dat vieme o SR viac nez z *.gov.sk

El. schranky

k 1.6.2020 NASES aktivoval aj “pravnickym osobam, ktore nie su v obch. registri

  • formulacia vcelku zakerna, kedze stat vlastne nevie co presne su to a teda ani ktore presne su to (ake su vsetky typy organizacii, ktory typ organizacii je vedeny kde, atd.)
  • UPVII sa teda pustilo do patrania po udajoch a ich cistenia
    • cca 30 typov org.
    • X registrov je na MV SR, pricom integracia na RPO a nasledne NASES je vcelku OK
    • Y registrov ma Statisticku urad, …
    • vidno, ze kvalita dat je rozna

ovplyvnuje stav aktivacie schranok:

  • napr. zakonny zastupca v NASES: chyba informacia o statutaroch k cca 34k organizaciam

niekde su dokonca pravne problemy:

  • napr. statutar spolocenstva vlastnikov bytov: nezapisuje sa RC -> v NASES sa neda stotoznit -> riesia v novom zakone o udajoch

Stav projektov

Dat. kanc. mala byt v 5 projektoch

  • robi sa audit projektov, nie je zatial ani “stop” ani “go” (tyka sa 4 projektov v OPII)
  • EVS OpenData projekt nebude, kedze paniaze sli na Min. soc. veci na riesenie pandemie (ak som dobre pochopil)

dopytovky: vid na webe (asi https://www.vicepremier.gov.sk/projekty/projekty-esif/ )

  • 41 schvalene
  • dalsie? posudi sa po audite

pikoska na zaver: pri odchode sme poniektori letmo pozreli spravodajstvo a tam: “razia NAKA na Urade Vlady, UPVII a NASES” - update: je tu k tomu aj vlakno: NAKA v UV, UPVII a NASESe

3 Likes

Debatu teda mozem nacnut (aj) tu: Specificky teda ide napr. o vektorove udaje z Katastra (napr. obrysy parciel, okresov a pod.) a ja napr. problem vidim v tom, ze CSRU v tomto vystupuje ako “zbytocna komplikacia”:

  1. Uz dnes vieme (niektore) vektorove udaje Katastra spracuvat v GIS systemoch (napr. programe QGIS) vdaka tomu, ze su poskytovane cez INSPIRE sluzby (WMS, a pod.) T.j. vyhlasenie za referencne je skor len formalita, aby sa formalne mohlo zacat stotoznovanie a aby UGKK pripadne doladilo existujuce servisy (tam, kde nefunguju dost dobre resp. ak niektrore data este chybaju + pridanie metaudajov do RPI a data.gov.sk).

  2. Ak by vyhlasenie udajov za referencne bolo podmienene “implementaciou v CSRU”, tak by sme si (IMHO zbytocne) pripdavali pracu navyse ohladom specificky slovenskej implementaciu postavenej na uz existujucich nadnarodnych INSPIRE standardoch a implementaciach. Urcite by trvalo by dlhsie. A tazko povedat, ci by bolo lepsie. T.j. “pridana hodnota” je nejasna.

Zaroven “definicia” CSRU v zakone nevyzera byt uplne jasna, kedze je to pojem zastresujuci X systemov/modulov/… a teda je mozne, ze na CSRU sa s vyhlasovanim vobec cakat nemusi.

Poslal som na UPVII aj ako “quick win” (vid aj Výzva ÚPVII: Zber quick winov ) a pre istotu poznacil aj sem: https://github.com/OpenDataSk/data-requests/issues/12

K casti Open Data uz prislo na review: Analýza zverejňovania datasetov ústredných orgánov štátnej správy na portáli otvorených dát 2020

Je vonku draft: Open Data Publikačné Minimum pre samosprávy

Pripomienky mozno pridavat k samotnemu dokumentu. Vopred vdaka.

Seva Peto. Bohuzial som na tom stretnuti nebol a az teraz som zachytil tieto poznamky. Isto to bude treba prediskutovat na tom dalsom stretnuti aj s kolegami z UGKK SR, lebo sme zaciatkom roku s kolegami z UPVII/MIRI brainstormovali moznosti a predbezny outlook bol, ze by sme pre geozdroje mali zabezpecit konsolidaciu cez Narodne projekty zamerane na podporu INSPIRE a tym aj podporu pre dataflow geozdrojov cez ISCRSU. Dovtedy by sa dali navrhnut aj docasne riesenia, ako napriklad rozsirenim sucasnych INSPIRE sluzieb pre temu I.6 Parcely katastra nehnuteľností aj o dalsie polozky tak ako to urobili kolegovia v CR.

1 Like

To znie koncepcne a rozumne. Slabou strankou je ale to, ze kedy to bude hotove a data/sluzby dostupne? Tipujem roky?

T.j. aby sme dalsie roky neboli na nule, tak ma zaujimaju aj tie “docasne riesenia”.

12.1.2021 sa konalo on-line stretnutie K9.4 . Par mojich poznamok:

uvod

plan vytvorit podskupiny:

  • otvorene udaje
  • referencne udaje
  • moja udaje (nove)
  • analyticke udaje (nove)
  • legislativa (obnovene)
  • datova kvalita
  • datovi kuratori (obnovene)

ak su novi zaujemci o vyssie uvedene (okrem “kuratori”), mozu sa hlasit

cinnost K9.4

Open Data

2020

publikacne minimum pripravene - vid MetaIS: Publikačné minimim orgánu štátnej správy (MINPUB-DCATSK) - PS1 - dátové štandardy - Confluence

prebehli stretnutia s dat. kuratormi

novy Open Data 2.0 projekt:

  • aktualny data.gov.sk vela naumoznuje
  • novy projekt ma dodat novy lepsi portal

ziadane datasety / high value datasets:

  • zdrziava “vybavovanie” (ci sa musi resp. moze zverejnovat a pod.)
  • zdrziava tiez “ako”, kedze od napr. “dajte Kataster” k “X datasetov s konkretnou strukturou” je vcelku dlha cesta

2021

spustit Open Data 2.0

  • otazka: interne MIRRI alebo VO?
    • odpoved: MIRRI zistuje, ci a ako vyuzit “Slovensko IT”
  • cielom je v novom rieseni co najviac vyuzit existujuci kod od EUDP
  • plan spustenia: ASAP, radovo najblizsie dni
  • otazka: personalne obsadenie? tot data.gov.sk aj praveze kopu veci vie a vedel, len nik v NASES nevedel inym PO poradit, co a ako pouzit => buduce personalne kapacity?
    • odpoved:
      • “teraz” (po zluceni MIRRI + NASES a posilneni Datovej kancenalrie na MIRRI) toto bude riesit tento team, teraz 4 ludia
      • EVS projekt nebude (peniaze slo na Covid), t.j. personal bude v rezii MIRRI, prislub je este na cca 5 ludi
      • plus MIRRI pri projektoch tlaci poziadavku na “15% vykonu internymi kapacitami”

semanticka interoperabilita

pokracovat v podpore publikovania najziadanejsich datasetov

  • k tomu sa pripoja “high value datats”, vid novu verziu PSI
  • o.i. aj pokracovanim v stretnutiach z org. VS s tym, ze Dat. kancelaria MIRRI realne pomoze s prvymi krokmi pri publikovani (analyza toho, co je, navrh uvodnych krokov a struktury a pod.)
  • MIRRI ma o.i. v plane zverejnit Java kod, ktory sluzi na konvertovanie dat z roznych formatov do “zverejnovacej formy”
  • MIRRI pripravi aj zoznam natrojov, ktore sa na zverejnovane a menezovanie zverejnovania pozuvaju resp. mozu pouzit
    • povacsinou pojde o existujuce a najma Open Source natroje pouzivane v EU

rebricky:

ziadane datasety / high value datasets

ETL:

  • napr. Ministerstvo hospodarstva: vsetko maju v XLS -> treba ETL nastroje (aj) v data.gov.sk
  • p. Liska: MIRRI pomoze s katalogizaciou

p. Hajduch: CSRU je pred spustenim a mal by umoznovat stahovanie datasetov + nejake transformacie

referencne udaje

2020: Register Adries

2021: ZBGIS, informacie o zarucenej konverzii, udaje k potvrdeniam o navsteve skoly

p. Suja (MV SR): k RA:

  • PSC sa planuje vyhlasit za ref. udaj tohto roku
  • adresny bod sa planuje vyhlasit neskor
    • chyba este cca 10% adr. bodov, po doplneni zacnu vyhlasovanie

otazka: co je to referencny udaj?

  • vraciame sa k starym temam, ale teda s ohladom na nedavne vetovanie navrhu ohladom vyhlasenia ref. udajov si treba ujasnit, ktore udaje chceme referecne a ktore netreba (priority a pod.)
  • toto teda bude tema na cinnost pre 2021: ujasnit “co” a “preco” ohladom ref. udajov
  • p. Illek: ref. udaje nemaju byt o “G2G vymene vypisov” (=oversi.sk) a ale o “vymene udajov” (t.j. ktokolvek chce nieco referencovat ci validovat, ma pracovat priamo so zdroj. datami)
  • p. Illek: nadalej je nedorieseny vcelku zasadny problem “identifikator fyzickej osoby”

identifikator fyzickej osoby:

napr. MŠ SR bude potrebovat riesit “zakonny zastupcovia”:

  • typicky to je rodic, ale nie vzdy -> citlivy ale dolezity problem/register
  • p. Illek:
    • legislativa existuje uz cca 5 rokov: register splnomocneni
    • MV SR ho ma realizovat
    • register este neexistuje

ciselniky

2020: MZP, UGKK

2021: dalsie ciselniky od UGKK, …

analyticke udaje

projekt Konsolidovana analyticka vrstva

zladenie projektu s pripravovanym Zakonom o udajoch

priprava koncepcie vyuzivania analytickych udajov vo verejnej sprave

  • navod, ako dobre vyuzivat udaje vo VS

Moje udaje

2020: priprava CIP/MOU

2021:

  • spustenie CIP/MOU
  • plan spristupnovania Moje udaje

koncepcne sa vzdy pocita so spristupnovanim aj pomocou Open API, aby aj 3rd party aplikacie (s povolenim uzivatela) mohli s danymi udajmi pracovat

principialne sa toto podoba na “prioritne datasety”, t.j. ze “niekto” musi povedat “toto su Moje udaje a budu sa poskytovat obcanom” + povedat “takto sa budu poskytovat”

datova kvalita

2020:

  • dost vela energie islo do riesenia problemov okolo aktivovania el. schranok: Dat. kancelaria riesila, kde su registre, v akom su stave, atd. tot aby NASES ako zriadovetel schranok mal relevatne udaje na zaklade ktorych zriaduje

2021:

  • skolenia pre kuratorov
  • doraz na ref. udaje
  • budovanie automtizovanych merani dat. kvality

p. Ilek + MZP: kvalita je dolezita, kedze a) nie je to uplne jasne (co a ako) a b) nizka kvalita negativne ovplyvnuje uzitok, ktory z dat je/moze byt

aktualne sa velmi intenzivne riesi RPO

  • najviac chyb je v samotnych zdrojovych registroch (RO, …)
  • cast chyb je len v RPO (=zle prevzate data zo zdroj. registrov)

legislativa

2020:

  • rozpracovany Zakon o udajoch
  • Zakon proti byrokracii

2021:

  • Zakon o udajoch + rozsirenia
    • nadalej ako “maly zakon”, kedze riesi iba statnu spravu a vynechava samospravu, firmy, atd.
  • Zakon proti byrokracii
  • Zakon e eGovernmente
  • implementacia EU regulacii: Open Data a PSI, FFoD, DGA

skolenia, komunita

skolenia, newsletter, diskusie na platofrma.slovensko.digital

hackathony s ohladom na pandemiu zatial pozastavene

Analiticka jednotka: planuju predstavit (videokonferencia a pod.) “KO” (asi som prepocul nazov)

ine

vacsina/vsetky OPII projekty maju byt spustane v najblizsich dnoch az tyzdnoch, kedze cely OPII ma jasny dead-line v 2023

projekty

Datova integracia:

  • CSRU
  • masivne zvysenie zapojenia organizacii

Centralna integracna platforma a Menezment osobnych udajov

  • realne obcanom spristupnit niekolko desiatok “datasetov”

Konsolidovana analyticka vrstva

Open Data 2.0

Centralna API menezment platforma

  • zatial caka, kvoli kapacitam Dat. kancelarie

k niektorym: uz bol riadiaci vybor => coskoro vypublikuju zapisy

NKIVS 2021

na toto nevyslo vela casu

ciele:

  • mat hotove do maja
  • mat koncepciu do 2030, s niekolkymi milnikmi (cca 2023, 2026 a 2030)

vychodiska:

  • ma to nadvazovat na NKIVS 2016
  • ma to vyhodnotit nesplnene ciele
  • ma to aktualizovat uz neaktualne veci

z komentarov:

  • v2021 pisu ludia, ktori neboli pri v2016 -> zle
  • po NKIVS 2016 boli dopracuvane “strategicke dokumenty”, ktore NKIVS 2016 doplnili pripadne poopravili -> treba s nimi pocitat do buducna
  • NKIVS 2008 ma lepsiu strukturu a citatelnost nez v2016 a v2021
  • ciele: mnohe z cielov v2008 a v2016 nadalej nie su splnene ale nadalej su dobre a relevantne -> urcite nemame vymyslat nove + …
  • … ciele do r. 2030 urcite treba podlozit vyhodnotenim, ako boli plnene ciele v2016
  • v2021 sa ma naozaj vyrobit rezimom “doplnit a zrevidovat v2016”, nie prepisovat

otazka: co po NKIVS 2021? budu updaty strategickych dokumentov?

  • odpoved: predpoklada sa vytvorenie nadvazujucich ciastkovych kratkodobejsich planov

k NKIVS 2016 su pre data dva strategicke dokumenty:

otazka: datovy audit? datovy inventar, datovy katalog

  • Hanecak: toto by malo sluzit ako zaklad na zmysluplny KPI typu “z tohto su tieto high value -> z high value chceme X% vypublikovanych ako Open Data”
    • tot aby sa to neratalo z “len nove projekty” ale naozaj “% zo vsetkych realne existujucich”
    • audit treba spravit aj kvoli kybernetickej bezpecnosti, aj kvoli GDPR, t.j. nie je to samoucelne
    • ref: vid Aktualizácia NKIVS 2021 - #14 by hanecak
  • odpoved: (som zial nezachytil do pisanych poznamok, aj ked som sa teda pytal -> kto pamatate, doplnte prosim)
2 Likes