ÚPVII Pracovná skupina K9.4 Lepšie dáta

Oficiálny, t.j. schválený dokument SP Otvorené údaje je (aj) tu:

https://drive.google.com/open?id=0B9iFnMOIzlqNaTk0U29sRkE4UW1KbHVtY2QxT1JzUHp5VHFj

viď.

Vcera (20.11.2018) bolo po dlhsej vyluke dalsie stretnutie K9.4 . Vseobecnou temou bol najme “stav” a “co dalej?” O.i. boli slubene riadne oficialne zapisy, ale pre istotu par mojich poznamok:

Buducnost PS:

  • vedenie prebera p. Kodydek, pomaha p. Andrejkovic
  • z pohladu NKIVS uz PS svoj ucel splnila, ale …
  • … UPPVII vidi dalsie fungovanie PS ako uzitocne, v spolupraci s ich novovytvorenou datovou kancelariou (vid nizsie)

Datova kancelaria UPPVII:

  • obsadenych je uz 7 pozicii z 13 (kto ma zaujem o zostavajuce, hlaste sa)
  • na stretnuti PS boli predstaveni 3 zo 7 clenov d.k.
  • hlavny scope:
    • 1x a dost resp. zdielanie ref. udajov
    • data patria lucom: My Data, Open Data
    • analyticke vyuzivanie udajov
  • dalsi scope:
    • kvalita dat
    • zakon o udajoch
    • regulacia
    • vzdelavanie a komunikacia
  • predstava spoluprace d.k. + K9.4: prejednavat stav a plany
  • prve kroky:
    • zakon o udajoch
    • My Data
    • Open Data
    • dopytove vyzvy
    • transpozicia novo doplnenej PSI (doplnana ?-2018, transpozicia: 2019)

Zakon o udajoch:

  • uloha OGP
  • hlavnou motivaciou je, ze stale chyba “jeden pan” pre danu temu
  • mal byt do konca 2018, nestiha sa, posunute na 2019
    • pre 2019 priorita
  • aktualne prve kroky:
    • dokumentovanie problemovych oblasti
    • participacia: plan odhadom 80 ludi z roznych sfer (VS, NGO, firmy, …)
    • o.i. teda aj analyza, ze ci jeden novy zakon alebo novelizacia X existujucich zakonov

Dopytova vyzva k Open Data a Memezment udajov:

  • stav k 15.11.: pre konkretne tuto temu prijate 4 ziadosti, vsetko za radovo miliony €
    • MZV SR (v realizacii/schvlovani je najdalej)
    • MD SR: ISV
    • NASES
    • Agentura pre podporu vyskumu a vyvoja (najnovsia ziadost)
    • (zatial ziadne “male zlepsenia”)
  • t.j. hybe sa, ale nie je to uplne to, co by sme chceli
  • co dalej:
    • zjednodusenia (vzorove dokumenty, zjednodusene dokumenty)
    • mozno separatna vyzva pre male projekty (za radovo desat ci stotisice)

Dalsie kroky v K9.4:

  • potvrdit clenstvo: kto nadalej planuje participovat
  • zozbiertat dalsie navrhy tem pre PS
    • nadviazat na predchadzajuce tabulky uloh (vid. napr. ÚPVII Pracovná skupina K9.4 Lepšie dáta )
    • skonsolidovat “zoznamy datasetov” (planovanych, rozpracovanych, existujucich, chcenych, …) na jedno miesto, aby sa s tym dalo ucelene pracovat
  • Open Data metodiky

Keďže záber pracovnej skupiny je veľký, aby sa dalo sústrediť na konkrétne úlohy, vzniknú tematické “podskupiny”, ktoré sa budú schádzať a pracovať podľa potreby a môže sa do nich zapojiť v zásade každý kto má záujem (nemusí byť formálne členom PS).
Prvá takáto podskupina je pre tému “zákon o údajoch”. Viesť ju bude Milan Andrejkovič, ktorý prisľúbil maximálnu otvorenosť. Jej cieľ je daný úlohou “predložiť na rokovanie vlády zákon o údajoch”, ale ja dúfam že to bude niečo zmysluplnejšie, napr. prebrať stav legislatívneho pokrytia a potrieb pre všetky veci týkajúce sa riadenia údajov.
Kto má záujem byť v tejto podskupine, hláste sa Milanovi, mailto:Milan.Andrejkovic2@minv.sk .

Ďalšie podskupiny, ktoré pravdepodobne vzniknú:

  • OpenData - primárne pre dátových kurátorov
  • dopytová výzva Manažment údajov - pomoc so zapojením sa do výzvy
  • My Data - vytvoriť k tomu potrebné metodiky atď. aby z toho aj niečo bolo
  • ref. registre a 1x a dosť

Ahojte,

dovoľte mi pár bodov:

  1. Od decembra už nerobím v Datalane, ale budem pôsobiť mimo SR. Hovorím to v malej nádeji, že snáď to pomôže linked data na slovensku (aby som nebol podozrievaný že úmyslom je zabetónovanie Datalanu v tejto oblasti). Za všetky veci ,ktoré sa dostali do strategickej priority Manažment údajov, resp. Open Data, resp. sémantické štandardy ktoré sa vytvorili: Centrálny model údajov S, aplikačné profily DCAT-AP-SK, CPSV-AP-SK, … a mnohé iné, stojím za nimi absolútne :slight_smile: Som presvedčený, že interoperabilita má v štátnych dátach miesto. A je dokonca kľúčová.

  2. Plánujem spraviť novú verziu Centrálneho modelu (1.2), ktorú chcem hodne zjednodušiť a vylepšiť. Jednak chcem vypustiť viacero zbytočných národných dátových prvkov, tj. napr. názov organizácie (právneho subjektu) nech nie je lsub:name, ale použijú sa priamo štandardy, ako foaf:name v tomto prípade. Takisto chcem prerobiť číselníky do validnych SKOS taxonómií, aby sa lahko dali používať aj v nástrojoch podporujúcich RDF formáty.

  3. No a samozrejme, plánujem v priebehu druhej polovice ďalšieho roka publikovať LODSlovakia2019, kde budú všetky štandardy premietnuté spolu s novými datasetmi.

  4. Čiže v týchto súvislostiach, chcem sa angažovať v podskupinách súvisiacich s dátovou kvalitou, OpenDátami, Referečnými údajmi a podobne. Navrhnem UPVII, aby urobilo niečo ako výzvu na zozbieranie návrhov, pripomienok, či otázok, ktoré s dátami súvisia. Dostal som viac otázok k URI, a presne toto by mohla byť téma. “Počuli sme niečo o URI, ale nevieme/chceme/nechceme” ho použiť v tejto situácii. Čo s tým?".

Na týchto stretnutiach som nebol, a toto hlasovanie považujem sa trošku zvláštne. Veď linked data a API proti sebe nestoja. Otázka je iná. Či majú byť dáta popísané jednotným modelom a majú byť jednotne identifikované, ale je to jedno, a každý si to môže urobiť ako chce. Ja budem teda argumentovať, že štandardy sú nutné, a to nielen v IT.

  1. Som presvedčený, že je tzv. proces Meta-Data Governance je jedným z kľúčových procesov, ktoré by mali bežať v rámci IT. Už dávnejšie som tu o tom písal.
    ÚPVII Pracovná skupina K9.2 Governance

Ano, hlasovanie (k danej otazke, ale v zasade aj takmer cele) bolo vcelku zvlastne. Moj odhad dovodov:

  1. nedostatocne hlbsie pochopenie
  2. obava z vysokych nakladov na API a vysokych nakladov na 5* (a ze bude treba oboje naraz => este vyssie naklady)

(pricom vlastne 2 vyplyva z 1)

Preto by som to nateraz uzavrel zhruba citaciou Jana Hargasa ( https://www.youtube.com/watch?time_continue=2&v=Er4uzJNAMIU&utm_source=sendinblue&utm_campaign=Flash_news__template ):

  1. “1x a dost” v zmysle vysledkov
  2. ludske zdroje

Tot ti ludia by mali prekusnut to nedostatocne hlbsie pochopenie.

Takže sa nakoniec zriaďuje 6 odborných skupín. Data is the king. Kto máte záujem, prihláste sa!

Dosiahnutie konkrétnych výsledkov v oblasti riadenia údajov je jednou z najvyšších priorít informatizácie verejnej správy. Na tento účel v rámci PS K9.4 Lepšie údaje začínajú činnosť špecializované pracovné skupiny:

  1. Zákon o údajoch - Cieľom je zanalyzovať súčasný stav legislatívneho pokrytia všetkých tém súvisiacich s riadením a používaním údajov vo verejnej správe a tam kde je to potrebné návrh riešenia až po vypracovanie návrhu nového zákona o údajoch.

  2. OpenData - Skupina zameraná na úlohy a ciele v sprístupňovaní otvorených údajov a súvisiace témy, najmä v kompetencii dátových kurátorov vo verejnej správe.

  3. MyData - Náplň práce skupiny je rozpracovanie konceptu MyData a jeho zavedenie do praxe.

  4. 1x a dosť - Skupina sa bude zaoberať všetkými témami súvisiacimi s konceptom 1x a dosť, t.j. najmä referenčné registre, kvalita údajov, integrácie.

  5. Data mining - Riešenie problematiky analýzy údajov, big data a pod. vrátane pokrytia potrieb analytických skupnín vo verejnej správe.

  6. Dopytové výzvy - Pomoc so zapájaním sa do dopytovej výzvy OPII špecializovanej na riadenie údajov, vyhodnotenie dopytovej výzvy, príprava ďalších kôl.

Tieto skupiny budú úzko zamerané na príslušnú tému. Výstupy ich práce budú následne prerokúvané vo “veľkej” PS K9.4. Stretávať sa a komunikovať budú podľa podľa potreby tak, ako sa sami dohodnú. Do ich práce sa môže zapojiť každý kto má reálny záujem, zapojenie koordinuje Milan Andrekovič / ÚSVROS, ozvite sa mu na aresu mailto:Milan.Andrejkovic2@minv.sk .

1 Like

18.12.2018 bolo dalsie strretnutie. Oficialny zapis by mal pribudnut niekde tu: https://drive.google.com/drive/folders/1htkLkndUppCv469v6WZFwL7LBK9CUj9w . Novy zdielany pracovny priestor je tu: https://drive.google.com/drive/folders/1gyznc3x00kSB_feukG9_n0guxyITq1iJ?usp=sharing .

Par mojich poznamok zo stretnutia:

Analyza hodnoty Open Data (OD)

ucel:

  • odhadnut prinosy, …
  • … aby bolo mozne vyargumentovat financie vydavane na publikovanie (ci kompenzovanie vypadkov prijimov z predaja dat)
  • naznacit strategie/priority co a ako publikovat

vid draft v GDocs: https://docs.google.com/document/d/1SBXRzbqBWe8jlYTkAXVsPhMum-MCJwCM7UolLEwuci4/edit

dalsi dokument: https://docs.google.com/document/d/1xiV809iAOjDxN7hChQ8_6hIK3FiS2Et6i58IT0pma40/edit

ako zdielat ci inak motivovat zdielanie vycistenych dat?

UPPVII posle linku na “vzorcek” pocitania ceny datasetov pre Dopytovky, tot aby sme (tu v PS) posudili, ci su tie Dopytovky posudzovane spravne

  • nejaka “priloha 10”

O vedeni dig. agiend

realita: kopa agiend (a teda udajov) sa vedie na papieroch resp. textovych dokumentoch

motivacia: co najviac agiend robit strukturovane, cize ak nie v nejakom IS tak aspon v “XLS”

ako:

  • tym, co trvaju na papieri nakazat, aby to robili digitalne
  • len pre nove agendy a nie take, na ktore je resp. bude IS

vo vseobecnosti samozrejme zaujimave pre OpenData, ale …

  • viac tema na dat. kuratorov a IS architektov
  • o.i. ludia nevedia robit poriadne ani len v tabulkovom procesore => velke riziko pre samotne vedenie agendy a potom samozrejme aj zverejnovanie OpenData

mensie poznamky:

  • nespominat XLS ale “tabulkovy procesor”
  • nech to aj dodrziava aspon ten, kto to vyhlasil (t.j. napr. nech UPPVII predklada navrhy legislativy v SlovLex-e v struturovanej forme, kedze SLovLex take podporuje)

Prioritne datasety

vychadzat by sme mohli napr z materialu k ref. udajom, vid https://drive.google.com/file/d/1DMkKmMvJ2FYYLZax-JO97LHghx8yKcoN/view

podla Global Open Data Index:

  • SU: napr. presunut kod publikovanie RPO z S.D rovno do SU { -> zvysenie skore v GODI }
  • SHMU: kvalita vzduchu a vody

Projekt “Dátová integrácia” vs. OD

nestihli sme prebrat vramci “plnej ucasti”, ale pointa je, ze teda v SU sa spominaju Open Data a planuju cerpat financie (a nie malo) z prioprotnej osy Open Data, cize bolo by nanajvys ziaduce, aby ten projekt aj realne publikovat Open Data (a vela a poriadne)

  • problem: aktualna vyzva/onstaravanie tomu velmi nezodpoveda

Cinnost PS

stretavanie raz za 2 tyzdne

dalsie stretnutie: 15.1.2019

pozriet velky zoznam nesplnench uloh a vybrat, ktore budeme najblizsie riesit: https://docs.google.com/spreadsheets/d/1qCMGoX4nND5T9hLQr1klt7Waw3ZzC5qZiboGj4FbCJ0/edit#gid=421468090

Tu len pripomeniem, ze analyza by bvola samozrejme dobra (kvoli “pozitivnej motrivacii”) ale nie je to uplne nutne, kedze tu mame aj “negativnu motivaciu” v podobe povinnosti, ktore definuje PSI smernica.

Tu sme debatili o tom, ze napr. RPO je v podobe Open Data zvrejenovane nasledovne:

  1. SU dal S.D “nejake API”
  2. S.D cez to API taha surtove data z SU
  3. S.D surove data nejako cisti a prepaja
  4. S.D vysledne Open Data zverejnuje, vid https://ekosystem.slovensko.digital/sluzby/datahub

A pointa je, ako zabezpecit, ze ked uz raz niekto nieco vycistil a pospajal, tak ako zabezpecit, aby dalsi nemuseli robit to iste este raz (t.j. podelit sa o benefity … ale zrejme aj naklady)?

A otazka znie, ako nieco take sformalizovat a ako k niecomu takemu motivovat organizacie aj v pripade dalsich datasetov? Mame napr. ocakavat, ze nejake “ciste data” poskytne naprp. FinStat (ako sukromny komercny subjekt) alebo naopak tlacit, aby sa adsej cistilo “uz pri zdroji” (t.j. ta ktora PO/OVM)?

Tu uz sme IMHO zasli mimo temu “Open Data” a zasli k high-level sferam informatizacie. A potom tu narazame na to, ze na mnohych miestach nevedia riadne pracovat s PC. A na mnohych dalsich miestach potom PC ani len nemaju. A co s tym?

K tomu malo by nejake stretnutie, zatial nebolo. CC @Lubor

Tu teda ide o toto obstaravanie: Dátová integrácia: sprístupnenie údajovej základne VS vrátane otvorených údajov prostredníctvom platformy dátovej integrácie

V nadvaznosti na opatovny rozbeh K9.4 bolo 11.12.2018 aj stretnutie podskupiny “Referenčné údaje a 1 x a dosť”. Zapis: https://docs.google.com/document/d/14qofTALj4OIPtX4d8TTsZu9Z9TBqW8eZ4-FMxv5E6NA/edit#heading=h.gjdgxs

Za mna asi najpodstatnejsi bol je “issue tracker”. Tie ostatne su sice tiez dolezite, ale dlhodobo sa vramci Ps potkame s problemom “bola definovana uloha, potom sa k nej ale stratia informaice a … nainiec nie je plnena a malokto si pamata, ze vobec bola a o com mala byt”. Tot issue tracker by mal pomoct vylepsit.

Poopravim. Rpo dataset v ekosystéme nie nijako vycisteny (naschvál). Je to replika 1:1 toho co vracia rpo z public “api”. To čo je vyčistené je prémiové api.

Podľa mňa to treba čistiť pri zdroji, my vieme poslať prinajlepšom kandidátov na čistenie, robiť reporty chybných údajov atď.

1 Like

Tu sa medzičasom deje viacero vecí, postupne to sem nahodím.
Asi najväčšia novinka je, že sa reálne začala príprava nového zákona o údajoch. Detaily a diskusia tu: Zákon o údajoch

Zopár odrážok k ostatnému stretnutiu podskupiny “Referenčné údaje”:

  • Dátová kancelária má nového špecialistu pre kvalitu údajov - Andrej Fukas

  • KPMG dodala finálne výstupy k riadeniu kvality údajov, teraz prebieha formálne schvaľovanie na úrade, ale v podstate je to akceptované, toto je k tomu oficiálny text:

Metodické príručky ÚPVII, ktoré by mali pomôcť správcom údajov, dátovým kurátorom, resp. ostatným zodpovedným osobám nastaviť procesy manažmentu kvality údajov vo vzťahu k registrom, v rámci ktorých sú vedené a to konkrétne:

  • identifikovať biznis pravidlá voči určeným ukazovateľom dátovej kvality,
  • rozbehnúť procesy merania dátovej kvality,
  • identifikovať a riešiť problémy spôsobujúce nedostatočnú kvalitu údajov:

Metodika merania dátovej kvality vo verejnej správe

Výpočet KPI dátovej kvality pre jednotlivé inštitúcie verejnej správy

Ako zlepšiť kvalitu údajov?

Zoznam konkrétnych odporúčaní pre inštitúcie verejnej správy z ohľadom zlepšenie dátovej kvality

Návrh datasetu parametrov dátovej kvality vo verejnej správe vo formáte otvorených dát

Prezentácia prvého komplexného merania dátovej kvality vo verejnej správe

(koniec oficiálneho textu)

Tie dokumenty zväčša neuškodia ani nepomôžu. Kto chce vidieť, prečo ani svetovo špičkové konzultačné firmy nezachránia slovenský eGov, pozrite si “prezentáciu prvého komplexného hodnotenie dátovej kvality vo verejnej správe” a tam údaje za RPO - vyšlo že vo všetkých parametroch je kvalita tohto registra nad 99,7%. Haha.

Potom sme diskutovali práve o RPO a jeho známych nedostatkoch kvality údajov tohto registra. Imho toto dostať do poriadku by mala byť priorita, snáď aj väčšia ako pokračovanie reklamne ľúbivých tém quickvíťazstiev.

Viaceré ďalšie úrady, ktorých registre majú byť vyhlásené za referenčné, potom hovorili ako si to predstavujú. Obvykle sa to zaseklo na jednoznačnej identifikácii právnických osôb. Napr. fin. správa nechce plošne zverejňovať DIČ, že to je ich interný identifikátor, ale v IČOách je skrátka zatiaľ príliš veľa chýb…

Keď už sme pri tom, povedať aké “biznis pravidlá dátovej kvality” (terminológia KMPG) treba pri nejakom registri sledovať vedia najlepšie konzumenti údajov z tohto registra. Oni najlepšie vedia čo si musia odkontrolovať skôr než si údaje pustia do svojho systému. Povedzme pre to RPO.

A len tak pre zaujimavost, co su tie problemy RPO, ktore neodhalili? Na druhu stranu, je pravda, ze to hodnotenie bolo trochu simplisticke…

No veď v RPO chýba podstatná časť údajov, najmä z malých registrov. A aj to čo sa tam nahráva z OR+ŽR má podstatné problémy ak nie úplne sedí. A duplicity. A je veľká chybovosť údajov, napr. skutočné adresy. Ja viem že časť z toho sa “iba” prenáša zo zdrojových registrov, ale to ma pri hodnotení kvality vôbec nezaujíma - lebo práve na to RPO slúži, aby všetkých odtienil od detailov zdrojových reg. Pomenujme v čom je problém (ak je - a všetci hovoria že je), a potom bude lepšie vidieť čo treba robiť.

Ešte raz: skús sa na RPO pozrieť ako konzument údajov, povedzme Soc.poisťovňa. Čo potrebuješ a v akom je to stave? Kedy bude môcť SP “stotožňovať”, čiže zahodiť svoju evidenciu a nahradiť ju tým čo je v RPO? Lebo momentálne hovoria že ani náhodou, a to ani keď im to zákon prikazuje - lebo nekvalita údajov.

Mne to prišlo doslova smiešne, že všetci sa dlhodobo sťažujú na nekvalitu RPO a konzultanti si v pohode vykážu 99.X%. Veď aj kebyže nič o RPO neviem tak mi iba pri počívaní o čom sa hovorí na PS zúrivo bliká červená kontrolka.

Pozeram slide 19 a k RA a (po prestudovani detailov = o.i. napr. “V prípade 425669 záznamov
obsahuje zemepisná dĺžka hodnotu NULL (36,086%).
”) je teda vysledok pre ukazovatele RA-1 a RA-2 dost zly: 63.9%. Po InspirujmeSe (geo konferencia minuly tyzden v Tatrach) pozeral kolega podobnu metriku pre PSK [1] a vyratal, ze:

  • 68% zaznamov ma koordinaty
  • 49.9% (z celkoveho poctu) ma koordinaty v PSK

Viac by ma ale zaujimalo, nakolko automatizovane a opakovatelne toto meranie je. Lebo od teraz by bolo velmi zaujimave “kreslit casovy graf” a pozerat, ci a ktore metriky idu hore.

[1] https://data.gov.sk/dataset/adresy-podla-krajov/resource/03785168-1b0b-45e3-b6ba-be3884ada2b8

Opatrenie c. 32 v zalozke “Odporucania” sa mi velmi paci: “Zabezpečenie jednoduchšieho prístupu k datasetom potrebným pre meranie a riadenie dátovej kvality (napr. Prístupy do všetkych informačných systémom by mali byť na úrovni READ kedykoľvej. Export dát z databázy by mal byť pre zodpovedné osoby ľahšie možný a najlepšie vo formáte SQL).” NA druhu stranu, po skusenostich s data auditmy, ktore prebiehali vramci OGP mi zostava silno dufat, ze KPMG resp. UPVII bude schopne vyrazne lepsie organizaciam vysvetlit, co to presne znamena.

Potom ale trochu nechapem, preco ma “Nastavenie proaktívnych kontrol pre zdrojové systémy – kontrola bude prebiehať už pri vstupe údajov na základe definovaných technologických a procesných požiadaviek.” priotitu iba 2 zatialco “Implementácia a zabezpečenie nástroja na riadenie dátovej kvality (v súčasnosti existuje platforma Talend, ktorá je zabezpečená na úrovni PaaS služby v štátnom cloude).” ma prioritu 1.

OK, ma to niekde niekto spisane presnejsie? Chapem, ze do RA sa kope lahsie (adresne body v Afrike su vcelku jasne, to sa ani Moricom Benovskym neda vysvetlit :slight_smile: ), RPO je tazsie. Tak preto vrtam.

1 Like

A podla tychto bodov sa to mohlo dat odmerat konzultantom…

Poznamka bokom: Kedze vsetky udaje z RPO mame v nasom https://ekosystem.slovensko.digital/ a dokonca mame reportovaci tool. https://bi.ekosystem.slovensko.digital/, tak pokial niekto ma napad co vieme odmerat jednoduchym “selectom”, tak to tam v klude dajme.

Za mna z toho co o RPO viem namatkovo:

  • udaje napriec roznymi registrami (ZR a advokati a ine) maju problematicke casove prekryvy osob - nesedia od-do.
  • sem tam nejake udaje (historicke) zmiznu (nedosiel som na to podla akeho kluca) a nahradia sa novymi, kde su neni nejake osoby (konatelia, staturari) co tam boli.
  • zmeny ico a ich historicke prekryvy (toto som videl ak si spravne spominam iba par krat), nejaka firma mala rovnake ico ako ina firma co davno zanikla.
  • podiely na zakladnom imani sa dost blbo stotoznuju s osobami. aj clovek ma niekedy problem to pospajat. mam pocit, ze toto je proste zly datovy model.
  • RPO ma nejake interne unikatne ID na zaznamy, ale je to spravene velmi divne (v case pribudaju pre jednu firmu dalsie a dalsie “cez frontend nevyhladatelne zaznamy”, cize ako jednoznacny identifikator PO to rozhodne nie je pouzitelne.
1 Like

K Registru adries: pred cca. 2 mesiacmi spravil gestor tohto registra skutočne dobrú vlastnú prezentáciu stavu kvality údajov. (Ono gestori obvykle presne vedia v akom stave to majú a kde ich tlačí päta, častokrát však akoby “nebola vôľa” prezentovať si pravdu ani medzi úradmi.)
Že GPS súradnice pre veľa adresných bodov nie sú uvedené je “na počet chýb” asi najvážnejší nedostatok. Aj sa tu už rieši, najmä kvôli sčítaniu obyvateľov, ktoré by malo byť založené práve na údajoch z tohto registra. “Už” znamená, že pol roka vyjednáva MVSR a ŠÚSR, kto zaplatí tých cca.300K Eur, ktoré vraj stojí plošný komerčný nákup doplnenia týchto údajov. V slávnom OPII samozrejme na toto peniaze nie sú. :wink:
Každopádne v RA sú aj iné, subtílnejšie chyby a mal som z tej prezentácie pocit že MV ich rieši. Historicky časť problému vznikla tým, že za časť údajov RA “od ulice nižšie” zodpovedajú obce, ktoré však nedostali pokiaľ viem žiadnu priamu podporu pri napĺňaní/riešení kvality svojich údajov, iba zákonnú povinnosť. OPII/OPIS opäť nič, z toho sa platilo iba “vybudovanie” registra.

Keďže celý RA je verejne dostupná ako OpenData, kto chce môže vyrobiť aj denne merané veličiny. Tuším tie query sme aj tu na platforme niekedy písali.

Btw. k meraniu presnosti GPS súradníc by ma zaujímala suma “odchýliek bodu RA a <verejné API> geocoding bodu pre danú adresu”. Verejné API napr. google, here.com, alebo bing. Cieľ je toto mať =0.

K RPO:
no veď presne, očakával som, že ten_kto_robí_komplexný_audit, dá dokopy zmysluplné parametre ktoré je treba merať. Toto je najťažšia robota. No nevadí, ako som písal v Dátovej kancelárii je nový špecialista na kvalitu údajov, tak snáď toto preberie on a dúfam že túto diskusiu aspoň číta. Áno, pri RPO vnímam ako najbližší krok určiť sadu kritérií ktoré chceme sledovať.

Ad “opatrenie c.32” - mal som pocit že aspoň jeden úrad na týchto audítorov hľadel dosť s dešpektom a dával im najavo že veľmi spolupracovať ani nechcú.

Ad “nastavenie proaktívnych kontrol” - čistá všeobecná teória. Častokrát nejaké IT-čkarske “kontroly vstupu” nemôžu brániť zápisu do registra.

Ad “nástroj na riadenie dátovej kvality” - toto hodnotím ako čistú neschopnosť písať skripty v Unixe, alebo rozchodiť si nejaký FOSS analytický nástroj. Plus akonáhle sú v registri nejaké citlivejšie údaje - napr. OÚ, predstava že úrad celý register nakopíruje niekam vedľa kvôli analyzovaniu kvality je smiešna ilúzia, najmä keďže problémy kvality ten úrad obvykle dobre pozná. Viď. predstavy riešiteľov CSRÚ, ako sa všetky údaje nasypú na kopu a tam sa budú “opravovať”.
Alebo práve vidíme vznik zadania pre pekný eurofondový projektík.

Nieco ako:

SELECT sum(cena) FROM studie_uskutocnitelnosti WHERE text ILIKE ‘%licencie Talend%’

? :slight_smile: :confused:

Relevantne: