Kvalita údajov

Z inej diskusie od @Lubor

3 Likes

Ono je problém aj na strane legislatívy - napr. chybne zapísané údaje v OR nemôže niekto vyriešiť jednoduchým “editom” danej položky, musí prebehnúť legislatívny proces. To znamená, že ak ja na túto chybu prídem (zle zapísaná adresa), musím podať žiadosť na súd, kde sa tým ale musí zaoberať sudca, nemôže to riešiť len tak hocikto. Čiže obyčajná zmena adresy trvá často mesiac, kým sa to zosúladí so skutočným stavom. Zároveň sa ale táto chybná informácia už prenesie aj do iných registrov (napr. daňový úrad, živnostenský úrad) a nastáva kolotoč telefonátov a výziev na opravu.

V obchodnom registri je často množstvo neaktuálnych údajov, čo je ale v 99% prípadov spôsobené tým, že OR nevyužíva mechanizmus sankcií, lebo to jednoducho nestíhajú. A tak už x rokov od prijatia eura je v OR stále veľa firiem, ktoré majú zapísané imanie v korunách, aj keď porušujú zákon. Nikoho to veľmi netrápi.

Podľa mňa je základom najmä to, aby boli údaje vo formulároch porovnávané s údajmi v registroch ako REGOB, register adries atď. To znamená, že mi do formulára nedovolí vyplniť iný údaj ako ten, ktorý je v databáze. Týmto sa zabráni preklepom alebo nesprávne uvedeným orientačným/súpisným číslam. To by odfiltrovalo asi 80% všetkých chýb. Tento postup by pomohol prakticky vo všetkom - evidencia vozidiel, trvalé pobyty, zmeny pri nehnuteľnostiach, živnostenský register, obchodný register atď. Ak budeme mať toto, môžeme sa pozrieť na zvyšok neaktuálnych údajov a manuálne ich opraviť.

1 Like

Podla mna tato tema do velkej miery suvisi s MetaIS ako centralnym registrom vsetky ciselnikov, registrov a schem, kde spolu s pridavanim standardizovanych semantickych vlastnosti https://platforma.slovensko.digital/t/semanticke-datove-standardy-pre-udaje-verejnej-spravy-sr/185 sa dopracovavame k LODu (Linked Open Data), kde sa jednoducho kvalita dat prejavy.
Ja to vidim nasledovne :
Ak budu vsetky polozky ciselnikov mat jednoznacny referencovatelny identifikator, tak bude jednoduche robit mashupy dat, lebo data sa budu cez tieto referencne identifikatory prepajat napr. ako uzly v grafe. Takto sa velmi efektivne moze kontrolovat, ci akykolvek ciselnikovy udaj naozaj existuje cez dopyty resp. je do znacnej miery jednoduche napisat konzistencne pravidla, ktore budu automaticky na tieto nezrovnalosti poukazovat. Opravene udaje budu automaticky vytvarat nove distribucie datasetov a tak sa iterativnym sposobom postupne dopracujeme k plne konzistentnym datam.

1 Like

ako bolo naznacene vyssie @CrakeN, nebude mozne zasahovat do ciselnikov len tak. je to vec kompetencii, ale ako naznacujes takyto pristup moze generovat zoznamy nezrovnalosti a iniciovat proces oprav. ale ano bude to generovat aktualizacie datasetov. zaujimave bude potom ako riesit notifikacie o zmenach… ci to nechat na pouzivateloch datasetov, alebo proaktivne informovat zaujemcov o monitoring toho ktoreho datasetu o zmenach. to je cela tema na rozpracovanie. notifikacie, publikovanie zmien, atd.

1 Like

jo spravny koment a rozsirenie prispevku od @CrakeN o mapovani udajov medzi agendami. optimalne by bolo keby sa linkovanie medzi ciselnikmi rovno linkovalo cez referencovatelny identifikator. na to vsak potrebujeme asap zverejnit udaje aj s prislusnymi identifikatormi. dobra sprava je, ze metais2 uz zapracoval temu URIs… uz ich len dostat vonku

Pri vnucovaní chybných údajov inému registru treba vychádzať zo zásady, že prednosť má zdrojový primárny register (primárny záznam) odo dňa, kedy sa začnú registre zdieľať. Neviem si predstaviť, že by register PO menil primárne údaje v zdrojovom registri obchodného registra. RFO kľudne môže meniť údaje vo vzťahu k fyzickým osobám v obchodnom registri. Inak povedané, obchodný register má kompetenciu pri obchodnom mene spoločnosti, tak je zdrojom, vnútro - matrika má kompetenciu pri mene fyzickej osoby, tak je zdrojom, zdravotka má kompetenciu pri čísle poistenca, tak je zdrojom, štatistický úrad pri IČO, vnútro bude zdrojom pre adresu. Ľudia a úrady (ex offo) si údaje postupne vyčistia, referenčná integrita bude určite zachovaná.

3 Likes

Možno by na začiatok stačili mäkšie opatrenia. Napr. označiť údaje kde správca má dôvodnú pochybnosť o správnosti, či posielať notifikácie.

Presne tak, pre nové údaje treba dosiahnuť aby už nevznikali chyby. Možno dokonca ani nie skopírovať správne údaje, ale skrátka vytvoriť väzbu na záznam v referenčnom registri.

Celkom by ma zaujímalo, ako je táto vec dnes riešená legislatívne. Zatiaľ mám dojem, že takéto automatické opravy nie sú možné. OR je dobrý príklad - keď raz niekto doniesol listinu s určitým menom osoby, je nejaký proces umožňujúci “priebežne nasledovať zmeny” (napr. zmenu mena štatutára) v týchto údajoch pre správcu registra - napr. vo väzbe na referenčné registre?

Keď sa správca registra dozvie o zmene minimálne by mala byť proaktívne zaslaná notifikácia príslušnej osobe, ktorá môže zmenu vykonať. Na toto žiadne zmeny zákonov netreba.

Iný prípad je samozrejme ak ide o “vlastnú” evidenciu verejnej správy, napr. keď na úrade práce evidujú trvalé bydlisko - v tomto príklade autoupdate podľa ref.reg. je samozrejmé.

2 Likes

dnes naozaj nie je možná automatická zmena zapísaných údajov. to však neznamená, že sa to nedá zrealizovať.

jednoducho štatutárka, ktorá sa v sobotu vydá, od nedele by mala zapísane nove meno v obchodnom registri. jednduché, nič by ju to nestálo, dokonca firme by prišla notifikácia o ex offo zmene v OR. zadarmo.

formuláre na zapis by sa zjednodušili napr, pri fyzickej osobe by stačili 4 polia, meno, priezvisko, datum, rč/bifo

zmenový formulár by sa používal iba v prípade osôb nezaregistrovaných v RFO - cudzinci, diplomati… alebo alternativne tieto osoby by museli byt najprv registrovane v rfo.

jednoducho staticky obchodný register treba zmeniť na dynamický. jednoduché, nie?!? :slight_smile:

2 Likes

informatizacia.sk zverejnila nove metodicke usmernenie. Metodické usmernenie Ministerstva financií Slovenskej republiky č. MF/022908/2015-171 pre riadenie kvality údajov

Data Steward :slight_smile: to bude dream job.

1 Like

Zbožňujem túto špecifickú prax metodických postupov. :heart_eyes:

dátový steward & supervízor

To som si myslel, ze behom eDem sme uz ako tak ustabilizovali teminus technikus na “datovy kurator” … ako hlboko som sa mylil. :smile:

1 Like

Na tom je práveže zaujímavé to, že z dvoch rôznych strán vznikla nezávisle požiadavka na to isté - kurátor & steward.
Možno to skrátka je dobrý nápad mať v organizácii jedného človeka, čo rozumie dátam.

Zdá sa, že “Metodické usmernenie MF SR pre riadenie kvality údajov” je úzko zviazané s IS centrálnej správy referenčných údajov verejnej správy (IS CSRÚ). V tejto prezentácii som našiel nejaké súvislosti: http://www.itapa.sk/data/att/3531.pdf. Čo som však nenašiel, je nejaký verejný interfehs k IS CSRÚ.

1 Like

Toto je odporucanie pre UK vladu, aby zacala vyuzivat blockchain…

In summary, distributed ledger technology provides the framework for government to reduce fraud, corruption, error and the cost of paper-intensive processes. It has the potential to redefine the relationship between government and the citizen in terms of data sharing, transparency and trust. It has similar possibilities for the private sector.

A report by the UK Government Chief Scientific Adviser: https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/492972/gs-16-1-distributed-ledger-technology.pdf