MIRRI Pracovná skupina K9.4 Lepšie dáta

no dost nepresne, samotny OPII bol schvaleny koncom 2015,
po 2016 vznikol UPVII a zacali sa prerabat dokumenty a stalo vsetko. Teraz sa zacalo velmi pomaly rozbiehat a stale je viac veci nejasnych ako jasnych.
Ale na rozdiel od OPISU to nie je problem s cerpanim, kedze dialnice cerpaju a su spolu s nimi v OP. A tak vysledok bude skor ze to ze koncom roka sa zacne debata o presune penazi na dialnice a bude koniec.

2 Likes

Nuz, aj to je mozne. V takom pripade linky od @jsuchal:

az na to ze to su rozne peniaze, dialnice su investicie a tie sa daju platit z opii a opravy su prevadzka a to ide z rozpoctu. tak dialnice, ked uz je vsetko v it hotove

Opat som bol naschal nepresny. V zasade tomu (po X vysvetleniach) uz rozumiem (ze co su v OPII opravnene naklady a pod.). Len teda “zdravy rozum” sa stale pyta: je lepsie tu cca miliardu minut celu na hovadiny, alebo radsej minut len cast miliardy na rozumne veci?

ak v it sa daju robit uz len hovadiny, tak je potom spravna odpoved b. co predpoklada ze uz je vsetko hotove

Aby som sa vrátil k téme tohto topicu.

Áno, že sa bude používať CSRÚ na všetky dátové integrácie je v súlade so schválnou stratégiou. “Iba” sa má upraviť, aby jeho použitie bolo rýchle a jednoduché (ľudovo povedané). Dlhodobý cieľ je aby všetci mali integráciu/e na modul dátovej integrácie.

Poskytovanie výpisov cez nový portál (oversi.gov.sk - už funguje, ale zrejme iba cez Govnet) je v poriadku, pretože veľa subjektov nemá, v dohľadnej dobe nebude mať, alebo vôbec nie je efektívne aby mali dátové prepojenie. Naopak, keďže tento portál má byť aj pre ľudí, stáva sa úplne zbytočným poskytovanie výpisov cez IS IOM - aj tetuška na pošte, resp. pracovisku IOM môže použiť portál oversi a hotovo.

Zápis údajov nie je dôvod aby išiel cez CSRÚ a neviem o tom že by to bolo nejako “strategicky” upravené. Áno, v projekte rozvoj CSRÚ to však je naplánované - aj sme to kritizovali, aj ďalšie zvláštne veci (neúspešne).

Procesná integrácia nemá zatiaľ technickú realizáciu (a rieši sa to v inej PS - asi Architektúra). Ale už sú tu viaceré projekty, ktoré na toto ašpirujú, najmä MV v projekte Riadenie procesov a dát pre OÚ, PZ a HaZZ viď. tam na obrázku komponent “Orchestrácia”.

1 Like

Este podotazka, procesnou integraciou sa zamysla len orchestracia, alebo aj spristupnenie vsetkych sluzieb, ktore ISVS publikuju? Nie je podla mna totiz jasna hranica, co este spada pod datovu integraciu a co pod procesnu. Konieckoncov, v oboch pripadoch komunikujeme vymenou dat.

hmm a pred rokom na Zdravotnictve sa podobny projekt zmietol zo stola ako nekoncepcny (IS KUZ) … ale v inom rezorte je koncepcny ? … Za 3 roky nic nv CSRU nepribudlo a dnes v IS CSRU su 4 riadene registre … len zdravotnictvo ich vsak potrebovalo cez stovku … Takze mozno sa nezhodneme, ale ako praktickemu obcanovi mim pripada nekoncepcne cakanie na zazraky a radsej beriem ciastkove aj ked o uroven nizsie riadene projekty.

Čo si o tom projekte MV myslíme si prečítaj v Red Flagoch.

Dobrá otázka na @kyselat .

20.9.2017 a 27.9.2017 boli vcelku vyznamne stretnutia K9.4, kedze sa na nich hlasovalo k prioritam pre dokument Strategicka priorita Open Data(*). Z tychto stretnuti vsak nie su zverejnene zapisy (aj ked som ich Jurajovi posielal). Kedze teda zapisy nikde nie su ale su podla mna dolezite, tak aspon vycuc z hlasovani:

20.9.2017

#1 pouzitie vybranych udajov na pravne ucely resp. ambicia zvysit doveryhodnost OD voci sucasnemu stavu

  • 15 za / 1 proti / 1 zdrzal
  • uz vtedy to bola schvalena uloha z uznesenia vlady, t.j. slo skor o to, ci ma K9.4 zaujem sa teme nadalej venovat

#2 dopytova vyzva pre aplikacie nad otvorenymi udajmi

  • 12 za / 3 proti / 1 zdrzal

#3 anonymizacia

  • “za” = anonymizacia, “proti” = vyhodenie stlpca
  • 10 za / 6 proti / 1 zdrzal
  • obdobne ako #1, aj toto uz bola v danom case schvalena uloha a teda hlasovanie vyjadruje volu K9.4 sa teme venovat podrobnejsie

#4 pouzitie blockchain na zabezpecenie doveryhodnosti

  • “za” = cheme blockchain experiment, “proti” = nechceme blockchain experiment
  • 9 za / 4 proti / 4 zdrzal
  • “experiment” = “proof of concept”

#4a KEP na doveryhodnost? (ak treba resp. kde sa hodi)

  • 12 za / 2 proti / 3 zdrzal

#4b organizacne opatrenia? (ak treba resp. kde sa hodi)

  • napr. obdoba zverejnenia v CRZ, hashe, … samozrejme v kombinacii s ostanymi, podla vhodnosti pre konkretny ucel
  • 7 za / 3 proti / 7 zdrzal

#5 Linked Data vs. API

  • “za” = ciel len na Linked Data (ako teraz), “proti” = ciel “alebo Linked Data alebo API”
  • 4 za / 3 proti / 8 zdrzal

#6 centralne ulozisko na nestrukturovane dokumenty

  • 9 za / 2 proti / 3 zdrzal (3 hlasujuci medzicasom odisli)

#7 archivacia datasetov

  • uplynul cas, nehlasovalo sa

27.9.2017

#5 Linked Data vs. API (opakovanie, bol upresneny vyznam “za”)

  • “za” = suhlas s cielmi 3* = 100%, 4* = 90% (vybranych), 5* = 70% (vybranych), Open Data ako dump = 90%, Open Data ako API = 70%
  • 6 za / 2 proti / 5 zdrzal
  • kedze vysledok z #5 bol “nevyrazny”, tak sa hlasovanie rozdelilo na #5a a #5b

#5a hlasovanie o “kvalite”

  • “za” = ???
  • asi 7 za / 1 proti / 0 zdrzal

#5b hlasovanie o API

  • 9 za / 1 proti / 3 zdrzal

#7 archivacia (dokoncenie)

  • “za” = K9.4 sa tomu chce venovat, “proti” = K9.4 sa tomu nechce venovat
  • 12 za / 1 proti / 0 zdrzal

#8 inovativne sluzby - umela inteligencia, …

  • 10 za / 2 proti / 1 zdrzal

#9 ulozisko zdrojovych kodov a.k.a. vladny GitHub

  • scopom NEMA byt naprogramovanie takehoto niecoho
  • 10 za / 0 proti / 3 zdrzal

#10 agilna metodika pri implementacii

  • 9 za / 4 proti / 0 zdrzal

K tomuto sa teda budem z casu na cas vracat, kedze nietore tieto hlasovania boli priamo alebo nejakou oklukou pretavane do niektorych studii uskutocnitelnosti.

Pardon, ze info davam takto neskoro. Optimisticky som dufal, ze oficialne zapisy budu s meskanim, ale ze budu. Zial, nie su.


(*) zrejme “najoficialnejsim” dokumentom SP Open Data je toto: https://sp.finance.gov.sk/lepsie-data/_layouts/15/WopiFrame.aspx?sourcedoc=/lepsie-data/Zdielane%20dokumenty/Archiv_2017/Výstupy/v0%2092_SP_Otvorene_udaje.docx&action=default

1 Like

Oficiálny, t.j. schválený dokument SP Otvorené údaje je (aj) tu:

viď.

Vcera (20.11.2018) bolo po dlhsej vyluke dalsie stretnutie K9.4 . Vseobecnou temou bol najme “stav” a “co dalej?” O.i. boli slubene riadne oficialne zapisy, ale pre istotu par mojich poznamok:

Buducnost PS:

  • vedenie prebera p. Kodydek, pomaha p. Andrejkovic
  • z pohladu NKIVS uz PS svoj ucel splnila, ale …
  • … UPPVII vidi dalsie fungovanie PS ako uzitocne, v spolupraci s ich novovytvorenou datovou kancelariou (vid nizsie)

Datova kancelaria UPPVII:

  • obsadenych je uz 7 pozicii z 13 (kto ma zaujem o zostavajuce, hlaste sa)
  • na stretnuti PS boli predstaveni 3 zo 7 clenov d.k.
  • hlavny scope:
    • 1x a dost resp. zdielanie ref. udajov
    • data patria lucom: My Data, Open Data
    • analyticke vyuzivanie udajov
  • dalsi scope:
    • kvalita dat
    • zakon o udajoch
    • regulacia
    • vzdelavanie a komunikacia
  • predstava spoluprace d.k. + K9.4: prejednavat stav a plany
  • prve kroky:
    • zakon o udajoch
    • My Data
    • Open Data
    • dopytove vyzvy
    • transpozicia novo doplnenej PSI (doplnana ?-2018, transpozicia: 2019)

Zakon o udajoch:

  • uloha OGP
  • hlavnou motivaciou je, ze stale chyba “jeden pan” pre danu temu
  • mal byt do konca 2018, nestiha sa, posunute na 2019
    • pre 2019 priorita
  • aktualne prve kroky:
    • dokumentovanie problemovych oblasti
    • participacia: plan odhadom 80 ludi z roznych sfer (VS, NGO, firmy, …)
    • o.i. teda aj analyza, ze ci jeden novy zakon alebo novelizacia X existujucich zakonov

Dopytova vyzva k Open Data a Memezment udajov:

  • stav k 15.11.: pre konkretne tuto temu prijate 4 ziadosti, vsetko za radovo miliony €
    • MZV SR (v realizacii/schvlovani je najdalej)
    • MD SR: ISV
    • NASES
    • Agentura pre podporu vyskumu a vyvoja (najnovsia ziadost)
    • (zatial ziadne “male zlepsenia”)
  • t.j. hybe sa, ale nie je to uplne to, co by sme chceli
  • co dalej:
    • zjednodusenia (vzorove dokumenty, zjednodusene dokumenty)
    • mozno separatna vyzva pre male projekty (za radovo desat ci stotisice)

Dalsie kroky v K9.4:

  • potvrdit clenstvo: kto nadalej planuje participovat
  • zozbiertat dalsie navrhy tem pre PS
  • Open Data metodiky

Keďže záber pracovnej skupiny je veľký, aby sa dalo sústrediť na konkrétne úlohy, vzniknú tematické “podskupiny”, ktoré sa budú schádzať a pracovať podľa potreby a môže sa do nich zapojiť v zásade každý kto má záujem (nemusí byť formálne členom PS).
Prvá takáto podskupina je pre tému “zákon o údajoch”. Viesť ju bude Milan Andrejkovič, ktorý prisľúbil maximálnu otvorenosť. Jej cieľ je daný úlohou “predložiť na rokovanie vlády zákon o údajoch”, ale ja dúfam že to bude niečo zmysluplnejšie, napr. prebrať stav legislatívneho pokrytia a potrieb pre všetky veci týkajúce sa riadenia údajov.
Kto má záujem byť v tejto podskupine, hláste sa Milanovi, mailto:Milan.Andrejkovic2@minv.sk .

Ďalšie podskupiny, ktoré pravdepodobne vzniknú:

  • OpenData - primárne pre dátových kurátorov
  • dopytová výzva Manažment údajov - pomoc so zapojením sa do výzvy
  • My Data - vytvoriť k tomu potrebné metodiky atď. aby z toho aj niečo bolo
  • ref. registre a 1x a dosť

Ahojte,

dovoľte mi pár bodov:

  1. Od decembra už nerobím v Datalane, ale budem pôsobiť mimo SR. Hovorím to v malej nádeji, že snáď to pomôže linked data na slovensku (aby som nebol podozrievaný že úmyslom je zabetónovanie Datalanu v tejto oblasti). Za všetky veci ,ktoré sa dostali do strategickej priority Manažment údajov, resp. Open Data, resp. sémantické štandardy ktoré sa vytvorili: Centrálny model údajov S, aplikačné profily DCAT-AP-SK, CPSV-AP-SK, … a mnohé iné, stojím za nimi absolútne :slight_smile: Som presvedčený, že interoperabilita má v štátnych dátach miesto. A je dokonca kľúčová.

  2. Plánujem spraviť novú verziu Centrálneho modelu (1.2), ktorú chcem hodne zjednodušiť a vylepšiť. Jednak chcem vypustiť viacero zbytočných národných dátových prvkov, tj. napr. názov organizácie (právneho subjektu) nech nie je lsub:name, ale použijú sa priamo štandardy, ako foaf:name v tomto prípade. Takisto chcem prerobiť číselníky do validnych SKOS taxonómií, aby sa lahko dali používať aj v nástrojoch podporujúcich RDF formáty.

  3. No a samozrejme, plánujem v priebehu druhej polovice ďalšieho roka publikovať LODSlovakia2019, kde budú všetky štandardy premietnuté spolu s novými datasetmi.

  4. Čiže v týchto súvislostiach, chcem sa angažovať v podskupinách súvisiacich s dátovou kvalitou, OpenDátami, Referečnými údajmi a podobne. Navrhnem UPVII, aby urobilo niečo ako výzvu na zozbieranie návrhov, pripomienok, či otázok, ktoré s dátami súvisia. Dostal som viac otázok k URI, a presne toto by mohla byť téma. “Počuli sme niečo o URI, ale nevieme/chceme/nechceme” ho použiť v tejto situácii. Čo s tým?".

Na týchto stretnutiach som nebol, a toto hlasovanie považujem sa trošku zvláštne. Veď linked data a API proti sebe nestoja. Otázka je iná. Či majú byť dáta popísané jednotným modelom a majú byť jednotne identifikované, ale je to jedno, a každý si to môže urobiť ako chce. Ja budem teda argumentovať, že štandardy sú nutné, a to nielen v IT.

  1. Som presvedčený, že je tzv. proces Meta-Data Governance je jedným z kľúčových procesov, ktoré by mali bežať v rámci IT. Už dávnejšie som tu o tom písal.
    MIRRI Pracovná skupina K9.2 Governance - #5 by liska

Ano, hlasovanie (k danej otazke, ale v zasade aj takmer cele) bolo vcelku zvlastne. Moj odhad dovodov:

  1. nedostatocne hlbsie pochopenie
  2. obava z vysokych nakladov na API a vysokych nakladov na 5* (a ze bude treba oboje naraz => este vyssie naklady)

(pricom vlastne 2 vyplyva z 1)

Preto by som to nateraz uzavrel zhruba citaciou Jana Hargasa ( https://www.youtube.com/watch?time_continue=2&v=Er4uzJNAMIU&utm_source=sendinblue&utm_campaign=Flash_news__template ):

  1. “1x a dost” v zmysle vysledkov
  2. ludske zdroje

Tot ti ludia by mali prekusnut to nedostatocne hlbsie pochopenie.

Takže sa nakoniec zriaďuje 6 odborných skupín. Data is the king. Kto máte záujem, prihláste sa!

Dosiahnutie konkrétnych výsledkov v oblasti riadenia údajov je jednou z najvyšších priorít informatizácie verejnej správy. Na tento účel v rámci PS K9.4 Lepšie údaje začínajú činnosť špecializované pracovné skupiny:

  1. Zákon o údajoch - Cieľom je zanalyzovať súčasný stav legislatívneho pokrytia všetkých tém súvisiacich s riadením a používaním údajov vo verejnej správe a tam kde je to potrebné návrh riešenia až po vypracovanie návrhu nového zákona o údajoch.

  2. OpenData - Skupina zameraná na úlohy a ciele v sprístupňovaní otvorených údajov a súvisiace témy, najmä v kompetencii dátových kurátorov vo verejnej správe.

  3. MyData - Náplň práce skupiny je rozpracovanie konceptu MyData a jeho zavedenie do praxe.

  4. 1x a dosť - Skupina sa bude zaoberať všetkými témami súvisiacimi s konceptom 1x a dosť, t.j. najmä referenčné registre, kvalita údajov, integrácie.

  5. Data mining - Riešenie problematiky analýzy údajov, big data a pod. vrátane pokrytia potrieb analytických skupnín vo verejnej správe.

  6. Dopytové výzvy - Pomoc so zapájaním sa do dopytovej výzvy OPII špecializovanej na riadenie údajov, vyhodnotenie dopytovej výzvy, príprava ďalších kôl.

Tieto skupiny budú úzko zamerané na príslušnú tému. Výstupy ich práce budú následne prerokúvané vo “veľkej” PS K9.4. Stretávať sa a komunikovať budú podľa podľa potreby tak, ako sa sami dohodnú. Do ich práce sa môže zapojiť každý kto má reálny záujem, zapojenie koordinuje Milan Andrekovič / ÚSVROS, ozvite sa mu na aresu mailto:Milan.Andrejkovic2@minv.sk .

1 Like

18.12.2018 bolo dalsie strretnutie. Oficialny zapis by mal pribudnut niekde tu: https://drive.google.com/drive/folders/1htkLkndUppCv469v6WZFwL7LBK9CUj9w . Novy zdielany pracovny priestor je tu: https://drive.google.com/drive/folders/1gyznc3x00kSB_feukG9_n0guxyITq1iJ?usp=sharing .

Par mojich poznamok zo stretnutia:

Analyza hodnoty Open Data (OD)

ucel:

  • odhadnut prinosy, …
  • … aby bolo mozne vyargumentovat financie vydavane na publikovanie (ci kompenzovanie vypadkov prijimov z predaja dat)
  • naznacit strategie/priority co a ako publikovat

vid draft v GDocs: https://docs.google.com/document/d/1SBXRzbqBWe8jlYTkAXVsPhMum-MCJwCM7UolLEwuci4/edit

dalsi dokument: https://docs.google.com/document/d/1xiV809iAOjDxN7hChQ8_6hIK3FiS2Et6i58IT0pma40/edit

ako zdielat ci inak motivovat zdielanie vycistenych dat?

UPPVII posle linku na “vzorcek” pocitania ceny datasetov pre Dopytovky, tot aby sme (tu v PS) posudili, ci su tie Dopytovky posudzovane spravne

  • nejaka “priloha 10”

O vedeni dig. agiend

realita: kopa agiend (a teda udajov) sa vedie na papieroch resp. textovych dokumentoch

motivacia: co najviac agiend robit strukturovane, cize ak nie v nejakom IS tak aspon v “XLS”

ako:

  • tym, co trvaju na papieri nakazat, aby to robili digitalne
  • len pre nove agendy a nie take, na ktore je resp. bude IS

vo vseobecnosti samozrejme zaujimave pre OpenData, ale …

  • viac tema na dat. kuratorov a IS architektov
  • o.i. ludia nevedia robit poriadne ani len v tabulkovom procesore => velke riziko pre samotne vedenie agendy a potom samozrejme aj zverejnovanie OpenData

mensie poznamky:

  • nespominat XLS ale “tabulkovy procesor”
  • nech to aj dodrziava aspon ten, kto to vyhlasil (t.j. napr. nech UPPVII predklada navrhy legislativy v SlovLex-e v struturovanej forme, kedze SLovLex take podporuje)

Prioritne datasety

vychadzat by sme mohli napr z materialu k ref. udajom, vid https://drive.google.com/file/d/1DMkKmMvJ2FYYLZax-JO97LHghx8yKcoN/view

podla Global Open Data Index:

  • SU: napr. presunut kod publikovanie RPO z S.D rovno do SU { -> zvysenie skore v GODI }
  • SHMU: kvalita vzduchu a vody

Projekt “Dátová integrácia” vs. OD

nestihli sme prebrat vramci “plnej ucasti”, ale pointa je, ze teda v SU sa spominaju Open Data a planuju cerpat financie (a nie malo) z prioprotnej osy Open Data, cize bolo by nanajvys ziaduce, aby ten projekt aj realne publikovat Open Data (a vela a poriadne)

  • problem: aktualna vyzva/onstaravanie tomu velmi nezodpoveda

Cinnost PS

stretavanie raz za 2 tyzdne

dalsie stretnutie: 15.1.2019

pozriet velky zoznam nesplnench uloh a vybrat, ktore budeme najblizsie riesit: https://docs.google.com/spreadsheets/d/1qCMGoX4nND5T9hLQr1klt7Waw3ZzC5qZiboGj4FbCJ0/edit#gid=421468090

Tu len pripomeniem, ze analyza by bvola samozrejme dobra (kvoli “pozitivnej motrivacii”) ale nie je to uplne nutne, kedze tu mame aj “negativnu motivaciu” v podobe povinnosti, ktore definuje PSI smernica.

Tu sme debatili o tom, ze napr. RPO je v podobe Open Data zvrejenovane nasledovne:

  1. SU dal S.D “nejake API”
  2. S.D cez to API taha surtove data z SU
  3. S.D surove data nejako cisti a prepaja
  4. S.D vysledne Open Data zverejnuje, vid Vyčistené, štruktúrované dáta nielen o firmách. · Datahub

A pointa je, ako zabezpecit, ze ked uz raz niekto nieco vycistil a pospajal, tak ako zabezpecit, aby dalsi nemuseli robit to iste este raz (t.j. podelit sa o benefity … ale zrejme aj naklady)?

A otazka znie, ako nieco take sformalizovat a ako k niecomu takemu motivovat organizacie aj v pripade dalsich datasetov? Mame napr. ocakavat, ze nejake “ciste data” poskytne naprp. FinStat (ako sukromny komercny subjekt) alebo naopak tlacit, aby sa adsej cistilo “uz pri zdroji” (t.j. ta ktora PO/OVM)?

Tu uz sme IMHO zasli mimo temu “Open Data” a zasli k high-level sferam informatizacie. A potom tu narazame na to, ze na mnohych miestach nevedia riadne pracovat s PC. A na mnohych dalsich miestach potom PC ani len nemaju. A co s tym?

K tomu malo by nejake stretnutie, zatial nebolo. CC @Lubor

Tu teda ide o toto obstaravanie: Dátová integrácia: sprístupnenie údajovej základne VS vrátane otvorených údajov prostredníctvom platformy dátovej integrácie

V nadvaznosti na opatovny rozbeh K9.4 bolo 11.12.2018 aj stretnutie podskupiny “Referenčné údaje a 1 x a dosť”. Zapis: https://docs.google.com/document/d/14qofTALj4OIPtX4d8TTsZu9Z9TBqW8eZ4-FMxv5E6NA/edit#heading=h.gjdgxs

Za mna asi najpodstatnejsi bol je “issue tracker”. Tie ostatne su sice tiez dolezite, ale dlhodobo sa vramci Ps potkame s problemom “bola definovana uloha, potom sa k nej ale stratia informaice a … nainiec nie je plnena a malokto si pamata, ze vobec bola a o com mala byt”. Tot issue tracker by mal pomoct vylepsit.

Poopravim. Rpo dataset v ekosystéme nie nijako vycisteny (naschvál). Je to replika 1:1 toho co vracia rpo z public “api”. To čo je vyčistené je prémiové api.

Podľa mňa to treba čistiť pri zdroji, my vieme poslať prinajlepšom kandidátov na čistenie, robiť reporty chybných údajov atď.

1 Like