Dátová integrácia (Konsolidácia nosnej údajovej základne pre sprístupnenie formou otvorených údajov)

…nakolko ide o rozvoj CSRU…nemali tieto funkcionality uz existovat v ramci sucasnej verzie CSRU, kedze v zmysle zakona 305 uz teraz poskyuju referencne data?..

…podla tvrdenia to znamena, ze aktualne v ramci CSRU nie su data cistene… :slight_smile:

…mna by skor zaujimalo, ze ktore konkretne datove struktury za tieto OVM su prioritne…

…tato poziadavka zaroven implikuje poziadavku na bezpecnostny projekt s dorazom na spracovanie osobnych udajov…

Ahojte,

dovolím si uviesť pár informácií. Včera odišli pripomienky k uvedenému zámeru od ITASu, do ktorých som mal možnosť vstúpiť, keďže som členom PS1 za ITAS a aj K9.4. Som zástupcia frakcie ITAS-LinkedData :wink: samozrejme, a v takom duchu boli aj pripomienky, tj. že pôvodná textácia tak ako bola publikovaná, zaťiaľ nesĺňa niektoré ciele, pre nás klúčové, tj. povinnosť používania URI identifikárotov registrovaných cez MetaIS, či povinnosť zosúladenia sa a rozšírenia Centrálneho modelu údajov verejnej správy založeného na Ontológiách. Po intenzívnej debate sme ale našli spoločné znenie uvedených pripomienok.

Celkovo vzniklo cca 13-LinkedData pripomienok, drvivá väčšina je o spresnení textácie, napr. táto

alebo podobné

S týmto musím súhlasiť, takáto textácia o použití TALENDu by tam podľa mňa nemala vôbec byť takto formulovaná. Takto sa mi to podarilo aspoň posunúť, že treba stavať na všetkom dobrom čo existuje, či je to už CSRU, alebo Modul elektronickej demokracie, aby sa využili už vytvorené a pripravené projekty. Podmienka toho, že by sa nemala predpisovať implementačná architektúra ale skôr napĺňanie cieľov by sa podľa mňa mohla objaviť v pravidlách na štúdie uskutočniteľnosti, čo skúsim načrtnúť na najbližšej pracovnej skupine K9.4. Tak trochu dúfam že aj na úrade UVPII spracujú finálnu verziu štúdie tak, že nebude obsahovať žiadne vynútenie akejkoľvek konkrétnej technológie.

Suma sumárum: Aby som to spresnil, nie som proti TALENDu, ale celková problematika správy referenčných údajov s podporou URI, resp. ontológií ďaleko presahuje TALEND. A efektívna implementácia CSRU s podporou Centrálneho modelu údajov a URI bude ešte challenge. Ale toto je všeobecný problém, nie len tohto projektu. I keď sa snažíme postupne presadzovať LinkedData, je nám jasné že nás čaká ešte éra, kedy sa jednoducho nedá okamžite nahradiť súčasná architektúra za nové grafové databázy, čiže nám naozaj teraz nejde o sémantické technológie (o prostriedok), ale o použitie URI a Centrálneho modelu (cieľ). Predpokladám že aj keĎ raz Slovensko.Digital začne používať URI, tak tiež nezhodí svoju vybudovanú infraštruktúru, ale v prvej fáze bude skôr obohacovať relačné dáta o URI.
Čiže z tohto dôvodu a podpory LinkedData štúdiu vnímam pozitívne, ale ako som napísal, kľúčové bude urobiť celkovú architektúru správne.

Este som sa kukol na tu CBA:

To zapojenie konzumenta je dufam nejaky vtip. 32tisic eur za to, ze niekomu spristupnim API? Prosim rozbit na dva riadky, pridavanie DQ k tomu len zbytocne pridava sum.

To je tak zle urobene to CSRU, ze tam treba kazdy jeden dataset pridavat cez nejaky change request za 30K a aj konzumenta?

Na strane štátu sa očakávajú prínosy najmä v podobe odbremenenia štátnych zamestnancov od neproduktívnej administratívnej práce, usporia sa náklady na poštovnom, nižšie budú aj časové/finančné náklady súvisiace s tlačením množstva dokumentov. V neposlednom rade sa podstatne zjednoduší prístupu k informáciám o občanoch/podnikateľoch.
Čistá súčasná ekonomická hodnota (ENPV) : 89 470 252,37 EUR
Rok návratu investície (PBP) : 4. Rok (od začiatku realizácie projektu)

Ak teda chceme zaratat usporu na administrative v tomto projekte, dufam, ze uz v ziadnom inom ktory sa na CSRU bude integrovat (t.j. skoro vsetky), sa to zapocitavat do prinosov nebude.

1 Like

Uvaha na zaklade toho, co som dnes pocul na K9.4: V “starom CSRU” bolo vraj velmy nedostakom, ze “pripajanie” zacinalo ebatou medzi niekym (prevazkovatel CSRU?) a nieym dalim (ten kto sa mal pripojit a dat do CSRU data), ze teda:

  • pripojte sa a dajte data
  • nemozeme, zakon nedovoli

Nasledne sa pracne “dokazovalo”, ze teda zakon nebrani.

Vraj.

Tot eda uvaha: S tym teda mozno pocitaju aj nadalej, preto taka vysoka cena. Skoro by som povedal “vykupne”, len teda neviem kolko z tej sumy bude realne koncit u OVM.

Ak uvazime, ze mnohe z tych API/datasetov by mali byt aj Open Data a teda zadarmo, tak to by mala byt takmer cisto cena za SLA, t.j. nejake vyrzne vyssie garancie dostupnosti a vykonu. Ale aj to je zatial len moja uvaha.

Ja som tiez pozrel CBA, ale z prinosovej strany. Je to zaujimave. Rataju ze ked spravia projekt tak:

  • bude viac podani
  • budu za nizsi poplatok (asi zlava 50%)
  • spracovanie bude trvat uradnikovi iba polovicu casu
  • cas na vypracovanie a dorucenie podania sa skrati o polovicu
  • bude na to stacit polovica zamestnancov

Tieto dva parametre robia takmer vsetky prinosy (15mil rocne na usetrenom case):

  • bude viac podani (7.5 krat)
  • cas na vypracovanie a dorucenie podania sa skrati o polovicu
    (treba pozriet sheet Parametre - Agendové IS a sheet Prínosy - Agendové IS)
    Untitled
    Cisla su tam len tak, bez nejakeho zdovodnenia…rad by som si to precital.

Tiez mam pocit, ze s tymi istymi usporami ratali pri CBA povodneho CSRU, avsak uz sa neda stiahnut z informatizacia.sk. Nema to niekto u seba?

Myslim, ze tu je mirror. IS CSRU - Rozbor Respektive aspon ta CBA co bola pri ZoNFP.

Vyzera ze pouzili velmi podobnu, ak nie rovnaku logiku, akurat v novom projekte su prinosy este vyssie.
Kedze vsak CSRU je uz realizovane, malo by byt mozne preukazat, ci tie benefity z povodnej CBA naozaj nastali…alebo ci boli iba fiktivne.

2 Likes

No nie je to fantasticke, ze zase raz sme nasli projekt, ktory zarobi/usetri X penazi, naklady su presne X penazi a este sa to cele trafi presne do potrebneho roku navratnosti podla EU pravidiel?

2 Likes

Na dnešnej prezentácii projektu bolo uvedené, že je plánované že bude financovaný zo špecifického cieľa 7.5 OPII. To je “Zlepšenie celkovej dostupnosti dát verejnej správy vo forme otvorených dát”. Aj podľa aktuálneho názvu štúdie je toto vlastne podávané ako OpenData projekt.

Problém je však v tom, že celá štúdia je o G2G integráciách, 1x a dosť a OpenData sú tam iba zopárkrát spomenuté.

To však, ako vieme, nestačí. Aby bolo uveriteľné, že naozaj pomocou tohto projektu vznikne podstatné množstvo nových OpenData datasetov, je potrebné už v štúdii:

  1. Zahrnúť OpenData do celého “cyklu” spracovania každých (referenčných) údajov, ktoré budú projektom pokryté

  2. V štúdii popísať podstatné veci týkajúce sa publikovania údajov. Špecificky, keďže storage/endpointy/SLA pre dáta sú dnes komodita, je v štúdii nevyhnutné posúdiť tieto alternatívy: publikovanie OpenData ako nadstavba MÚK, použitie MOD ÚPVS, alebo použitie “komerčného” riešenia, t.j. služby vládneho cloudu poskytovanej externými subjektmi.

  3. Od začiatku rátať so spoluprácou s používateľmi otvorených údajov a istou flexibilitou (keď už nechcem povedať agilnosťou) pri hľadaní optimálnej štruktúry sprístupňovaných údajov - viď. pozitívny príklad OpenData ITMS2014+

1 Like

hadal by som, že to sú tie integračné dohody, vieš 3 stranne meetingy, právnici, technici, manažéri, eskalácie, nekonečná mailová komunikácia, nakoniec vypracovanie dokumentu, jeho pripomienkovanie, prepracovanie, zapracovanie zmien a nakoniec jeho podpísanie,
potom to už iba sprístupníš :smiley:

Na prezentácii bolo povedané, že predpokladaná suma za projekt - aktuálne 16,1M€ - bude pokrývať nielen technické riešenie pripojenia údajov do MÚK, ale aj celé “papierové” spracovanie príslušných integrácií. Náklady majú byť zhruba na polovicu rozdelné:

  • 8,6M€ má byť použitých na “centrálnu” časť, t.j. analýza, riešenie integrácie, tím v centre, administratíva projektu…
  • 7,5M€ majú použiť jednotlivé úrady, ktoré sa pripájajú, na úpravu svojich IS, pripojenie do integrácie z ich strany, čistenie údajov atď.

Pri takýchto sumách, ak sa skutočne podarí naplniť ciele projektu, to považujem za obrovský pokrok oproti doterajšiemu stavu. A to nielen v porovnaní s pôvodným projektom CSRÚ. Veď v aktuálnych štúdiách sú na integrácie kalkulované astronomické sumy - a z veľkej časti na základe predošlých skúseností z anabázy spojenej s integráciami. Povedzme len v nedávno schválenej ŠÚ pre Obchodný register je na integrácie + OpenData spolu kalkulované 1,75M€.

Tento projekt by mal preto nastaviť nový štandard pre integrácie (dátové, nie zápisové). Aj čo sa týka procesu, technickej realizácie, aj nákladov.

Ale pozor, tento projekt nerieši upgrade CSRÚ. Na to bude nová štúdia, tiež s určite aspoň 8-ciferným rozpočtom. Niekde by to malo byť na jednom mieste popísané, aké projekty budú a aké celkové náklady sú na to odhadované.

2 Likes

hahahahaha. tak toto je ešte len vtip

Aby som to doplnil, podľa mňa, zapojenie konzumenta môže trvať tak maximálne 5 hodín práce úradníkov na oboch stranách. Prečo by sa vôbec malo zato niečo účtovať?? Či to je tá vata?

…osobne, ked som to cital, tak som mal z toho pocit, ze ide o upgrade CSRU ako celku…

…z tych info, ktore su k dispozicii tomuto celemu zameru (aktualna studia a teda “planovany” rozvoj CSRU) vobec nerozumiem obsahovo, funkcne a ani rozdeleniu na jednotlive realizacne fazy…

…napada ma x otazok…ako napr.:

rozvojom a modifikaciou CSRU sa nedaju ziskat znizenie nakladov na zapajanie poskytovatelov a konzumentov dat?

ak plati, ze vsetky data z CSRU maju byt pristupne ako opendata, teda to beriem tak, ze aj referencne, tak kto bude realizovat pripajanie konzumentov dat?

ak plati, ze v ramci tejto studie nejde o rozvoj CSRU a su v nej planovane MDM procesy a funkcionality, tak z toho vyplyva, ze sucasna verzia CSRU tieto funkcionality vobec nema?

MDM procesy a funkcionality by nemali byt primarne riesene v zdrojovych ISVS a az nasledne budovat API na poskytovanie dat?

je kvalita a funkcnost v sucasnosti na takej urovni, ze ma vyznam nad CSRU budovat novu funkcionalitu/nadstavbu a teda rozvoj CSRU nebude mat nasledne na tuto nadstavbu ziaden dopad?

riziko a termin dodania centralneho velkeho riesenia vs. postupne kroky ako napr. vybudovanie standardizovanch API jednotlivych ISVS (ISVS to budu musiet spravit tak ci tak), ich monitoring, identifikacia najpozivanejsisch API a datovych struktur, na zaklade tohto cistenie dat a pod.

atd

1 Like

Toto sú správne otázky, na väčšinu ja neviem odpovedať a v tejto štúdii to (zatiaľ) nie je popísané.

Aké teda budú “všetky” projekty v oblasti riadenia dát som sa pýtal aj na prezentácii, ak si správne pamätám odpoveď bola takáto:

  • centrálne integrácie/konsolidácia údajov/referenčné údaje + OpenData z toho - to je tento projekt
  • rozvoj CSRÚ, tak aby spĺňal požiadavky definované v strategickej priorite manažment údajov
  • centrálne riešenie MyData
  • dopytové projekty pre OVM na riešenie (správa/kvalita/používanie…) údajov u seba

Ale tieto veci určite treba do štúdie doplniť. Napr. mi nie je jasné, prečo je efektívne najprv začať s pripájaním ďalších producentov/konzumentov na CSRÚ a až následne ho modifikovať, čo bude mať dopad aj na služby a štruktúry údajov.

2 Likes

Myslim ze to pravidlo viacerych mensich projektov asi nepochopili tak ako ste navrhli. Asi uz ani urad nema predstavu kolko tych projektov ma byt a kto bude co realizovat. Hlavne ze mame novy leitmotiv statnych projektov. Ked tam bude “data” alebo “udaje” tak je to to prave orechove.

1 Like

skusim zopar odpovedi, táto téma ma zaujíma od začiatku :slight_smile:

štúdia je napísaná tak, že sa nedá, ale je to čistý nezmysel. Chápem to uplne rovnako, ale autor štúdie to ignoruje

je úplne nelogické aby boli všetky dáta vstupujúce do CSRU prístupné aj ako open data. Ďalší fail autorov štúdie. Určite bude množstvo dát, ktoré by ani nemohli byť prístupné ako open data. Pre prístup k open data je predsa open data portál. Tam sa pripájajú aj konzumenti open dát. Okrem toho CSRÚ neuchováva žiadne dáta, iba sprístupňuje referenčné dáta v ISVS

súčasná verzia CSRU určite má funkcionality MDM - aspoň tak boli komunikované zo strany ešte vtedy MF SR. Možno autor štúdie znova nie celkom odkrýva karty

Áno. MDM procesy sa primárne riešia v zdrojových ISVS. Poskytovateľ dát iba využíva dostupné funkcionality v CSRÚ, aby si uľahčil interné procesy pri “upratovaní” v dátach

V tej štúdii vôbec nie je jasne popísaný rozsah funkcionalít, ktoré dnes CSRÚ má, a rozsah a pridaná hodnota nových funkcionalít. A toto asi bolo primárnym cieľom autorov. Zahmliť čo najviac

2 Likes

Táto štúdia/projekt totiž nerieši CSRÚ, ale “iba” integrácie. Na rozvoj CSRÚ sa pripravuje ďalšia štúdia…

celkom som zvedavy o com bude toto https://metais.finance.gov.sk/studia/detail/635b50c2-c482-049f-c6a3-1f5eca675621?tab=basicForm

1 Like

Ja tipujem, že integrácie a presun do cloudu. To vyzerá byť teraz ryža :slight_smile: