Dátová integrácia (Konsolidácia nosnej údajovej základne pre sprístupnenie formou otvorených údajov)

jsuchal · August 27, 2017, 3:09pm

Mame tu novu studiu, javi sa to ako pokracovanie CSRU. https://metais.finance.gov.sk/studia/detail/6a3eda58-d61a-33e8-4034-33afda4eb51a?tab=documents

Pre osviezenie pamate, zopar topicov k tomu tu:

Prijimame pripomienky.

milosm · August 28, 2017, 9:35am

Štúdia betónuje postavenie produktu Talend MDM Platform v technologickej architektúre.
Rovnako sa “betónuje” aj on-premise architektúra vo vládnom “cloude” (rozumej datacentrum s virtuálmi servermi).

Cena za integráciu jedného datasetu (len na strane CSRU) je 26.875,-€ a cena za zapojenie konzumenta je 32.083€. V prvom prípade - producenti takmer 200 OVM a v druhom - konzumenti takmer 300.

Ak by takéto sumy dostali chalani za platforma.digital.slovensko tak sú v balíku už teraz.

robert.kuchar · August 28, 2017, 1:32pm

toto by som nevnímal ako problém. Skôr naopak. Či už niekto chce, alebo nie, pri velkých implementáciách je nutné si vybrať kľúčovú technológiu (-ie), ktoré sa na dlhý čas stanú nosné. Nie je nič nechutnejšie pre administrátorov, než aby sa na každú parciálnu funkcionalitu učili adminstrovať iný server od iného výrobcu a ešte nebodaj totálny FOSS bez dokumentácie a záruky …

hanecak · August 28, 2017, 2:18pm

Kto by radsej cital Wiki,tak: https://wiki.finance.gov.sk/display/SU/SU-MD-su_86

milosm · August 29, 2017, 8:31am

Len dúfam, že podmienkou účasti v tendri nebude “projekt realizovaný na technológii Talend”.

hanecak · August 31, 2017, 10:33am

Zrejme bude podmienka ucasti striktnejsia: Musi to byt niekto, kto pred tym dodal CSRU. (evidentne totiz nepojde len o nakup dodatocnych Talend licencii) Asi ako tu: Rozšírenie funkcionality IS Doklady .

hanecak · August 31, 2017, 11:18am

Nuz a k veci (nadviazem na ÚPVII Pracovná skupina K9.4 Lepšie dáta ):

nateraz by som uprednostnil decentralizovany(-ejsi) pristup kedy PO zverejnuju resp. zdielaju udaje v sulade s vystupmi z KS ISVS (najma PS1) s tym, ze KS a buduci datovy kuratori by sluzili ako koordinacna autorita =>
=> nateraz priestor na jednu centralnu integracnu udajovu platformu nevidim
neskor ale prax moze ukazat, ze bude treba (mali by povedat napr. datrovy kuratori, ked uz si aj nieco realne preskacu)
a ak sa bude riesit, tak o.i. treba rozlusknut, ze ci sa budu pouzivat existujuce nastroje v NASES/eDem/MOD (ETL na baze COMSODE, BI na baze IBM) alebo CSRU (Talend ako ETL, MDM, …) alebo pojdeme na este nieco ine, novsie, lepsie

jsuchal · August 31, 2017, 11:24pm

No tak podme na to:

pre realizáciu princípu „Jeden krát a dosť“ a sprístupňovanie otvorených údajov pre „kritickú masu“ OVM.

ciele:

zavedenia manažmentu údajov vo VS (data governance)

implementácie master data managemet pohľadu na dáta VS

riešenia dátovej kvality

Nepredpokladá sa zmena platformy pre dátovú integráciu, dátovú kvalitu a ani pre manažment údajov (TALEND). Taktiež sa nepredpokladá zmena na úrovni technologickej architektúry.

vystupy:
Služby pre virtualizáciu dát
Zápisová služba pre komunikáciu zdrojového a referenčného registra
Priamy „push model“ distribúcie údajov
Mechanizmus komunikácie o zmenách údajov
Služby manažmentu a distribúcie kmeňových údajov (číselníky, MDM)
Služba vyhľadávania Zabezpečenie údajov pre službu „Moje dáta“
Nástroje pre správu oprávnení
Vytvorenie GUI pre prístup k registrom a referenčným údajom
Vytvorenie platformy generického registra Služby manipulácie, anonymizácie (pseudoanonymizácie) a transformácie údajov
Služba poskytujúca údaje pre nadstavbový modul „Moje dáta“

Co je to virtualizacia dat?

Dôležité je, aby bola podporená automatizácia zdieľania údajov medzi jednotlivými informačnými systémami verejnej správy a súvisiace odstránenie manuálnych činností pracovníkov verejnej správy (prepisovanie údajov z jednej aplikácie do druhej)

Toto prosim pekne kto dnes takto robi?

Tieto údaje budú na jednom mieste čistené na duplicity a chyby a budú poskytované konzumentom už som zabezpečenou kvalitou. Zapojenie nového poskytovateľa teda v praxi znamená integrácia, čistenie údajov, štandardizácia, vyhlásenie údajov ako referenčných.

Tato predstava je zaujimava, avsak v praxi ju vidim velmi tazko vykonatelnu. CSRU 2.0 resp. platforma datovej integracie sa dostane do podobnej situacie ako RPO - budu mat u seba kopec “spinavych” dat z roznych zdrojov, ktore vycistit NEmozu, lebo zodpovedny za data je niekto iny.

Pripájanie tejto kritickej masy bude riešené centrálne a systematicky. Samotný proces dátovej integrácie sa výrazne zjednoduší a automatizuje. Zavedie sa nový biznis model riadenia služby. Zámerom je, aby bolo možné pripojiť konzumenta údajov do jedného týždňa a poskytovateľa údajov do dvoch týždňov.

Ciel je dobry, ale preco na toto potrebujeme centralne riesenie? Co brani mat jeden tvrdy standard API na rozne trebars aj decentralizovane endpointy? Alebo urobit mikrosluzby na ciastkove veci? Nebolo by lepsie skor spravit nejaky jednotny proces integracneho zameru, ktory bude velmi jednoduchy? Z mojej skusenosti toto bol ovela vacsi problem ako technicke problemy alebo aj rozne API.

Prvá fáza (prvých 9 mesiacov) bude zahŕňať poskytovateľov vysokej priority a konzumentov údajov už evidovaných. Znamená to, že sa integrujú inštitúcie ako MV SR, MS SR, MF SR, MŠVVaŠ SR, ÚPSVaR, GP SR, ÚGKK SR a ďalší. Po skončení fázy 1 budú vytvorené podmienky pre použitie objektov evidencie ako sú údaje fyzickej osoby v RFO…

O tomto MV alebo take MZ vie? Predstava, ze cez nejaky centralny komponent na UPVII potecu data o fyzickych osobach sa mi nejako spaja s ich paranoiou.

V praxi sa ukázala potreba rozšírenia tejto množiny konsolidovaných údajov použiteľných na právne účely z dôvodu zefektívnenia procesov verejnej správy, a to ich poskytovaním na jednom centrálnom mieste.

Citation needed! Kde v praxi?

Alternativy

Alternatíva: A - „Ponechanie súčasného stavu",
Alternatíva: B - „Vybudovanie nového systému pre konsolidáciu nosnej údajovej základne pre sprístupnenie formou otvorených údajov“,
Alternatíva: C - „Využitie existujúceho IS CSRÚ ako základu pre konsolidáciu nosnej údajovej základne pre sprístupnenie formou otvorených údajov“,
Alternatíva: D - „Realizovanie integrácií jednotlivých OVM priamym prepájaním integrujúcich sa systémov VS“.

Pre decentralizovany system D su oznacene tieto ciele ako nesplnene (N). Povazujem to z velkej casti za uplnu blbost, alebo nieco kardinalne nechapem. Takze postupne jednotlive ciele

Aby údaje boli k dispozícií v konaniach verejnej správy – preco? Dodnes to fungovalo ako? Nedalo sa to bez CSRU? Dalo. Urcie nie N.
Aby verejná správa dokázala využívať svoje údaje v rozhodovacom procese – Opat to iste. Urcite nie N.
Eliminácia duplicitných informácií evidovaných o subjektoch vo verejnej správe – Nezmysel. Duplicity sa odstranuju tym, ze vyhlasime registre za referencne, cistime ich a jasne urcime co kde kto eviduje a ma na zodpovednosti. Nema to vobec nic spolocne s tym, ze ci sa na tieto registre integrujeme many to many alebo hviezdou.
Aplikovanie jednotnej platformy integrácie údajov. – v klude moze byt aj cez decentralizovany model. Akonahle mame platformu ako SaaS sluzby v cloude napr.
Jednotný centrálny model údajov – Samozrejme nezmysel, model mozeme vynucovat aj standardizaciou v uplne decentralizovanom variante.
podpora pre Open Data (Open API, otvorené štandardy) – WTF??? Ved otvorene standardy vznikli presne pre to, aby decentralizovane systemy sa mohli spolu dohovarat.
úspora času občanov a ostatných používateľov služieb – mozno Riziko, urcite nie showstopper
používateľsky prívetivé́ elektronické́ služby – uplna blbost.
aplikácia princípu jedenkrát a dosť – prosim? samozrejme ze nie je problem aj uplne decentralizovanom modeli!
Centrálne riešenie bezpečnosti, auditovateľnosti a nepopierateľnosti údajov - riesitelne aj v decentralizovanom modeli. vid estonsky x-roads (nie je centralizovany)
Spoločné využívanie aplikácií (SaaS služieb) pre verejnú správu - ??? naopak, SaaS sa da pouzit najme pri decentralizovanom modeli.
Zabezpečenie dostupnosti údajov verejnej správy v otvorenom formáte - urcite nie nemozne, treba len standardizaciu.
Zabezpečenie dostupnosti relevantných údajov centrálne na jednom mieste pre občanov a podnikateľov. – EHM, preco to chceme centralne a co su to revelvantne udaje? samozrejme, ze ked povieme, ze to chceme centralne, tak sa decentralizovana alternativa rovno odpada.
Využitie vládneho cloudu - uplna blbost. ved OVM taktiez mozu (musia!) svoje decentralizovane IS migrovat do cloudu.

Alternatíva „Vybudovanie nového systému pre konsolidáciu nosnej údajovej základne pre sprístupnenie formou otvorených údajov“ predpokladá vybudovanie samostatného informačného systému, ktorý zabezpečí vytvorenie požadovanej údajovej základne, v ktorej budú zahrnuté ako údaje aktuálne obsiahnuté v IS CSRÚ tak aj identifikované nové požiadavky na prístup k údajom. Údaje aktuálne obsiahnuté v IS CSRÚ budú získavané priamo zo zdrojových systémov.

Chapem spravne, ze vsetky tieto udaje sa budu zhrnat na centralne miesto? O_O Toto zavana pruserom.

Budovanie nových prepojení medzi IS VS za účelom vzájomného poskytovania referenčných údajov je v rozpore s integračnou architektúrou NKIVS 2014-2020, ktorej cieľom je optimalizovať ad-hoc integrácie medzi systémami a zabrániť dramatickým nárastom zložitosti či nákladom na údržbu prepojení. Z toho dôvodu je toto riešenie zamietnuté.

Toto povazujem za neuplne. Prechod na centralne riesenie nie je nutnou podmienkou na toto. Samozrejme ad-hoc integracie sa vypomstia rychlo, ale nie je nutne na toto mat centralne riesenie. V klude na toto vie byt lokalne instalovane balikove riesenie. Podobne ako open data node.

Preco centralny projekt? - ake su usecasy?
Co su to konsolidovane udaje? a kto a ako ich bude vlastne pouzivat? nie su to jednoducho tie bajne referencne udaje, ktore maju odkazy na ine referencne udaje? Toto nam prinasa vyhlasenie ref. registra a ref. udajov aj v uplne decentralizovanom modeli.

Co ja povazujem za skutocne vyhody centralizacie:

economy of scale
- centralny modul moze riesit high availability a skalovanie na jednom mieste. netreba to robit po x roznych custom systemoch. Takto staci z kazdeho producenta dat iba “jedna rura do centraly”.
- centralizacia procesov pripajania - odhlahcenie prace pre uradnikov na OVM, nasledna specializacia a zrychlenie procesov na UPVII.

A teraz, aby som nefrflal, ale aj pomohol:

Naprv predpoklady:

predpokladam, ze existuje nejaky scenar, kde potrebujem na vystupe dostat data z roznych registrov/systemov a tieto data spolu nikde neexistuju. Napriklad chcem data o nejakej pravnickej osobe a tam k nej aj adresy z registra adries.
V decentralizovanom modeli, by som potreboval integracie dve - na RPO a RA a spajat to u seba. Za predpokladu, ze v oboch registroch sa drzia iba udaje a potom referencia na iny referencny udaj. V praxi je uplne bezne, ze aj RPO bude chciet dotiahnut data z RA, cize tam budu, ale ticho teraz predpokladajme, ze chcem nieco co tam nebude a je to len v RA.

Prizmurim teda oko a budem hladat nejaky ekvivalent v komercii, kde taketo nieco existuje. Je to Facebook a jeho GraphQL len to funguje trosku inak. Je to centralne API, ktore riesi autentifikaciu/bezpecnost/logovanie/jednotne API, avsak vo vnutri moze dopytovat uplne rozne backendy.

Napriklad tu je priklad ako to spravit pre jedno volanie co ide na 3 rozne backendy REST, SQL aj Mongo Tutorial: How to build a GraphQL server - Apollo GraphQL Blog

Cize query na Slovensko.Digital, ktora nieco vytiahne z RPO, RA, statistickeho uradu (ciselniky), dokonca posty (PSC) ci financnej spravy (DIC/ICDPH) by mohla vyzerat nejako takto:

query {
  legal_subject(cin: 50158635) {
    name,
    tin,
    vatin,
    address {
      street_name,
      street_number,
      street_registration_number,
      postal_code
      municipality
      country
    },
  }
}

A na toto tie data vobec nemusia byt lokalne a vobec to nemusi byt take pomale ako to vyzera. vid napr https://youtu.be/etax3aEe2dA?t=18m3s - ciselniky sa daju cachovat atd.

Suma sumarum:

Robit studiu pokym nemame aspon trosku jasne scenare je chyba. Bolo by fajn neist zase OPIS stylom (dame tabulecku sluzieb co nikto nechape), ale aby zo studie bolo jasne ake sluzby ocakavame (az na uroven usecasov!).
Absolutne netusim ako bude realne vykonatelne cistenie a konsolidacia udajov. Toto sa moze robit len v zdrojovych registroch garantom a niekedy ani garantom nie - vid pripady z RPO - kde zapisuju do ZR myslim sudcovia, ale ani ti to neopravia lebo vraj je za to zodpovedny clovek co to sudcovi dal. UPVII ma ambiciu nahanat vdaka tomuto projektu tychto ludi?
Nepacia sa mi sumy za zapajanie novych konzumentov producentov. Toto betonuje dodavatela. Kazdu jednu zmenu kazdeho konzumenta a producenta bude riesit jeden dodavatel? Zlata bana. Pri pouziti graphql si viem predstavit nejaky opensource model, kdeby vedeli dorobit konektor/resolver viaceri dodavatelia (pripadne rovno dodavatel daneho IS konzumenta producenta). Toto by som cakal, ze sa objavi v rizikach a pridu alternativy.
Spomina sa tam genericky register ako aj nejaky sposob distribucie zmien v udajoch. Zatial co zmena zmien v udajoch je povedzme kafka alebo iny message bus, tak genericky register je velmi hmlisty. Bude to obsahovat aj workflowy? To mal byt uplne separe projekt, sem to fakt netahajme.
Predstava, ze sa budu niekde centralne zhravat data (MV, MZ a financnej spravy) je podla mna v slovenskej realite utopia a trosku aj bezpecnostne riziko (pokial sa nemyslia len open data). Dufam, ze to tak bolo myslene.
Bolo by fajn, aby sa niekde objavil skutocny zoznam sluzieb CSRU. Lebo podla studie to malo sluzit ako platforma, ktora pomoze cistit data jednotlivym OVM ale ocividne to uz davno pravda nie je. Zacina z toho rast monstrum na vsetko.
Rad by som vedel ako tato datova platforma zapadne do celkovej architektury hlavne v kontexte otvorenych dat - mame predsa data.gov.sk - v com bude toto ine, lepsie, vonavejsie? A vlastne to co NASES chysta (nove centralne komponeny pre opendata) s tymto ako suvisi? Nie je to duplicita? Bozechran pri kontrole z EU!

peter_k · September 1, 2017, 8:31am

…plne suhlasim…rovnako sa na to pozeram aj ja…

OVM si v ramci ich IS budu musiet aj tak najprv urobit alebo upravit rozhrania, aby data do tej navrhovanej platformy dostali…cize tu sa to moze zastavit a postacuje spristupnit rozhrania…zacnu sa pouzivat a myslim si, ze rychlejsie ako keby tam mala prist este faza budovania/upravy datovej platformy a spristupnenie dat cez nu, pouzivanim sa vychytaju muchy, chyby a pod. ukaze sa o co je zaujem a o co nie a co teda ma zmysel pripadne do tej datovej platformy neskor migrovat a aj v akom poradi
tiez som zastancom decentralizovanych rieseni

peter_k · September 1, 2017, 8:50am

…nakolko ide o rozvoj CSRU…nemali tieto funkcionality uz existovat v ramci sucasnej verzie CSRU, kedze v zmysle zakona 305 uz teraz poskyuju referencne data?..

…podla tvrdenia to znamena, ze aktualne v ramci CSRU nie su data cistene…

…mna by skor zaujimalo, ze ktore konkretne datove struktury za tieto OVM su prioritne…

…tato poziadavka zaroven implikuje poziadavku na bezpecnostny projekt s dorazom na spracovanie osobnych udajov…

liska · September 1, 2017, 9:41am

Ahojte,

dovolím si uviesť pár informácií. Včera odišli pripomienky k uvedenému zámeru od ITASu, do ktorých som mal možnosť vstúpiť, keďže som členom PS1 za ITAS a aj K9.4. Som zástupcia frakcie ITAS-LinkedData samozrejme, a v takom duchu boli aj pripomienky, tj. že pôvodná textácia tak ako bola publikovaná, zaťiaľ nesĺňa niektoré ciele, pre nás klúčové, tj. povinnosť používania URI identifikárotov registrovaných cez MetaIS, či povinnosť zosúladenia sa a rozšírenia Centrálneho modelu údajov verejnej správy založeného na Ontológiách. Po intenzívnej debate sme ale našli spoločné znenie uvedených pripomienok.

Celkovo vzniklo cca 13-LinkedData pripomienok, drvivá väčšina je o spresnení textácie, napr. táto

alebo podobné

S týmto musím súhlasiť, takáto textácia o použití TALENDu by tam podľa mňa nemala vôbec byť takto formulovaná. Takto sa mi to podarilo aspoň posunúť, že treba stavať na všetkom dobrom čo existuje, či je to už CSRU, alebo Modul elektronickej demokracie, aby sa využili už vytvorené a pripravené projekty. Podmienka toho, že by sa nemala predpisovať implementačná architektúra ale skôr napĺňanie cieľov by sa podľa mňa mohla objaviť v pravidlách na štúdie uskutočniteľnosti, čo skúsim načrtnúť na najbližšej pracovnej skupine K9.4. Tak trochu dúfam že aj na úrade UVPII spracujú finálnu verziu štúdie tak, že nebude obsahovať žiadne vynútenie akejkoľvek konkrétnej technológie.

Suma sumárum: Aby som to spresnil, nie som proti TALENDu, ale celková problematika správy referenčných údajov s podporou URI, resp. ontológií ďaleko presahuje TALEND. A efektívna implementácia CSRU s podporou Centrálneho modelu údajov a URI bude ešte challenge. Ale toto je všeobecný problém, nie len tohto projektu. I keď sa snažíme postupne presadzovať LinkedData, je nám jasné že nás čaká ešte éra, kedy sa jednoducho nedá okamžite nahradiť súčasná architektúra za nové grafové databázy, čiže nám naozaj teraz nejde o sémantické technológie (o prostriedok), ale o použitie URI a Centrálneho modelu (cieľ). Predpokladám že aj keĎ raz Slovensko.Digital začne používať URI, tak tiež nezhodí svoju vybudovanú infraštruktúru, ale v prvej fáze bude skôr obohacovať relačné dáta o URI.
Čiže z tohto dôvodu a podpory LinkedData štúdiu vnímam pozitívne, ale ako som napísal, kľúčové bude urobiť celkovú architektúru správne.

jsuchal · September 6, 2017, 7:19pm

Este som sa kukol na tu CBA:

To zapojenie konzumenta je dufam nejaky vtip. 32tisic eur za to, ze niekomu spristupnim API? Prosim rozbit na dva riadky, pridavanie DQ k tomu len zbytocne pridava sum.

To je tak zle urobene to CSRU, ze tam treba kazdy jeden dataset pridavat cez nejaky change request za 30K a aj konzumenta?

Na strane štátu sa očakávajú prínosy najmä v podobe odbremenenia štátnych zamestnancov od neproduktívnej administratívnej práce, usporia sa náklady na poštovnom, nižšie budú aj časové/finančné náklady súvisiace s tlačením množstva dokumentov. V neposlednom rade sa podstatne zjednoduší prístupu k informáciám o občanoch/podnikateľoch.
Čistá súčasná ekonomická hodnota (ENPV) : 89 470 252,37 EUR
Rok návratu investície (PBP) : 4. Rok (od začiatku realizácie projektu)

Ak teda chceme zaratat usporu na administrative v tomto projekte, dufam, ze uz v ziadnom inom ktory sa na CSRU bude integrovat (t.j. skoro vsetky), sa to zapocitavat do prinosov nebude.

hanecak · September 6, 2017, 7:56pm

Uvaha na zaklade toho, co som dnes pocul na K9.4: V “starom CSRU” bolo vraj velmy nedostakom, ze “pripajanie” zacinalo ebatou medzi niekym (prevazkovatel CSRU?) a nieym dalim (ten kto sa mal pripojit a dat do CSRU data), ze teda:

pripojte sa a dajte data
nemozeme, zakon nedovoli

Nasledne sa pracne “dokazovalo”, ze teda zakon nebrani.

Vraj.

Tot eda uvaha: S tym teda mozno pocitaju aj nadalej, preto taka vysoka cena. Skoro by som povedal “vykupne”, len teda neviem kolko z tej sumy bude realne koncit u OVM.

Ak uvazime, ze mnohe z tych API/datasetov by mali byt aj Open Data a teda zadarmo, tak to by mala byt takmer cisto cena za SLA, t.j. nejake vyrzne vyssie garancie dostupnosti a vykonu. Ale aj to je zatial len moja uvaha.

panda · September 7, 2017, 8:30pm

Ja som tiez pozrel CBA, ale z prinosovej strany. Je to zaujimave. Rataju ze ked spravia projekt tak:

bude viac podani
budu za nizsi poplatok (asi zlava 50%)
spracovanie bude trvat uradnikovi iba polovicu casu
cas na vypracovanie a dorucenie podania sa skrati o polovicu
bude na to stacit polovica zamestnancov

Tieto dva parametre robia takmer vsetky prinosy (15mil rocne na usetrenom case):

bude viac podani (7.5 krat)
cas na vypracovanie a dorucenie podania sa skrati o polovicu
(treba pozriet sheet Parametre - Agendové IS a sheet Prínosy - Agendové IS)

Cisla su tam len tak, bez nejakeho zdovodnenia…rad by som si to precital.

Tiez mam pocit, ze s tymi istymi usporami ratali pri CBA povodneho CSRU, avsak uz sa neda stiahnut z informatizacia.sk. Nema to niekto u seba?

jsuchal · September 7, 2017, 8:46pm

Myslim, ze tu je mirror. IS CSRU - Rozbor Respektive aspon ta CBA co bola pri ZoNFP.

panda · September 7, 2017, 8:58pm

Vyzera ze pouzili velmi podobnu, ak nie rovnaku logiku, akurat v novom projekte su prinosy este vyssie.
Kedze vsak CSRU je uz realizovane, malo by byt mozne preukazat, ci tie benefity z povodnej CBA naozaj nastali…alebo ci boli iba fiktivne.

jsuchal · September 7, 2017, 9:19pm

No nie je to fantasticke, ze zase raz sme nasli projekt, ktory zarobi/usetri X penazi, naklady su presne X penazi a este sa to cele trafi presne do potrebneho roku navratnosti podla EU pravidiel?

Lubor · September 14, 2017, 2:10pm

Na dnešnej prezentácii projektu bolo uvedené, že je plánované že bude financovaný zo špecifického cieľa 7.5 OPII. To je “Zlepšenie celkovej dostupnosti dát verejnej správy vo forme otvorených dát”. Aj podľa aktuálneho názvu štúdie je toto vlastne podávané ako OpenData projekt.

Problém je však v tom, že celá štúdia je o G2G integráciách, 1x a dosť a OpenData sú tam iba zopárkrát spomenuté.

To však, ako vieme, nestačí. Aby bolo uveriteľné, že naozaj pomocou tohto projektu vznikne podstatné množstvo nových OpenData datasetov, je potrebné už v štúdii:

Zahrnúť OpenData do celého “cyklu” spracovania každých (referenčných) údajov, ktoré budú projektom pokryté
V štúdii popísať podstatné veci týkajúce sa publikovania údajov. Špecificky, keďže storage/endpointy/SLA pre dáta sú dnes komodita, je v štúdii nevyhnutné posúdiť tieto alternatívy: publikovanie OpenData ako nadstavba MÚK, použitie MOD ÚPVS, alebo použitie “komerčného” riešenia, t.j. služby vládneho cloudu poskytovanej externými subjektmi.
Od začiatku rátať so spoluprácou s používateľmi otvorených údajov a istou flexibilitou (keď už nechcem povedať agilnosťou) pri hľadaní optimálnej štruktúry sprístupňovaných údajov - viď. pozitívny príklad OpenData ITMS2014+

anton-somora · September 14, 2017, 2:25pm

hadal by som, že to sú tie integračné dohody, vieš 3 stranne meetingy, právnici, technici, manažéri, eskalácie, nekonečná mailová komunikácia, nakoniec vypracovanie dokumentu, jeho pripomienkovanie, prepracovanie, zapracovanie zmien a nakoniec jeho podpísanie,
potom to už iba sprístupníš

Lubor · September 14, 2017, 2:29pm

Na prezentácii bolo povedané, že predpokladaná suma za projekt - aktuálne 16,1M€ - bude pokrývať nielen technické riešenie pripojenia údajov do MÚK, ale aj celé “papierové” spracovanie príslušných integrácií. Náklady majú byť zhruba na polovicu rozdelné:

8,6M€ má byť použitých na “centrálnu” časť, t.j. analýza, riešenie integrácie, tím v centre, administratíva projektu…
7,5M€ majú použiť jednotlivé úrady, ktoré sa pripájajú, na úpravu svojich IS, pripojenie do integrácie z ich strany, čistenie údajov atď.

Pri takýchto sumách, ak sa skutočne podarí naplniť ciele projektu, to považujem za obrovský pokrok oproti doterajšiemu stavu. A to nielen v porovnaní s pôvodným projektom CSRÚ. Veď v aktuálnych štúdiách sú na integrácie kalkulované astronomické sumy - a z veľkej časti na základe predošlých skúseností z anabázy spojenej s integráciami. Povedzme len v nedávno schválenej ŠÚ pre Obchodný register je na integrácie + OpenData spolu kalkulované 1,75M€.

Tento projekt by mal preto nastaviť nový štandard pre integrácie (dátové, nie zápisové). Aj čo sa týka procesu, technickej realizácie, aj nákladov.

Ale pozor, tento projekt nerieši upgrade CSRÚ. Na to bude nová štúdia, tiež s určite aspoň 8-ciferným rozpočtom. Niekde by to malo byť na jednom mieste popísané, aké projekty budú a aké celkové náklady sú na to odhadované.