ÚPVII Pracovná skupina K9.4 Lepšie dáta

@juraj.bardy ?

Je to vztiahnute ucelovo k OPII, takze ked idem z ineho zdroja financovania napr. rozpoctu tak sa ma to netyka ? Pricom NKIVS sa ma urcite tyka … Nechcem to nejako bagatelizovat, pretoze umysel je dobry - ale podla mojho nazoru je zvolena zla forma.

Presne toto sa pripomiankovalo pri tvorbe NKIVS … enterprise architektura musi fungovat nezavisle na zdroji financovania.
Ale ked potom Pelleho urad spoja s eurofondami … .tak sa na to samozrejme zabudne …

Ja teraz vazne nerozumiem, v tom dokumente nie je ani slovo o zdroji financovania, tyka sa studie uskutocnitelnosti.

studie uskutocnitelnosti sa povinne robia iba pre eu funded projekty alebo pre vsetky ?

Keby sa niekto zaujímal, ako sa teda plánujú použiť OPII peniaze na OpenData:

Toto uz vyzera sprocesovali. Zajtra (19.7.2017) sa kona dalsie “uvodne stretnutie”.

Za ostatne dva tyzdne sa konali dva stretnutia K9.4 z ktorych zapisy mozno najst tu:

https://sp.finance.gov.sk/lepsie-data/SitePages/Domov.aspx?RootFolder=%2Flepsie-data%2FZdielane%20dokumenty%2FStretnutia&FolderCTID=0x012000D24025E56965844C9F1724921ED4A477&View={A6FFDE59-755B-4196-9AAE-DAC4BE1FA110}

Dnes (2.8.2017) sa bude konat dalsie stretnutie, o.i. k tymto temam:

  • Miera centralizácie modulov: Čo má byť riešené na centrálnej úrovni a čo na lokálnej úrovni, aké sú kombinácie?
  • Aké licenčné modely budú používané?
  • Ako bude nastavená ochrana osobných údajov?
  • Ako sa zabezpečí dôveryhodnosť zverejnených údajov?
2 Likes

Milí priatelia/kolegovia,

posielam Vám spresnenú prezentáciu, ktorá je zahrnutá v SP Otvorené údaje.

http://www.semantickyweb.sk/2017-08-22-SP_OtvoreneUdaje-PravidlaPreUrovneInteroperability.pdf

Takze ake dalsie stretnutia boli:

Co mi utkvelo v hlave ako hlavne vyzvy:

  1. ako zabezpecit, aby sa peniaze alokovane v OPII na data, Open Data a pod. dostali realne k tym, co potrebuju financie na zrealizovanie zverejnovania udajov?
  2. ako podporit nasledne vyuzitie zverejnenych udajov komercnou aj nekomercnou sferou? (tym vlada totiz nemoze ulozit ulohu “pouzite tie data do vtedy a vtedy a vygenerujte tolko a tolkp prac. miest a DPH” :slight_smile: )
  3. ako zabezpecit riadne financovanie a chod tzv. datovych kuratorov? lebo z OPII prostredkov sa plati zvycajne skor iba infrastruktura (HW, SW) ktora ale bude bez kuratorov kvazi na nic
  4. ako zladit existujuce veci ohladom datovej integracie (centralny datovy model ktory riesi primarne PS1, existujuce nastroje na baze COMSODE v NASES/eDem/MOD, ine existujuce nastroje v CSRU na baze Talend) s buducimi potrebami, planmi a projektami (vid napr. Dátová integrácia (Konsolidácia nosnej údajovej základne pre sprístupnenie formou otvorených údajov) )

K bodu 1. planuje UPPVII do 31.10.2017 vyhlasit dopytovu vyzvu pre PO, vdaka ktorej si PO mozu zrealizovat publikovanie.

K bodu 2. je napad tiez robit dopytove vyzvy, ale:

  • ako to robit “dobre”? (aby to nebolo vela premrhanych penazi s podozrenim na tunel)
  • ako podporit napr. pravidelne hackatony (kde by sa spajali poskytovatelia s uzivatelmi, riesili co a ako zverejnovat a pracovali na zmyslulnom vyuziti uz zvrejneneho)

K 3.: Aktualne je uloha dane pozicie vytvorit a obsadit, financie ale alokovane nie su.

K 4.: Nie je jasne, lamem si nad tym hlavu. IMHO vramci KISS by som radej ostal pri decentralizovanom publikovani/zdielani udajov prisom PS1 (a buduci datovy kuratori) by fungovali ako koordinacne autority. Nejaky centralny projekt by mal vzist ako poziadavka z praxe povedzme o rok ci dva, nie teraz “od stola”.

3 Likes

Ved pomaly kazdy rok sa tu robi nejaka sprava o stave open data na slovensku. Zaznamenal niekto niekedy tam co i len zmienku o potrebe “noveho centralizovaneho riesenia open dat”? Ja teda nie. To, co sa toci stale dokola je: - chceme kvalitnejsie data (to chce aj VS samotna) a chceme tie data o ktore sa roky ziada (zmurk kataster, zmurk cestovne poriadky, zmurk data kriminality…)

1 Like

Tato vyzva sa podla popisu uz vztahuje aj na podporu zverejnovania otvorenych udajov nekomercnou sferou:

Z nazvov doteraz predlozenych ZoNFP k tej vyzve to vsak vyzera, ze ziadna z nasich neziskoviek zatial nema zaujem o tuto formu financovania prave takychto aktivit:
https://bi.ekosystem.slovensko.digital/dashboard/14?vyzva_itms_id=306

A to je mozno aj dobre. Ak ma byt vysledkom projektov nejaka lepsia verejna politika, tak si viem velmi dobre predstavit, ze pri jej tvorbe ludia v tych projektoch preluskaju (aj) nejake Open Data (cas na to budu mat zaplateny). Napr. “Podpora implementácie zákona o odpadoch v obciach” asi uvita aj nejake tie data o odpadoch a pod., “Koncepcia zamestnávania cuzincov pracujúcich na území SR” asi uvita aspon statisticke udaje o zamestnancoch celkovo a potom cudzincov specificky, atd. Ak by bolo len vysledkom “nejako pouzijeme Open Data”, tak by to neplnilop ciel vyzvy. Data budu prostriedok, nie ciel.

Len teda aby bolo naozaj podchytene aj zverejnovanie udajov (vid bod 1.: vyzva na publikovanie dat), tot aby bolo co luskat, spracuvat a pouzivat (t.j. bod 2). Lebo ked sa nic nezverejni, tak sa samozrejme asi ani nic nepouzije. (vartit dokola z tych istych 300-600 datasetov sa neda, plus vid co pisal @jsuchal o trosku vyssie).

Iste, samotne zverejnovanie open dat z roznych zdrojov v ucelenej a prehladnej podobe (ako napr. https://verejne.digital/ ) je len nastrojom (cize tym prostriedkom) na dosiahnutie ciela lepsej verejnej politiky, cim vsak sam o sebe podla mna prispieva k jeho naplneniu.

Napr. take ITMS Open Data su spristupnene uz vyse pol roka. Vazim si iniciativu NZK vdaka ktorej ich medzicasom SD zacalo zbierat do ich Ekosystemu a vdaka ktorej som si aj ja nad nimi mohla behom leta postavit zopar dashboardov. Ale aby sa tie data naozaj spristupnili verejnosti so sirokym zaberom a do uplnej hlbky, este stale to pyta nemaly kus prace.

Ludia v tych neziskovkach co maju zaujem pouzit open data ktore uz boli spristupnene, mozu teraz pouzivat na ich citanie napr. swagger alebo si osobitne kazdy sam za seba spracovat svoj kusok pieskoviska. A na takom pieskovisku sa potom lahko schovavaju suvislosti.

Zapisy uz su:

Dnes (6.9.2018) bolo dalsie stretnutie. Hlavnou temou bola udrzatelnost, t.j. aby vysledky z investicii OPII fungovali a mali zmysel aj po skonceni OPII (2020). Okrem toho ale vcelku zarezonovali (este stale) aj Dátová integrácia (Konsolidácia nosnej údajovej základne pre sprístupnenie formou otvorených údajov) alebo evanjelizacia resp. marketing. A tiez (opat) tema datovych kuratorov (aj v spojitosti s evanjelizaciou, marketingom ci skoleniami).

K marketingu: Bolo by napr. super, keby napr. p. Pellegrini “vyskolil” ine krajiny EU v tom, ako stransparentnit (aj) podnikatelske prostredie zverejnovanim uctovnych informacii ako Open Data (kedze http://www.registeruz.sk/cruz-public/home/api je co do temy … pokial nam je zname … len druhym takym na svete - po UK - a urcite prvym co do mnozstva detailov).

V akom zmysle?

V tom zmysle, ze sa nakoniec tomu venovalo vcelku vela castu, o.i.:

Štefan začal aj diskusiu k tomu či/ako podpisovať datasety KEPom:

Milí priatelia/kolegovia,

práve finišuje dokument Strategická priorita Otvorené údaje, prebiehajú posledné hlasovania o témach ktoré treba doriešiť, a práve dva hlasovania súvisiace s LinkedData-mi sa budú riešiť na budúci týždeň. Som ich absolútny zástanca, avšak momentálny setup v dokumente je viac než nešťastný. Dovoľte aby som Vám predstavil tento problém a poprosil Vás o podporu môjho názoru.

1. Cieľový stav kvality údajov vs. Pravidlá pre interoperabilitu otvorených údajov

Dôvodom sporu je nejasnosť medzi a) cieľovým stavom kvality otvorených údajov a pravidlami pre interoperabilitu otvorených údajov verejnej správy. U niektorých členov pracovnej skupiny sa to zamieňa/nerozlišuje.

PS dopredu: Nechceme totálne, hlava-nehlava tlačiť na linkované údaje, nechceme zvyšovať stanovený podieľ linkovaných datasetov na celkovom počte, ale presne naopak, chceme to znížiť.

Cielový stav kvality údajov v roku 2020:
Súčasné cieľe pre otvorené údaje sú stanovéné tak, že 70% údajov má byť na úrovni 5★, tj. musia byť popísané centrálnym modelom údajov verejnej správy a používať URI identifkátory.

Keď to prepočítam trochu presnejšie: V súčasnosti data.gov.sk obsahuje 1235 datasetov. Tj. pre ilustráciu, ak by mali byť splnené vyššie uvedené ciele už dnes (tj. 70% je 5★), bolo by nutné, aby z nich 864 bolo linked data, tj. aby boli popísané Centrálnym modelom verejnej správy s použitím URI identifikátorov na entity. Čiže, akoby sa to dalo splniť?
Aby boli uvedené splnené platí, že k existujúcim 1235 datasetom by muselo pribudnúť 2880 linkeddata datasetov, tj. celkový počet datasetov bude 4415 (70% je 2880). A toto je podľa nesplniteľná úloha, a to som zástanca LinkedData na maximum.

Pravidlá pre interoperabilitu otvorených údajov verejnej správy:
My, bojovníci za linkované verejné dáta :wink: sme navrhli tzv. Pravidlá pre interoperabilitu otvorených údajov - je publikovaná o pár príspevkov vyššie, tj. všetky nové datasety za verejné zdroje z centrálnou povahou 5★ inak 4★, pričom tie systémy ktoré sa nebudú inovované (mať zdroje) budeme radi keď sa dosiahne aspoň 3★. Toto bol výsledok dohody na pracovnom stretnutí K9.4. Zavedenie takéhoto prístupu by zaviedlo konečne systematický rozvoj ISVS, tj. dodávatelia by museli byť koordinovaný dátovou kanceláriou, resp. pracovnou skupinou pre dátové štandardy, čo by nesmierne zefektívnilo milión aspektov pri práci z verejnými dátami (jednotný model, jednotné identifikátory … proste tak ako to má byť).

Tak či onak, ani tieto skvelé pravidlá nedokážu zabezpečiť dosiahnutie horeuvedených cieľov, tj. 5★. Navyše, tesne pred dokončením dokumentu boli tieto pravidlá pre interoperabilitu zmenené tak, že boli prebraté cieľové hodnoty pre kvalitu údajov, tj. nie všetky nové publikované údaje za verejné zdroje musia byť 5★, ale len 70%, a podobne. Čiže jednak ešte viac sa týmto vzdialio plnenie cieľov, ale hlavne, ponechala sa možnosť, že dodávatelia štátnych zákazok nebudú musieť všetky robiť kvalitné dáta, ale urobia si veci po svojom. A neexistuje pravidlo, kto si to môže urobiť po svojom, a kto musí dodržať LinkedData. Takže v tomto sa nikde neposunieme, a keďže platí, že kvalita dát je pre celú informatizáciu kľúčová, opäť si môže robiť dodávateľ svoje projekty ako sa mu zachce. Sú to otvorené dvierka, ak máš problém, nech sa páči, takto sa to dá obísť.

Návrh riešenia:
Z tohto pohľadu je teda kriticky dôležité ponechať len Pravidlá interoperability pre otvorené údaje verejnej správy tak ako sú (všetko nové 5* za verejné peniaze…), a samotné ciele aj kľudne znížiť!, neviem odhadnúť na koľko presne, na 50%. 40%? Neviem, tak či onak by to bolo varenie z vody (nevieme koľko datasetov pribudne, nevieme koľko sa prerobí …).

2. Zverejnenie datasetov vs. ich skrytie za API

Ďalšie hlasovanie bude o tom, či majú byť dostupné datasety tak ako je to všade vo svete, tj. v otvorených formátoch, súboroch priamo na stiahnutie, alebo to majú riešiť API. Toto je podľa mňa mimo scenáru, pretože niečo iné je dataset a niečo iné je API, a to sa v prípade otvorených údajov nemá zamieňať. Otvorené údaje majú mať formu datasetu, ktorá má jednotný popis (v našom prípade je to použitie odporúčania Európskej komisie jazykom DCAT, atd. …). Skrátka, nie som proti otvorenému API, toto ale nemá nahradzovať klasické publikované datasety vo forme súborov, tak ako je to na ostatných svetových portáloch.

Na záver: minulý týždeň som sa stretol so zástupcami Európskej komisie (na konferencii Semantics v Amsterdame) kde som prezentoval náš prístup, a musím povedať že sa im to veľmi páčilo (v dohľadom čase majú o tom publikovať informáciu), pretože to absolútne napĺňa ich stratégiu, Lenže to by nebolo naše milované Slovensko, aby sa to niekde nezačalo škrípať. No hlasovanie je o týždeň, tak mi držte palce.

1 Like

Práve som dorobil konkrétne príklady úrovní interoperability pre ich predloženie na PS1, a keď sa na to tak pozerám, pravda je, že spôsob ako boli tie jednoduché pravidlá napísané, nebol celkom prehľadný, tj.

obrázok

Pretože

  1. ten druhý riadok, ktorý iba odporúča prerobenie údajov z 3★ vyššie, nie je pravidlo, ale iba odporúčanie a môže to odtiaľ vyhodiť a môže to byť len doplňujúca poznámka
  2. tie percentá (100%) tu potom nemá význam písať
  3. nielen z diskusíí na K9.4, či PS1 vyplynulo, že URI fyzickej osoby nemôže byť povinne referenčné (nutnosť ho používať) ale má byť sektorové, resp. odporúča to aj Európska komisia pri realizácii princípu 1xdosť v dokumente Access to Base Registers (No. 14), takže výsledné pravidlá pre interoperabilitu, ktoré budú predložené na K9.4 (a podrobnejšie aj na PS1) vyzerajú takto:

Keď sa tieto pravidlá schvália na SP Otvorené údaje, pričom už o tom bola na stretnutí dohoda, tak tieto pravidlá patria do zlatých základných pravidiel, ktoré posunú slovenskú informatizáciu. Akiste je ešte takých pár, a bolo by skvelé ich povedať (ak má niekto na to svoj názor), aby vzniklo napr. 5i (interoperabilita, informovanosť … )