MIRRI Pracovná skupina K9.4 Lepšie dáta

Takže naša skupina K9.4 Lepšie dáta ešte pokračuje, čo je podľa mňa vynikajúce :sunglasses: včera sme mali stretnutie. Jedna z klúčových vecí ktorú práve riešime (dokument by mal byť prístupný na pripomienkovanie niekedy na budúci týždeň), je

Checklist pre strategickú prioritu Manažment údajov, ktorí má slúžiť pre

  1. spracovávateľov štúdie uskutočniteľnosti pre projektu informatizácie tak, aby bolo navrhované riešenie v súlade so strategickou prioritou Manažment údajov,
  2. prípravu legislatívy, ktorá pokrýva spracovanie údajov v informačných systémoch verejnej správy

Keďže to s Linked Government Data myslíme naozaj veľmi vážne, tak si tu dovolím už v predstihu pridať súvisiace navrhované body na diskusiu (vyplývajúce s dokumentu Strategická priorita - Manažment údajov), a to sú:

časť - Manažérske zhrnutie

  • Vízia manažmentu údajov:
    Na identifikáciu entít v rozsahu riešenej agendy musí každý nový projekt používať štandardizované schválené URI identifikátory v MetaIS a rovnako sa musí používať schválený Centrálny model údajov verejnej správy reprezentovaný ontológiami. Prvky, ktoré nie sú ešte pokryté/schválené dátovými štandardmi budú predložené na štandardizáciu. Tento princíp dodržiavania dátových štandardov treba explicitne deklarovať. (povinné)

časť - Aplikačná architektúra

  • Používanie URI identifikátorov v službách na vstupe:
    Služby musia vystavovať také rozhrania, ktoré dovoľujú identifikovať entitu prostredníctvom URI identifikátoru prideleného a schváleného v MetaIS tj. namiesto typicky číselných identifikátorov reprezentujúcich entitu sa vyžaduje použitie prideleného URI identifikátora.(povinné)

  • Dokumentácia služieb:
    Definícia služieb a volaní musí byť popísaná prostredníctvom popísaných XSD schém (SOAP) alebo prostredníctvom OpenAPI Specification (REST) a následného vytvorenia mapovania na Centrálny model údajov verejnej správy reprezentovaný ontológiami.

časť - Architektúra údajov

  • Prehľad údajov riešenej domény:
    Je nutné identifikovať objekty evidencie (entity), ktoré budú riešené v rámci nového informačného systému, pričom pre každú entitu je nutné uviesť: názov, existencia URI metaúdajov [úplne, čiastočne, žiadne], existencia URI objektov [úplne, čiastočne, žiadne], referenčné údaje [áno, nie, kandidát].

  • Použitie LinkedData pre otvorené údaje:
    Všetky údaje publikované otvoreným spôsobom musia byť popísané Centrálnym modelom údajov verejnej správy reprezentovaného ontológiami s použítím URI identifikátorov schválených v MetaIS. V prípade, že publikované entity sa nenachádzajú v Centrálnom modely údajov verejenej správy je nutné aktivovať štandardizačný proces, ktorý rozhodne ako daný typ údajov reprezentovať.

Priznám sa, že ako to súvisí s verejnou konzultáciou Centrálnemu informačnému systému štátnej služby, to ešte presne neviem, ale typujem žč štúdia uskutočniteľnosti naň by dosiahla tento výsledok: nespĺňa, nespĺňa, nespĺňa, nespĺňa, nespĺňa, nespĺňa. Na toto sa určite ešte spýtam, že čo teraz. Trochu dosť nerozumiem, prečo sa už začínajú projekty, keď napr. ešte tento checklist nie je spoločne schválený :disappointed:

Tak sme na uvedených bodoch ešte popracovali/zjednodušili, a navrhované body do checklistu pre nové projekty sú:

časť - Aplikačná architektúra

    1. Všetky poskytované aplikačné služby v rámci riešenej agendy musia vystavovať také rozhrania, ktoré pre identifikáciu vstupno/výstupných referenčných entít (dátové prvky Centrálneho modelu údajov verejnej správy, URI entít referenčných registrov,…) používajú URI identifikátor registrovaný a schválený v Centrálnom metainformačnom systéme. V prípade, že pre potreby riešenej agendy potrebné referenčné URI neexistujú, je nutné o ne požiadať prostredníctvom procesu štandardizácie dátových prvkov v príslušnej pracovnej skupine (UPVII-PS1).

Text štúdie uskutočniteľnosti musí teda obsahovať:
Všetky poskytované aplikačné služby v rámci riešenej agendy budú vystavovať rozhrania, ktoré pre identifikáciu ľubovoľných vstupno/výstupných entít používať URI identifikátor registrovaný a schválený v Centrálnom metainformačnom systéme. V prípade, že pre potreby riešenej agendy potrebné URI existovať nebudú, bude o ne požiadané prostredníctvom procesu štandardizácie dátových prvkov v príslušnej pracovnej skupine (UPVII-PS1).

Pozn. z uvedeného nevyplýva potreba používať sémantické databázy (RDF grafy), ale len povinnosť pre zabezpečenie interoperability používať URI na rozhraniach.

    1. Dokumentácia služieb a ich mapovanie na URI:
      Definícia služieb a volaní musí byť popísaná prostredníctvom popísaných XSD schém (SOAP) alebo prostredníctvom OpenAPI Specification (REST) a následného vytvorenia mapovania na URI identifikátory registrované v Centrálnom modeli údajov verejnej správy reprezentovaný ontológiami.

Text štúdie uskutočniteľnosti musí teda obsahovať:
Definícia služieb bude obsahovať mapovanie na URI identifikátory registrované a schválené v Centrálnom metainformačnom systéme verejnej správy.

časť - Dátová architektúra

    1. Použitie LinkedData pre otvorené údaje:
      Na všetky údaje publikované otvoreným spôsobom musia byť použité registrované a schválené URI identifikátory v Centrálnom metainformačnom systéme. V prípade že pre potreby riešenej agendy potrebné URI neexistujú, je nutné o ne požiadať prostredníctvom procesu štandardizácie dátových prvkov v príslušnej pracovnej skupine (UPVII-PS1). Otvorené údaje budú vypublikované na data.gov.sk – Centrálnom portále otvorených dát.

Text štúdie uskutočniteľnosti musí teda obsahovať:
Pre všetky údaje publikované otvoreným spôsobom budú použité registrované a schválené URI identifikátory v Centrálnom metainformačnom systéme. V prípade, že pre potreby riešenej agendy potrebné URI existovať nebudú, bude o ne požiadané prostredníctvom procesu štandardizácie dátových prvkov v príslušnej pracovnej skupine (UPVII-PS1). Otvorené údaje budú vypublikované na data.gov.sk – Centrálnom portále otvorených dát.

Takže verím, že toto je už posledná verzia 4 LinkedData bodov do checklistu pre nové štúdie uskutočniteľnosti. Nič podstatné sa nemení, len sa spresňuje interoperabilita.
(su to deklaracie napisane tak, ze do konkretnej studie uskutocnitelnosti staci vlozit danu vetu)

časť: Manažérske zhrnutie

1. Vízia manažmentu údajov (povinné)
Deklarácia: Z dôvodu zabezpečenia požadovanej interoperability riešenia s ostatnými ISVS Slovenskej republiky ako aj odporúčaniami Európskej komisie pre interoperabilitu informačných systémov verejnej správy (ISA), bude nový projekt používať na popis svojich údajov Centrálny model údajov verejnej správy založený na ontológiach, a súčasne na identifikáciu objektov budú použité registrované a schválené URI identifikátory v Centrálnom metainformačnom systéme.

časť: Architektúra údajov

2. Centrálny model údajov VS založený na ontológiách (povinné)
Deklarácia: Model údajov riešenej agendy bude vychádzať z Centrálneho modelu údajov verejnej správy založeného na ontológiach. V prípade, že pre potreby riešenej agendy potrebné ontológie existovať nebudú, bude o ne požiadané prostredníctvom procesu štandardizácie dátových prvkov v príslušnej pracovnej skupine.

Tento bod je o zjednocovaní samostatných modelov pre jednotlivé ISVS prostredníctvom dátovej štandardizácie (kancelárie), ktorý bude takisto prerokováný na PS1. V skratke: Ak napr. vzniká nový ISVS a používa napr. referenčné údaje ako napr. právne subjekty, adresy, a pod. tak musí jeho model prispôsobiť ontológiam, tj. použiť ich syntax a sémantiku definovanú v Centrálnom modely. Ak sa jedná o nové entity, tak požiada o ne dátovú štandardizáciu (kanceláriu) o pridele namespace URI pre ich dátové prvky, ktoré ak sa nepredpokladá že budú referenčné, tak nemusia byť https://data.gov.sk/... , ale môžu byť napr. https://enviro.gov.sk/..., pričom v metais bude postačovať schválenie len URI šablóny a nie každého prvku (to by nebolo zvládnuteľné), čiže napr. len https://enviro.gov.sk/def/ontology/animals-of-forest/[data-element].

3. Použitie prepojených údajov pre otvorené údaje (povinné)
Deklarácia: Všetky údaje publikované otvoreným spôsobom budú referencovateľné prostredníctvom registrovaných a schválených URI identifikátorov v Centrálnom metainformačnom systéme. V prípade, že pre potreby publikácie otvorených údajov URI neexistujú, bude o ne požiadané prostredníctvom procesu štandardizácie dátových prvkov v príslušnej pracovnej skupine.

časť: Aplikačná architektúra

4. Používanie URI identifikátorov v službách (povinné)
Deklarácia: Všetky poskytované aplikačné služby v rámci riešenej agendy budú vystavovať také rozhrania, ktoré pre identifikáciu vstupno/výstupných entít používajú URI identifikátory registrované a schválené v Centrálnom metainformačnom systéme. V prípade, že pre potreby riešenej agendy potrebné referenčné URI neexistujú, bude o ne požiadať prostredníctvom procesu štandardizácie dátových prvkov v príslušnej pracovnej skupine.

Tu len doplním obrovsky pozitívnu informáciu, že projekt Centrálny informačný systém štátnej služby akceptoval kľúčové body 3 a 4. Body 1 a 2 sú samozrejmé, vyplývajú z použitia 3,4, čiže toto je OOK. :high_brightness:

ÚV/Nases dali do extrémne krátkeho MPK novú verziu OpenData stratégie:

V tejto pracovnej skupine materiál doteraz ani nebol k dispozícii, zástupcovia Nases jediné čo k tomu povedali že “pripravuje sa”…

Na stretnuti PS3 dna 11.5.2017 povedali, ze “o 2 tyzdne” alebo “do 2 tyzdnov” (zial nepamatam presne, malo by byt vo zvukovom zazname) bude material v MPK. Ze to bude hned 12.5., to mi z toho nevyplyvalo.

Pripomienky čo sme za S.D k tomuto materiálu poslali som aj tu dal do diskusie k materiálu.

Pre informáciu, na stretnutí PS v stredu 17.5. jej vedúci ohlásil že “je rozpustená”, keďže je schválený nový štatút pracovných skupín a najbližšie 2 týždne sa budú zbierať nové nominácie.

Tesne pred tým sme schválili návrh check-listu požiadaviek na štúdie uskutočniteľnosti z pohľadu NKIVS / SP Manažment údajov. Vyvesím ho tu hneď ako sa dostanem k výslednej verzii.

1 Like

Checklist, čo minimálne treba spraviť v štúdiách uskutočniteľnosti, aby boli v súlade NKIVS / strategická priorita Manažment údajov:
Checklist pre SP Manazment udajov FINAL SU.docx (72.9 KB)

Je to výsledok PS K9.4 - takto by to v štúdiách mal ÚPPVII kontrolovať.

2 Likes

Je niekde oficialny zdroj tohto (a inych) checklistu ?

@juraj.bardy ?

Je to vztiahnute ucelovo k OPII, takze ked idem z ineho zdroja financovania napr. rozpoctu tak sa ma to netyka ? Pricom NKIVS sa ma urcite tyka … Nechcem to nejako bagatelizovat, pretoze umysel je dobry - ale podla mojho nazoru je zvolena zla forma.

Presne toto sa pripomiankovalo pri tvorbe NKIVS … enterprise architektura musi fungovat nezavisle na zdroji financovania.
Ale ked potom Pelleho urad spoja s eurofondami … .tak sa na to samozrejme zabudne …

Ja teraz vazne nerozumiem, v tom dokumente nie je ani slovo o zdroji financovania, tyka sa studie uskutocnitelnosti.

studie uskutocnitelnosti sa povinne robia iba pre eu funded projekty alebo pre vsetky ?

Keby sa niekto zaujímal, ako sa teda plánujú použiť OPII peniaze na OpenData:

Toto uz vyzera sprocesovali. Zajtra (19.7.2017) sa kona dalsie “uvodne stretnutie”.

Za ostatne dva tyzdne sa konali dva stretnutia K9.4 z ktorych zapisy mozno najst tu:

https://sp.finance.gov.sk/lepsie-data/SitePages/Domov.aspx?RootFolder=%2Flepsie-data%2FZdielane%20dokumenty%2FStretnutia&FolderCTID=0x012000D24025E56965844C9F1724921ED4A477&View={A6FFDE59-755B-4196-9AAE-DAC4BE1FA110}

Dnes (2.8.2017) sa bude konat dalsie stretnutie, o.i. k tymto temam:

  • Miera centralizácie modulov: Čo má byť riešené na centrálnej úrovni a čo na lokálnej úrovni, aké sú kombinácie?
  • Aké licenčné modely budú používané?
  • Ako bude nastavená ochrana osobných údajov?
  • Ako sa zabezpečí dôveryhodnosť zverejnených údajov?
2 Likes

Milí priatelia/kolegovia,

posielam Vám spresnenú prezentáciu, ktorá je zahrnutá v SP Otvorené údaje.

http://www.semantickyweb.sk/2017-08-22-SP_OtvoreneUdaje-PravidlaPreUrovneInteroperability.pdf

Takze ake dalsie stretnutia boli:

Co mi utkvelo v hlave ako hlavne vyzvy:

  1. ako zabezpecit, aby sa peniaze alokovane v OPII na data, Open Data a pod. dostali realne k tym, co potrebuju financie na zrealizovanie zverejnovania udajov?
  2. ako podporit nasledne vyuzitie zverejnenych udajov komercnou aj nekomercnou sferou? (tym vlada totiz nemoze ulozit ulohu “pouzite tie data do vtedy a vtedy a vygenerujte tolko a tolkp prac. miest a DPH” :slight_smile: )
  3. ako zabezpecit riadne financovanie a chod tzv. datovych kuratorov? lebo z OPII prostredkov sa plati zvycajne skor iba infrastruktura (HW, SW) ktora ale bude bez kuratorov kvazi na nic
  4. ako zladit existujuce veci ohladom datovej integracie (centralny datovy model ktory riesi primarne PS1, existujuce nastroje na baze COMSODE v NASES/eDem/MOD, ine existujuce nastroje v CSRU na baze Talend) s buducimi potrebami, planmi a projektami (vid napr. Dátová integrácia (Konsolidácia nosnej údajovej základne pre sprístupnenie formou otvorených údajov) )

K bodu 1. planuje UPPVII do 31.10.2017 vyhlasit dopytovu vyzvu pre PO, vdaka ktorej si PO mozu zrealizovat publikovanie.

K bodu 2. je napad tiez robit dopytove vyzvy, ale:

  • ako to robit “dobre”? (aby to nebolo vela premrhanych penazi s podozrenim na tunel)
  • ako podporit napr. pravidelne hackatony (kde by sa spajali poskytovatelia s uzivatelmi, riesili co a ako zverejnovat a pracovali na zmyslulnom vyuziti uz zvrejneneho)

K 3.: Aktualne je uloha dane pozicie vytvorit a obsadit, financie ale alokovane nie su.

K 4.: Nie je jasne, lamem si nad tym hlavu. IMHO vramci KISS by som radej ostal pri decentralizovanom publikovani/zdielani udajov prisom PS1 (a buduci datovy kuratori) by fungovali ako koordinacne autority. Nejaky centralny projekt by mal vzist ako poziadavka z praxe povedzme o rok ci dva, nie teraz “od stola”.

3 Likes

Ved pomaly kazdy rok sa tu robi nejaka sprava o stave open data na slovensku. Zaznamenal niekto niekedy tam co i len zmienku o potrebe “noveho centralizovaneho riesenia open dat”? Ja teda nie. To, co sa toci stale dokola je: - chceme kvalitnejsie data (to chce aj VS samotna) a chceme tie data o ktore sa roky ziada (zmurk kataster, zmurk cestovne poriadky, zmurk data kriminality…)

1 Like