Rozvoj Centrálneho modelu údajov verejnej správy

Doposiaľ známe verzie modelov:

1). Katalóg dátových prvkov (KDP)

  • formálna reprezentácia: thesaurus
  • absentuje prístup štandarného modelovania (triedy, vlastnosti…), medzi entitami existuje len relácia “podradený dátový prvok”. Avšak niekedy v textovej informácií sú referované aj iné entity z modelu.
  • úroveň interoperability: 1*
  • stav: posledná verzia 2014
  • bez podpory medzinárodných štandardov
  • bez podpory strojového spracovania

príklad definície podradeného dátového prvku právna forma

2). Centrálny model údajov verejnej správy založený na ontológiách

Celkový pohľad na Centrálny model

Vybrané entity z Centrálneho modelu a ich vzájomné vzťahy (Core Entity)

  • úroveň interoperability: 5*
    • podpora globálnych identifikátorov - URI
    • podpora dereferenciácie sa pripravuje
    • stav: rozvoj od 2013, schválenie 2017
    • priama možnosť použiť dáta medzinárodnými štandardmi (napr. mapovanie na ISA Core Public Vocabularies)

X). N krát lokálne-zostavený centrálny model v rôznych projektoch

  • Tím že chýba centrálny model, dochádza pri každom projekte vždy nutnosť vybudovať si “vlastný klon” centrálneho modelu, identifikátorov a následne aj dát. To obmedzuje efektívnu spoluprácu jednotlivých systémov, tj. znemožňuje interoperabilitu údajov. A to má obrovský vplyv na budovanie pridanej hodnoty celej informatizácie.

Poviete si, zase je to o hviezdičkách, či nestačí len 3*. Nestačí, pretože 3* (keď to veľmi zjednoším) nie je o globálnych(centrálnych) identifikátoroch, resp. o globálnom modeli. 3* je taký lokálny autizmus trochu. Toto je môj svet, takéto ja mám dáta, mne to takto funguje. 5* naopak sa snaží o pracovať s rôznymi dátami stále ako s jedným celkom. Kľúčové entity majú jedinečný identikikátor napriek všetkým ISVS a podobne platí pravidlo aj pri URI, tj. pri viacerých rôznych URI identifikátoroch sa niektoré vyberie a bude referenčné. Dôležité ale je, že ontológie sú reprezentovateľné v klasickom UML, čiže máme tu formálnu zhodu naprieč úrovňami interoperability.

3 Likes

Ahojte, vo štvrtok budem na PS1 prezentovať novú verziu Centrálneho modelu údajov 1.1. ktorý sa výrazne vylepšil. Nešlo ani tak o rozšírenie CMÚ do šírky (nové ontológie), ako skôr išlo o vnútornú prestavbu (menej národných dátových prvkov, viac medzinárodných prvkov najmä z odporučených štandardov ISA2) , či publikovanie ontológií a príkladov vo viacerých distribúciách. Ontológie sú už vizualizované prostredníctvom UML, a príklady základných referenčných dát aj v UML, aj v LSON-LD. Všetko je samozrejme otvorené na pripomienkovanie, budem rád akej-koľvek spätnej väzbe, ktorá dané štandardy vylepší.

Centrálny model údajov 1.1 je len jedna časť z celých predkladaných štandardov. Keďže sa to dotýka aj publikačných profilov na otvorené dáta všeobecne (DCAT-AP-SK), publikáciu popisu elektronických služieb (CPSV-AP-SK) na ktorom spolupracujeme s PwC-Be + EK, príkladov základných referenčných dát a kontrolovaných slovníkov (číselníky, hierarchie …), tak v súlade s EIF prezentujeme uvedenú množinu štandardov ako Slovenský rámec pre sémantickú interoperabilitu. , ktorý sa (zatiaľ) skladá s týchto tém:

A. Centrálny model údajov verejnej správy v.1.1
https://wiki.finance.gov.sk/pages/viewpage.action?pageId=24939657

B. Základné referenčné údaje
ktoré reprezentujú konkrétne príklady použitia CMÚ
https://wiki.finance.gov.sk/display/PS1/RD-1.0

C. Publikačné profily
ktoré reprezentujú štandardy pre publikáciu otvorených údajov
https://wiki.finance.gov.sk/pages/viewpage.action?pageId=23987267

D. Kontrolované slovníky
číselníky a hierarchie jednak národné (základné číselníky) a medzinárodné
https://wiki.finance.gov.sk/display/PS1/CV-1.0


E. Dataset schválených URI
pôvodný dataset bol publikovaný len ako XLS, teraz (1.1) sa plánujú aj ostatné verzie.
Kľúčové bude neudržiavať tento dataset ručne, ale on sa vygeneruje s všetkých ontológií, publikačných profilov, datasetov metais, pričom obsahom bude URI, identifikátor jeho registrácie a odkaz, kde je URI definované. Nasledovný návrh ilustruje, ako môže daný dataset vyzerať, nie je to ešte konkretny dump.
https://wiki.finance.gov.sk/display/PS1/RegisteredURI-1.1

Vo štvrtok na PS1 budú všetky tieto body odprezentované.

Ahojte,

ak niekoho zaujíma ako môže vyzerať dataset elektronických služieb anotovaný prostredníctvom slovenskej implementácie publikačného profilu CPSV-AP-SK (Core Public Service Vocabulary), ktorý je navrhovaný ako štandard na PS1
https://wiki.finance.gov.sk/pages/viewpage.action?pageId=23987267

pričom spolu s PwC.be a EK pracujem (zadara :sunglasses: ) na tom, aby sa dataset elektronických služieb z MetaIS
https://metais.finance.gov.sk/cilist/KS

transformoval do LinkedBelovedData formátu a publikoval na data.gov.sk, budem rád, keď sa niekto joine na nasledovný webinár, kde budem prezentovať akuálny status implementácie v SR:

Dear members of the CPSV-AP Working Group,

The ISA² Programme of the European Commission is continuing work in the context of ISA² Action 2016.29 around the Core Public Service Application Profile (CPSV-AP), its reuse and implementation. In the first webinar that took place on 19 March, we learned about the work being done in Belgium, Spain, and Estonia, talked about the upcoming chatbot pilot, and discussed possible changes to the CPSV-AP.

On 23 April 2018, we are organising a second Webinar focusing on the achievements made by Member States of the EU in the area of public service catalogues. This is your opportunity to present your implementation, discuss your challenges with other implementers, or discover new ways of implementing the CPSV-AP model using emerging technologies. The Webinar will also include discussions of possible changes to the CPSV-AP.

Please find below a tentative agenda and information about joining the Webinar. Should you be interested in showcasing your work in this Webinar or the Workshop in Sofia, please contact us. Information about the Webinar and a summary of the event will be published on Joinup.

Please do not hesitate to reach out with any questions or requests regarding the Webinar agenda.

Best regards,

The CoS Team

Agenda
10:00 - 10:10: Welcome and overview
10:10 - 10:40: Member State Showcase and Q&A: Slovakia
10:40 - 11:40: Outstanding changes to the CPSV-AP
11:40 - 11:50: Agenda of the CPSV-AP Workshop in Sofia
11:50 - 12:00: AOB and next steps

Joining the Webinar (WebEx)

Title: CoS: CPSV-AP WG Webinar 2
Start Time: 04/23/2018 10:00 AM
Host: Ioana Novacean
Event Id: 2360077
Meeting Number: 846805225
Host Key: 750419
Host Link: https://webex.pwcinternal.com/Join.aspx?mid=2360077
Attendee Link: Post Form

Viac informácií: