Európske (open)data, štandardy a ich implementácia v SR

Priatelia/kolegovia, keďže v rámci PS1 pokročil štandard pre publikovanie metadát pre otvorené údaje na Slovensku (pošlem to večer), tak pred tým by som rád predstavil architektúru takejto špecifikácie. Na popis týchto metaúdajov odporúča Európska komisia použitie tzv. aplikačného profilu DCAT-AP

pdf špecifikácia
https://joinup.ec.europa.eu/sites/default/files/distribution/2017-03/dcat-ap_version_1.1_0.pdf

ktorý používa ontológiu DCAT (Data Catalog Vocabulary)

Uvedené metaúdaje (údaje o údajoch) sú pre publikované dáta použité aby bolo zrejmé: kto, čo, kedy, v akom formáte, s akými právami publikoval a podobne. To, aké meta-údaje majú byť použité, definuje tzv. publikačný profil, ktorý je definovaný množinou povinných, odporučených a voliteľných tried a ich vzájomných vzťahov.

Nasledovný UML model znázorǔje všeobecný publikačný profil, kde môžete vidieť jednotlivé triedy profilu (dcat:Catalog, dcat:Dataset, dcat:Distribution) a ich vzájomné vzťahy.


zdrojové EAPečko: https://joinup.ec.europa.eu/sites/default/files/distribution/2017-02/dcat-ap_1.1_.eap

Dôležité je ale aj definovať niektoré globálne číselníky, ktoré sa odporúčajú pre vybrané triedy profilu v rámci EU ako napr. typ datasetu, doména datasetu, typ licencie distribúcie a podobne pre zabezpečenie európskej interoperability (napr. pri harvestovaní údajov z portálov členských štátov). Preto sú súčasťou špecifikácie aj tzv. kontrolované slovníky, ktoré stanovujú aké môžu niektoré vlastnosti nadobúdať hodnoty.

Čiže napr. ak použijem vlastnosť dcat:mediaType pre distribúciu, tak hodnota musí reprezentovať len IANA média typy

.

Každý členský štát EU si potom robí vlastnú špecializáciu, tzv. národný aplikačný profil, pretože niektoré údaje sa môžu v rámci krajiny doplniť, nevyžadovať, či naopak vyžadovať a podobne. Príklady takýchto publikačných profilov môžete nájsť tu:

Nemecko http://www.dcat-ap.de/
Belgicko http://dcat.be/
Nórsko Standard for beskrivelse av datasett, datatjenester og datakataloger (DCAT-AP-NO)
Taliansko DCAT-AP_IT v1.1 – Profilo italiano di DCAT-AP | dati.gov.it

Slovenský

1 Like