URI priestorových údajov

URI priestorových údajov v RPI

Takže @mtuchyna, ako si si mohol všimnúť, nakoniec to vyzerá, že predsa len bude data.gov.sk URI začínať na https:// :wink: , takže to by sme mali a ostáva nám aj tak ešte všetko ostatné, a moja ponuka na pomoc pri nahadzovaní URI do RPI stále platí.

Ako vieš, už dávnejšie sme spracovali vaše publikované dáta z data.sazp.sk do LODu-SK, pričom samozrejme používame jednotný spôsob tvorby URI s využitím ontológií INSPIRE, DCAT, ADMS, … atď. Všetky dáta sú chápané ako adms:AssetRepository (dcat:Catalog) týchto datasetov

 <adms:AssetRepository rdf:about="http://data.gov.sk/set/catalog/spatial-data-registry">
    <dct:title xml:lang="sk">Katalóg Registra priestorových informácií</dct:title>
    <dct:title xml:lang="en">Spatial Data Registry Catalog</dct:title>
    <res:gestor rdf:resource="http://data.gov.sk/id/legal-person/00626031"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/species-distribution-unit"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/hierarchy/species"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/protected-site"/> 
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/contaminated-site"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/environment-burden-type"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/environment-priority-level"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/contaminating-activity-type"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/corine-land-cover"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/bio-geographical-region"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/garbage-dump"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/garbage-dump-type"/>
 </adms:AssetRepository>

kde napr. táto konkrétna skládka
http://envirozataze.enviroportal.sk/ZaznListSkladky.aspx?Id_Zataz=-1&RegistracneCislo=8572

je reprezentovaná

<env:GarbageDump rdf:about="http://data.gov.sk/id/garbage-dump/8572">
     <adms:identifier rdf:resource="http://data.gov.sk/id/garbage-dump/identifier/8572"/>
     <geo:hasGeometry rdf:resource="http://data.gov.sk/id/garbage-dump/geometry/8572"/>
     <loca:location rdf:resource="http://data.gov.sk/id/garbage-dump/location/8572"/>
     <rdfs:label  rdf:datatype="&xsd;string" xml:lang="sk">jazero</rdfs:label>  
     <env:garbageDumpType rdf:resource="http://data.gov.sk/def/garbage-dump-type/OS"/>
     <dcat:accessURL rdf:resource="http://envirozataze.enviroportal.sk/ZaznListSkladky.aspx?Id_Zataz=-1&RegistracneCislo=8572"/>
     <rdfs:isDefinedBy rdf:resource="http://data.gov.sk/set/data/garbage-dump/2017-01-01-example.rdf"/> 
</env:GarbageDump>

<id:Identifier rdf:about="http://data.gov.sk/id/garbage-dump/identifier/8572">
    <id:validFrom rdf:datatype="&xsd;date">2017-01-01</id:validFrom>
    <id:value rdf:datatype="&xsd;string">8572</id:value>
    <id:type rdf:resource="http://data.gov.sk/def/identifier-type/ENVIRONMENT-CODE"/>
</id:Identifier> 

Takže moja otázka priamo k jadru veci je, si týmto OK? Ideme to nahodiť do RPI tak aby to bolo aj v MetaIS rovnako? Alebo ako si to plánoval nahodiť?

Resp. otázka znie, ako súvisí RPI s Registrom adries? Sú to tie isté entity (URI)?

A čo také chránené územia?

PS: Celá prezentoška je tu:
http://danubehack.eu/outcomes/lightning_talks/day1/08_miroslav_liska/20161212_04_Miroslav_Liska_SLOD.pdf

Díkes
m

Seva Miro,

vdaka za tento thread a prepac za neskorsiu reakciu.

Ano, ukazalo sa, ze je dobre otvorit aj k takymto temam diskusiu a niektore navrhy opatrne posudit. RPI teda ostava s nastavenym https://.
Samozrejme radi budeme spolupracovat pri identifikacii moznosti a dopadov URI na RPI, MetaIS, data.gov.sk a dalsie systemy.

Mozes mi upresnit, co presne chapes pod nahadzovanim URI do RPI?

Len pre istotu a uplnost, termin spracovali znamena, ze udaje, ktore su k dispozicii na data.sazp.sk boli pretransfomovane a komplet naimportovane/alebo len prepojene? do LOD Slovakia?

Mam to chapat tak, ze ak by sme chceli k tymto 5 datasetom vytvorit metazaznam v RPI,
je potrebne upravit specialne identifikator, ktory im budeme priradovat v RPI, tak aby bol identicky s identifikatorom v MetaIS?

RPI uz dnes podporuje GeoDCAT-AP, nepostacuje toto API pre zabezpecenie uvedenej poziadavky?

Predpokladam, ze ide o datasety v LOD Slovakia a uvedeny <adms…/adms>select zodpoveda dopytu na metadata k k tymto datasetom.

K samotnemu rdf encodingu sa neviem uplne vyjadrit, ale kedze jednym z klucovych poslani RPI je podpora harmonizovaneho zdielania priestorovych udajov na SK a EU urovni, isto by som ocakaval v URIs minimalne na urovni metadat aj s “https://data.gov.sk/set/rpi”. V pripade samotnych udajov, sluzieb a podpornych registrov by som si potreboval ujasnit, ake su sucasne (ak su) legislativne poziadavky na URIs pre referencne zdroje a pre tie ostatne. Zatial som zachytil diskusie len na urovni referencnych registrov, ale da sa ocakavat, ze to pojde aj na uroven samotnych datasetov, sluzieb, ci aplikacii, alebo koncept referencnosti ostane len na urovni registrov?

Samozrejme, podme to skusit nahodit do RPI aby to bolo v MetaIS rovnako. Len mi musis objasnit, co to znamena “byt rovnako”, nakolko, ja som
bol v tom, ze do metais budu priamo naharvestovane cez Narodnu vyhladavaciu sluzbu, tak ako budu naharvestovane napriklad do data.gov.sk (samozrejme, len tie, ktore tam bude mat zmysel harvestovat).

Dobra otazka. Tych suvisov je niekolko, ale tu si nesieme dedicstvo este z povodnej NKIVS z 2008, kde sa podarilo presadit separatny zakladny Register adries aj napriek tomu, ze Adresy su zadefinovane ako jedna z tem INSPIRE, kde by sa kludne dali rozsirit o narodne specifika. Ale ok, mame tu dva oddelene narodne registre, pricom Register adries (RA) dnes obsahuje aj samotne priestorove udaje a tusim aj sluzby (co bude treba overit), zatial co Register priestorovych udajov zatial bude obsahovat iba metaudaje k priestorovym udajom a sluzbam, prostrednictvom ktorych vsak - je mozne dostat sa k samotnym priestorovym udajom a sluzbam, ak su dostatocne zdokumentovane a standardizovane spristupnene.

V sucasnosti RPI vyuziva RA len pri procese Registracie, kde sa overuju tzv Povinne osoby.

Naspat k tvojej otazke

Nateraz samotnymi udajmi pre adresy disponuje len RA. V RPI bude musiet relevantna Povinna osoba vytvorit metaznam/y k priestorovym udajom a suvisiacim sluzbam, ktore by mali obsahovat odkazy na samotne udaje a sluzby.

Pre lepsie porozumenie konceptov a suvisiacich URIs poprosim o priklad z predposlednej snimky “Protected sites example”:

  1. Spravne to chapem, ze ak sa nastavi organizacno procesna sprava jednoznacnej identifikacie a pridelovania mennych priestorov, tak tak menny priestor “http://data.gov.sk/id/protectedsite/” bude cez MetaIS prideleny autorite, ktora za tieto udaje v SR zodpoveda? Ak ano bude to Statna ochrana prirody SR, alebo Ministerstvo zivotneho prostredia SR)?

  2. Ktory z uvedenych konceptov obsahuje odkaz na samotnu geometriu?

Vdaka, m.

1 Like

Vyzera to tak, ze EK pripravuje Usmernenia a Vocabularies na podporu dostupnosti INSPIRE udajov ako Linked Data:

Skusim upresnit podmienky pripomienkovania a planovane terminy…

1 Like

No predpokladám, že RPI:Metaúdajový editor slúži na to, aby som zaevidoval konkrétny priestorový objekt (indivíduum), ktorý je predvoleného typu ako chránené územie, výskyt druhu, stavbu …. atď. Teda, keď si poviem že idem zaevidovať konkrétne chránené územie, povedzme CHKO Biele Karpaty, tak potrebujem preň URI identifikátor a ten zaevidujete do RPI.

Áno, údaje boli kompletne (tj. všetky entity) transformované do data.gov.sk ontológií, individuíí, … + boli priradené štandardizované URI identifikátory, spolu s mapovaním na INSPIRE ontológie; presnejšie povedané, v príslušnom datasete bol vždy aspoň jeden prvok (niekedy viac) úplne serializovaných cez data.gov.sk štandardy, ktorými sa snažíme spojiť všetky dáta ISVS prierezovo.

Áno, ale len veľmi málo, nevidím to až tak problematicky, pretože jednak https sme uz začali podporovať aj my, kedže vyzerá že dereferenciácia môže byť tou informatickou gravitáciou čo má príležitosť prepojiť dáta verejnej správy (konečne) efektívne. Je tam podľa mňa už iba maličká odchýlka. Keď to zhrniem:

základný návrhový vzor pre data.gov.sk URI je
https://data.gov.sk/[type]/[classification]+/[identity]/{version}

už sme viac krát refereovali tento vzor odporúčaný napr. v dokumente 10 rules for persistent URIs, ktorý asi poznás a dostal sa aj do výnosu o štandardoch.

LOD Slovakia (od verzie 0.9.1) obsahuje dáta zo data.sazp.sk nasledovne:

Všetky datasety publikované na data.sazp.sk (patria do katalógu RPI), tj.
https://data.gov.sk/set/catalog/spatial-data-registry

ktorý obsahuje rôzne datasety, napr. chránené územia, tj.
https://data.gov.sk/set/data/protected-site

ktorý je zhmotnený do konkrétnej verzie, napr. posledná verzia zo začiatku roka je
https://data.gov.sk/set/data/protected-site/2017-01-01.rdf

kde napr. konkrétne chránené pásmo (CHKO Malé Karpaty) má URI:
https://data.gov.sk/id/protected-site/SKNATG20

Čiže tu všade platí stanovený pattern na URI pattern, ktorý podľa odporúčaní rozlišuje def, id, doc, set – formu URI. Keď sa pozriem na RPI:Metaúdajový editor, tak pri zadefinovaní nového priestorového údaja mám prednastavené defaultne:

Kód https://data.gov.sk/set/rpi/dat/domena/id
Menný priestor https://data.gov.sk/set/rpi/dat/domena

čiže, predpokladám, keby som ho chcel registrovať prostredníctvom RPI tak mu navrhnem URI
https://data.gov.sk/set/rpi/dat/chranene-pasmo/SKNATG20/

Lenže, ako sa rozlišuje URI datasetu chránených pásiem (https://data.gov.sk/set/… ), a konkrétne chránené pásmo (https://data.gov.sk/id/… )? To sú dve iné entity. A keby som chcel definovať špeciálny katalóg chránených pásiem, ktorý by mal rôzne datasety (samotné chránené pásma + súvisiace číselníky + mapovania …), to by malo aké URI?

Čiže keď to zhrniem,
iné je URI pre konkrétne chránené pásmo
https://data.gov.sk/id/protected-site/SKNATG20

iné je URI pre dataset chránených pásiem
https://data.gov.sk/set/data/protected-site

iné je URI dátového prvku pre chránené územie
https://data.gov.sk/def/ontology/environment/ProtectedSite

(pričom tento dátový prvok v separátnom mapovaciom datasete sa mapuje na externé, štandardzivané ontológie, tj.

http://data.gov.sk/def/ontology/environment/ProtectedSite
        rdfs:subClassOf
                http://www.w3.org/2015/03/inspire/ps#ProtectedSite

Ako toto chcete všetko riešiť cez RPI?

Ako to súvisí s metais:

Konkrétne pre MetaIS by sa zaregistrovali len menné priestory (šablóna URI), príslušné dátové prvky a podobne, tj. pre chránené územia

https://data.gov.sk/id/protected-site/[KOD-CHRANENEJ-OBLASTI], kde
KOD-CHRANEJ OBLASTI = aktuálne používané kódy, tj. SKNATG20, a podobne.

Rovnako už dnes je zaregistrovaná ontológia (návrh)
https://data.gov.sk/def/ontology/environment

ktorá obsahuje entity súvisiace so životným prostredím. Ako som už spomenul, samotné mapovania na svetové štandardy riešime cez osobitné datasety, aby sme mali takpovediac všetko modulárne. Pri tejto príležitosti (ontológie) len dodám, že niekedy stačí použiť priamo externú ontológiu (ktorá bude v zozname dovolených), ale v prípade, že je potrebné sémantiku rozširovať, pridávať nové property, vlastnosti, pravidlá, a podobne, tak sa natívnej triede vyhnúť nedá. V súčasnosti má táto ontológia triedy (na základe spracovania data.sazp.sk)

Triedy: env:BurdenType, env:ContaminatingActivityType, env:Burden, env:PriorityLevel, env:GarbageDump ...

Toto sú dve iné veci. Jedna vec je DCAT (a jeho profil GeoDCAT-AP), a druhá vec sú URI pre entity, druhy entít a ich URI, ich stotožňovanie, proces registrácie, podpora prepojenia dát na všetky ostatné ISVS, pretože to je podľa mňa najklúčovejšia požiadavka. Tj. aby všetky dáta ISVS boli prepojené, a bude super, keď budú i zohľadňovať svetové štandardy. A tie sa zohľadňujú :wink:

Napr. keď si pozrieš ako je spravený LOD, aj konkrétne jeho časť priestorové údaje, tiež tam nájdeš ontológie DCAT, ADMS, GEOSPARQL, geometriu a podobné.

Navrhované štandardy podobne ako odporučené pravidlá tvorby URI nepodporujú používanie vlastníka, resp. konkrétneho zdroja v URI, pretože toto veľmi obmedzuje perzistenciu, či už kvoli zmenám kompetencií, či neustáleho softvérového vývoja. Preto ani metodika nepodporuje používanie napr. skratky /rpo/, alebo /ra/, v URI, tj.

Agentúra životného prostredia je
https://data.gov.sk/id/legal-subject/00626031 (bez nutnosti uviesť tam zdroj, tj. /rpo/) a podobne, čiže toto plís používajme rovnako, tj. i bez RPI. Iná je vec, že chceš povedať, že katalóg RPI nech má túto skratku, tj.
https://data.gov.sk/set/catalog/rpi

Čo sa týka súčasnej podoby URI identifikátora, tak to je pokryté (Výnos č. 55/2014 Z. z. - § 46)
http://www.zakonypreludi.sk/zz/2014-55 a to je veľmi dlho stabilná a diskutovaná vec. Jedinou zmenou je prechod na https – kvoli dereferenciácii.

Ako som už uviedol vyššie, otázka je táto, či si vieš (plís) predstaviť, že by URI priestorových údajov bolo v duchu súčasných štandardov, ktoré sú na príkladoch ukázané v LODe, tj. že URI pre chránené pásmo bude ako som uviedol vyššie, tj.

napr.
https://data.gov.sk/id/protected-site/SKNATG20

No nevyzerá to krásne? A to myslím aj to URI :sunflower:

a podobne. Ak áno, tak ja do MetaIS zaregistrujem žiadosť na schválenie URI horeuvedenej šablóny URI (namespace), ktorá bude predložená do PS1. Takto bude zaevidovaná aj žiadosť pre dátový prvok env:ProtectedSite. V samotnej ontológii environment, pri dátovom prvku ProtectedSite bude cez ADMS ontológiu referencia priamo na metaIS, tj. keď niekto bude pracovať s dátami, vie si „overiť“, či sú dané prvky naozaj schválené (referencné URI).

Tomuto priznám sa, nie celkom dobre rozumiem, najmä tej časti, že dáta majú byť v registry adries, a metadáta v RPI. Ja to vidím tak, že tieto systémy, a to aj spoločne s metais, nemajú mať paralelnú totožnú funkciu. Chápem že sa veci nejako vyvíjali, na druhej strane by sme im mali dať teraz správnejší smer. Čiže takto:

Centrálny metainformačný systém by mal ostať jediný centrálny metainformačný systém, tj. ten ktorý prideľuje URI dátovým prvkom v ontológiách, datasetom (číselníky, hierarchie, dátové exporty), ale aj niektorým kľúčovým entitám Egovernmnetu, ako povinné osoby, egov projekty, všetky služby, formuláre, a podobne.

Register adries: toto je už zladiteľné z MetaIS, pretože všetky dátové prvky ontológie
http://data.gov.sk/def/ontology/location ako napr.

loca:Location, loca:PhysicalAddress, loca:Region, loca:County, loca:District, loca:Municipality, loca:NUTS3, loca:LAU1, loca:LAU2, loca:Street, … sú už zaevidované v MetaIS.
Referenčné URI napr. Štefanovičovej ulice je

https://data.gov.sk/id/street/39124

pričom identita 39124 je prebratá z Registra Adries, tj. v MetaIS bude zaregistrovaný namespace takto
https://data.gov.sk/id/street/[ID-ULICE]
id-ulice = objectID z registra adries

Register priestorových údajov: Jeho úlohu vidím podobne Registra adries, tj. je to evidencia špecifických priestorových údajov (INSPIRE modely/ontológie), pričom ale ak by napr. existoval nejaký export dát z RPI, resp. systém by poskytoval nejaké služby, tak aj tie musia byť zaregistrované v MetaIS, a keby som chcel vrátiť napr. údaj aké konkrétne stromy rastú na Štefanovičovej, tak by som vrátil URI štefanovičej nasledovne:
https://data.gov.sk/id/street/39124

Áno je to presne tak, za príslušné namespace zodpovedá príslušný gestor, tak ako napr. ontológia právnických subjektov – je v kompetencii MIFI (čo prešlo kompetenčným zákonom na UPVII), a naštastie keďže v URI nemáme údaj o vlastníkovi, tak sa nám nerobí neporiadok v dátach.

Presne ako to máš v dokumente GeoDCAT-AP (strana 24), v LODe je priestový údaj oblasť Malých Karpát reprezentovaná takto:

<env:ProtectedSite rdf:about="https://data.gov.sk/id/protected-site/SKNATG20">
        <geo:hasGeometry rdf:resource="https://data.gov.sk/id/protected-site/geometry/SKNATG20"/>
</env:ProtectedSite>

<geo:Geometry rdf:about="https://data.gov.sk/id/protected-site/geometry/SKNATG20">
        <geo:asWKT rdf:datatype="http://www.opengis.net/ont/geosparql#wktLiteral">
        <![CDATA[MULTIPOLYGON((48.9996864900867 21.66499604268784, 48.96645117024876 21.664996326004616, 48.93311686383343 21.66499661471734))]]></geo:asWKT>
</geo:Geometry> 

samozrejme tých bodov je tam málo, je to len príklad. A samozrejme, že tá geometria sa dá reprezentovať rôznymi modelmi geometrií.