Takže @mtuchyna, ako si si mohol všimnúť, nakoniec to vyzerá, že predsa len bude data.gov.sk URI začínať na https:// , takže to by sme mali a ostáva nám aj tak ešte všetko ostatné, a moja ponuka na pomoc pri nahadzovaní URI do RPI stále platí.
Ako vieš, už dávnejšie sme spracovali vaše publikované dáta z data.sazp.sk do LODu-SK, pričom samozrejme používame jednotný spôsob tvorby URI s využitím ontológií INSPIRE, DCAT, ADMS, … atď. Všetky dáta sú chápané ako adms:AssetRepository (dcat:Catalog) týchto datasetov
vdaka za tento thread a prepac za neskorsiu reakciu.
Ano, ukazalo sa, ze je dobre otvorit aj k takymto temam diskusiu a niektore navrhy opatrne posudit. RPI teda ostava s nastavenym https://.
Samozrejme radi budeme spolupracovat pri identifikacii moznosti a dopadov URI na RPI, MetaIS, data.gov.sk a dalsie systemy.
Mozes mi upresnit, co presne chapes pod nahadzovanim URI do RPI?
Len pre istotu a uplnost, termin spracovali znamena, ze udaje, ktore su k dispozicii na data.sazp.sk boli pretransfomovane a komplet naimportovane/alebo len prepojene? do LOD Slovakia?
Mam to chapat tak, ze ak by sme chceli k tymto 5 datasetom vytvorit metazaznam v RPI,
je potrebne upravit specialne identifikator, ktory im budeme priradovat v RPI, tak aby bol identicky s identifikatorom v MetaIS?
RPI uz dnes podporuje GeoDCAT-AP, nepostacuje toto API pre zabezpecenie uvedenej poziadavky?
Predpokladam, ze ide o datasety v LOD Slovakia a uvedeny <adms…/adms>select zodpoveda dopytu na metadata k k tymto datasetom.
K samotnemu rdf encodingu sa neviem uplne vyjadrit, ale kedze jednym z klucovych poslani RPI je podpora harmonizovaneho zdielania priestorovych udajov na SK a EU urovni, isto by som ocakaval v URIs minimalne na urovni metadat aj s “MetaIS”. V pripade samotnych udajov, sluzieb a podpornych registrov by som si potreboval ujasnit, ake su sucasne (ak su) legislativne poziadavky na URIs pre referencne zdroje a pre tie ostatne. Zatial som zachytil diskusie len na urovni referencnych registrov, ale da sa ocakavat, ze to pojde aj na uroven samotnych datasetov, sluzieb, ci aplikacii, alebo koncept referencnosti ostane len na urovni registrov?
Samozrejme, podme to skusit nahodit do RPI aby to bolo v MetaIS rovnako. Len mi musis objasnit, co to znamena “byt rovnako”, nakolko, ja som
bol v tom, ze do metais budu priamo naharvestovane cez Narodnu vyhladavaciu sluzbu, tak ako budu naharvestovane napriklad do data.gov.sk (samozrejme, len tie, ktore tam bude mat zmysel harvestovat).
Dobra otazka. Tych suvisov je niekolko, ale tu si nesieme dedicstvo este z povodnej NKIVS z 2008, kde sa podarilo presadit separatny zakladny Register adries aj napriek tomu, ze Adresy su zadefinovane ako jedna z tem INSPIRE, kde by sa kludne dali rozsirit o narodne specifika. Ale ok, mame tu dva oddelene narodne registre, pricom Register adries (RA) dnes obsahuje aj samotne priestorove udaje a tusim aj sluzby (co bude treba overit), zatial co Register priestorovych udajov zatial bude obsahovat iba metaudaje k priestorovym udajom a sluzbam, prostrednictvom ktorych vsak - je mozne dostat sa k samotnym priestorovym udajom a sluzbam, ak su dostatocne zdokumentovane a standardizovane spristupnene.
V sucasnosti RPI vyuziva RA len pri procese Registracie, kde sa overuju tzv Povinne osoby.
Naspat k tvojej otazke
Nateraz samotnymi udajmi pre adresy disponuje len RA. V RPI bude musiet relevantna Povinna osoba vytvorit metaznam/y k priestorovym udajom a suvisiacim sluzbam, ktore by mali obsahovat odkazy na samotne udaje a sluzby.
Pre lepsie porozumenie konceptov a suvisiacich URIs poprosim o priklad z predposlednej snimky “Protected sites example”:
Spravne to chapem, ze ak sa nastavi organizacno procesna sprava jednoznacnej identifikacie a pridelovania mennych priestorov, tak tak menny priestor “MetaIS” bude cez MetaIS prideleny autorite, ktora za tieto udaje v SR zodpoveda? Ak ano bude to Statna ochrana prirody SR, alebo Ministerstvo zivotneho prostredia SR)?
Ktory z uvedenych konceptov obsahuje odkaz na samotnu geometriu?
No predpokladám, že RPI:Metaúdajový editor slúži na to, aby som zaevidoval konkrétny priestorový objekt (indivíduum), ktorý je predvoleného typu ako chránené územie, výskyt druhu, stavbu …. atď. Teda, keď si poviem že idem zaevidovať konkrétne chránené územie, povedzme CHKO Biele Karpaty, tak potrebujem preň URI identifikátor a ten zaevidujete do RPI.
Áno, údaje boli kompletne (tj. všetky entity) transformované do data.gov.sk ontológií, individuíí, … + boli priradené štandardizované URI identifikátory, spolu s mapovaním na INSPIRE ontológie; presnejšie povedané, v príslušnom datasete bol vždy aspoň jeden prvok (niekedy viac) úplne serializovaných cez data.gov.sk štandardy, ktorými sa snažíme spojiť všetky dáta ISVS prierezovo.
Áno, ale len veľmi málo, nevidím to až tak problematicky, pretože jednak https sme uz začali podporovať aj my, kedže vyzerá že dereferenciácia môže byť tou informatickou gravitáciou čo má príležitosť prepojiť dáta verejnej správy (konečne) efektívne. Je tam podľa mňa už iba maličká odchýlka. Keď to zhrniem:
už sme viac krát refereovali tento vzor odporúčaný napr. v dokumente 10 rules for persistent URIs, ktorý asi poznás a dostal sa aj do výnosu o štandardoch.
LOD Slovakia (od verzie 0.9.1) obsahuje dáta zo data.sazp.sk nasledovne:
Všetky datasety publikované na data.sazp.sk (patria do katalógu RPI), tj. https://data.gov.sk/set/catalog/spatial-data-registry
ktorý obsahuje rôzne datasety, napr. chránené územia, tj. https://data.gov.sk/set/data/protected-site
ktorý je zhmotnený do konkrétnej verzie, napr. posledná verzia zo začiatku roka je https://data.gov.sk/set/data/protected-site/2017-01-01.rdf
kde napr. konkrétne chránené pásmo (CHKO Malé Karpaty) má URI: https://data.gov.sk/id/protected-site/SKNATG20
Čiže tu všade platí stanovený pattern na URI pattern, ktorý podľa odporúčaní rozlišuje def, id, doc, set – formu URI. Keď sa pozriem na RPI:Metaúdajový editor, tak pri zadefinovaní nového priestorového údaja mám prednastavené defaultne:
Kód https://data.gov.sk/set/rpi/dat/domena/id
Menný priestor https://data.gov.sk/set/rpi/dat/domena
čiže, predpokladám, keby som ho chcel registrovať prostredníctvom RPI tak mu navrhnem URI https://data.gov.sk/set/rpi/dat/chranene-pasmo/SKNATG20/
Lenže, ako sa rozlišuje URI datasetu chránených pásiem (https://data.gov.sk/set/… ), a konkrétne chránené pásmo (https://data.gov.sk/id/… )? To sú dve iné entity. A keby som chcel definovať špeciálny katalóg chránených pásiem, ktorý by mal rôzne datasety (samotné chránené pásma + súvisiace číselníky + mapovania …), to by malo aké URI?
Čiže keď to zhrniem, iné je URI pre konkrétne chránené pásmo https://data.gov.sk/id/protected-site/SKNATG20
iné je URI pre dataset chránených pásiem https://data.gov.sk/set/data/protected-site
iné je URI dátového prvku pre chránené územie https://data.gov.sk/def/ontology/environment/ProtectedSite
(pričom tento dátový prvok v separátnom mapovaciom datasete sa mapuje na externé, štandardzivané ontológie, tj.
Konkrétne pre MetaIS by sa zaregistrovali len menné priestory (šablóna URI), príslušné dátové prvky a podobne, tj. pre chránené územia
MetaIS, kde
KOD-CHRANEJ OBLASTI = aktuálne používané kódy, tj. SKNATG20, a podobne.
Rovnako už dnes je zaregistrovaná ontológia (návrh) https://data.gov.sk/def/ontology/environment
ktorá obsahuje entity súvisiace so životným prostredím. Ako som už spomenul, samotné mapovania na svetové štandardy riešime cez osobitné datasety, aby sme mali takpovediac všetko modulárne. Pri tejto príležitosti (ontológie) len dodám, že niekedy stačí použiť priamo externú ontológiu (ktorá bude v zozname dovolených), ale v prípade, že je potrebné sémantiku rozširovať, pridávať nové property, vlastnosti, pravidlá, a podobne, tak sa natívnej triede vyhnúť nedá. V súčasnosti má táto ontológia triedy (na základe spracovania data.sazp.sk)
Toto sú dve iné veci. Jedna vec je DCAT (a jeho profil GeoDCAT-AP), a druhá vec sú URI pre entity, druhy entít a ich URI, ich stotožňovanie, proces registrácie, podpora prepojenia dát na všetky ostatné ISVS, pretože to je podľa mňa najklúčovejšia požiadavka. Tj. aby všetky dáta ISVS boli prepojené, a bude super, keď budú i zohľadňovať svetové štandardy. A tie sa zohľadňujú
Napr. keď si pozrieš ako je spravený LOD, aj konkrétne jeho časť priestorové údaje, tiež tam nájdeš ontológie DCAT, ADMS, GEOSPARQL, geometriu a podobné.
Navrhované štandardy podobne ako odporučené pravidlá tvorby URI nepodporujú používanie vlastníka, resp. konkrétneho zdroja v URI, pretože toto veľmi obmedzuje perzistenciu, či už kvoli zmenám kompetencií, či neustáleho softvérového vývoja. Preto ani metodika nepodporuje používanie napr. skratky /rpo/, alebo /ra/, v URI, tj.
Agentúra životného prostredia je https://data.gov.sk/id/legal-subject/00626031 (bez nutnosti uviesť tam zdroj, tj. /rpo/) a podobne, čiže toto plís používajme rovnako, tj. i bez RPI. Iná je vec, že chceš povedať, že katalóg RPI nech má túto skratku, tj. https://data.gov.sk/set/catalog/rpi
Ako som už uviedol vyššie, otázka je táto, či si vieš (plís) predstaviť, že by URI priestorových údajov bolo v duchu súčasných štandardov, ktoré sú na príkladoch ukázané v LODe, tj. že URI pre chránené pásmo bude ako som uviedol vyššie, tj.
napr. https://data.gov.sk/id/protected-site/SKNATG20
a podobne. Ak áno, tak ja do MetaIS zaregistrujem žiadosť na schválenie URI horeuvedenej šablóny URI (namespace), ktorá bude predložená do PS1. Takto bude zaevidovaná aj žiadosť pre dátový prvok env:ProtectedSite. V samotnej ontológii environment, pri dátovom prvku ProtectedSite bude cez ADMS ontológiu referencia priamo na metaIS, tj. keď niekto bude pracovať s dátami, vie si „overiť“, či sú dané prvky naozaj schválené (referencné URI).
Tomuto priznám sa, nie celkom dobre rozumiem, najmä tej časti, že dáta majú byť v registry adries, a metadáta v RPI. Ja to vidím tak, že tieto systémy, a to aj spoločne s metais, nemajú mať paralelnú totožnú funkciu. Chápem že sa veci nejako vyvíjali, na druhej strane by sme im mali dať teraz správnejší smer. Čiže takto:
Centrálny metainformačný systém by mal ostať jediný centrálny metainformačný systém, tj. ten ktorý prideľuje URI dátovým prvkom v ontológiách, datasetom (číselníky, hierarchie, dátové exporty), ale aj niektorým kľúčovým entitám Egovernmnetu, ako povinné osoby, egov projekty, všetky služby, formuláre, a podobne.
Register adries: toto je už zladiteľné z MetaIS, pretože všetky dátové prvky ontológie http://data.gov.sk/def/ontology/location ako napr.
loca:Location, loca:PhysicalAddress, loca:Region, loca:County, loca:District, loca:Municipality, loca:NUTS3, loca:LAU1, loca:LAU2, loca:Street, … sú už zaevidované v MetaIS.
Referenčné URI napr. Štefanovičovej ulice je
https://data.gov.sk/id/street/39124
pričom identita 39124 je prebratá z Registra Adries, tj. v MetaIS bude zaregistrovaný namespace takto MetaIS
id-ulice = objectID z registra adries
Register priestorových údajov: Jeho úlohu vidím podobne Registra adries, tj. je to evidencia špecifických priestorových údajov (INSPIRE modely/ontológie), pričom ale ak by napr. existoval nejaký export dát z RPI, resp. systém by poskytoval nejaké služby, tak aj tie musia byť zaregistrované v MetaIS, a keby som chcel vrátiť napr. údaj aké konkrétne stromy rastú na Štefanovičovej, tak by som vrátil URI štefanovičej nasledovne: https://data.gov.sk/id/street/39124
Áno je to presne tak, za príslušné namespace zodpovedá príslušný gestor, tak ako napr. ontológia právnických subjektov – je v kompetencii MIFI (čo prešlo kompetenčným zákonom na UPVII), a naštastie keďže v URI nemáme údaj o vlastníkovi, tak sa nám nerobí neporiadok v dátach.
Presne ako to máš v dokumente GeoDCAT-AP (strana 24), v LODe je priestový údaj oblasť Malých Karpát reprezentovaná takto: