URI a jeho dereferenciácia (z diskusie k PS Lepšie dáta)

Seva Miro,

kludne mozme preniest e-mail diskusiu aj sem, preto nizsie pripojim pre uplnost aj odpovede na relevantnu cast komunikacie, nech sa to neriesi na n miestach.

Na uvod by som chcel opatovne zdoraznit a pripomenut, ze okrem plnenia prioritnych povinnosti vymedzenych legislativou INSPIRE patri uzka integracia RPI s eGov a Open Data aktivitami medzi prioritne aktivity (vid aj bod 03 Akcneho planu implementacie INSPIRE v SR).

Viac v texte…

V prvom rade je potrebne uviest, ze INSPIRE legislativne poziadavky a suvisiace technicke usmernenia boli prijate podstatne skor ako legislativne poziadavky na narodnej urovni v oblasti eGov, comu zodpovedaju viacere nekonzistentnosti ale aj konceptualne rozdiely pri implementacii.

INSPIRE je navrhnuty nad URIs, preto aj implementacia Narodnej infrastruktury priestorovych informacii (INSPIRE v SR) ma ambiciu byt uzko napojena na funkcny a organizacne zabezpeceny narodny mechanizmus koordinacie spravy Mennych priestorov (namespace), ktore su klucovym predpokladom pre tvorbu URIs.

Aj ked RPI v sucasnosti poskytuje iba metainformacny system, vyssie uvedeny mechanizmus umoznuje zaujemcom pri dodrzani legislativnych poziadaviek a technickych odporucani zabezpecit pristup k samotnym zdrojom a ich jednotlivym castiam, ktore v kontexte INSPIRE mozu byt vo forme:

  • suborov priestorovych udajov
  • serie priestorovych udajov
  • sluzieb

Ano nasadenie RPI este moze priniest niektore vyzvy, ale dobra sprava je, ze pri dostatocnej koordinacii zo strany MZP SR+SAZP, podpory dodavatela a sucinnosti povinnych osob sa systemovo nastavi standardizovane dokumentovanie priestorovych zdrojov metaudajmi, ktore umoznia zaujemcom pristup az k popisovanym udajom a sluzbam.

Z uvedeneho dovodu iba vitame, ze je ambicia nastavit Centrálny metainformačný systém verejnej správy (MetaIS) ako koordinacnu autoritu, no myslim, ze koordinacia by mala prebiehat na urovni mennych priestorov pre jednotlivych poskytovatelov udajov. Poskytovatelia priestorovych udajov by mali na zaklade prideleneho menneho priestoru byt schopni alokovat URI a vypublikovat svoje udaje (Who allocates URIs?).

Na zaklade mne dostupnych informacii organizacne a procesne pridelovanie Mennych priestorov v sucasnosti nie je koordinovane a v zmysle legislativy INSPIRE tuto povinnost musime zabezpecit, (kedze SR ma ako aj ostatne clenske staty EU jasne zadefinovane terminy v INSPIRE roadmap), nateraz bol na zaklade najlepsieho stavu poznania poziadaviek Vynosu ISVS nastaveny system pridelovania mennych priestorov pre vyssie uvedene zdroje v RPI s tym, ze samotne URI je vytvorene ako kombinacia menneho priestoru a identifikatora, ktory prideli autor metazaznamu.

Viac informacii nizsie.

Opat pripominam, ze projekt data.sazp.sk je pilotnym riesenim zameranym na identifikaciu moznosti spristupnovania INSPIRE aj nie INSPIRE priestorovych udajov prostrednictvom semantickeho webu vo vazbe na aktivity Open Data. Sme velmi radi ze tieto udaje boli integrovane do LOD a ako sme uz neraz avizovali, velmi radi budeme pokracovat na aktivitach v tejto oblasti, no nakolko musime prioritne zabezpecovat legislativne poziadavky a kapacitne zdroje su vyrazne obmedzene musime prehodnocovat priority.

Ako si sam skonstatoval, jediny nesulad s URI, ktore momentalne RPI priraduje je ze namiesto “http://data.gov.sk/
momentalne poskytuje “https://data.gov.sk/”. Po dnesnej konzultacii s dodavatelom by odstranenie “s” z protokolu nemal byt problem.

Ak ma byt sucastou URI aj samotny identifikator udajoveho zdroja, alebo jeho casti (atributu, triedy objektov), tak by bolo vhodnejsie nastavit MetaIS ako referencny register mennych priestorov. Vynimku mozu tvorit centralne spravovane ciselniky a registre. Kazdopadne by sprava identifikatorov jednotlivých inštancií konceptu mala zostat pod spravou autority, ktora udaje vytvara/spravuje (jeden zo zakladnych principov INSPIRE “Data should be collected only once and kept where it can be maintained most effectively.”).

Vobec nevidim ako problem sucasne nastaveny model, nakolko ihned ako sa v SR sprevadzkuje organizacne a procesne pridelovanie Mennych priestorov moze Ministerstvo zivotneho prostredia SR, pripadne SAZP poziadat danu autoritu o pridelenie menmeho priestoru: “MetaIS”.

Dolezite bude taktiez nastavenie “dereferencingu” cez uri pre zabezpecenie strojovo citatelneho pristupu az na najnizsiu dostupnu uroven. To ci uz budu samotne priestorove udaje, spristupnovane bud cez sluzby encodovane v rdf, json alebo gml je uz implementacny detail ako aj otazka preferencii ich konzumentov.

Ak sa da este dokument pripomienkovat, isto by som navrhovla upravit ten snapnuty text smerom:

“Jedným z dôležitých rysov RPI pre manažment údajov je zosúladenie sa s Centrálnym metainformačným systémom verejnej správy, od ktorého bude preberať pridelený menný priestor slúžiaci pre jednoznačné referencovateľne identifikatory pre priestorové údaje a súvisiace služby, čím sa dosiahne celková vzájomná interoperabilita údajov z RPI a ostatných referenčných registrov.”

Este k doterajsej komunikacii, nech to prediskutujeme na jednom mieste (reakcie su kurzivou):

---------- Forwarded message ----------
From: Líška Miroslav Miroslav_Liska@datalan.sk
Date: 2017-02-17 11:49 GMT+01:00
Subject: RE: Ad identifikator a URI v RPI vs Meta is
To: Martin Tuchyna martin.tuchyna@sazp.sk, Martin Koska martin.koska@sazp.sk, “Peter Mozolik (SAZP)” peter.mozolik@sazp.sk, Radoslav Chudý radoslav.chudy@g-base.com, Peter Hanecak hanecak@opendata.sk, Ján Tóbik jan.tobik@sazp.sk
Cc: Šurek Marek Marek_Surek@datalan.sk, Stefan Szilva stefan.szilva@gmail.com, Juraj Bárdy juraj.bardy@vicepremier.gov.sk

ahoj martin,

na linkovaných dátach pracujeme spolu už dlhšie, škoda že tak neefektívne, pretože Ťa považujem za správneho človeka na správnom mieste. :wink:

Vdaka, nemyslim si, ze ide o neefektivnost, akurat som na tom s vynimkou podpory niektorych kolegov sam a kapacitne nestiham sledovat vsetko. Preto som rad, ze sa aj aktivitami ako je implementacia RPI a Dokument Lepsie data pomaly posuvame k praktickym dopadom niektorych navrhovanych rieseni (pricom viem, ze este o niektorych dosledkoch ani netusim ;o)

aby som bol ale konkrétny:

  1. súčasný štandard tvorby URI je zverejnený tu
    Štandardy pre referencovateľný identifikátor (štandardy pre IS verejnej správy) | Lewik

kde je jasne zadefinované URI, tj. v zmysle http://data.gov.sk/… , nie ako v RPI, kde URI začína prefixom https://data.gov.sk/
Možno že je to len písmenko, ale ak chceme mať dobré Linkované dáta, tak aj to písmenko (mnapr. kvoli neskoršej derefernciácii) je potrebné dodržať.

Uz sa na tom pracuje. Ked to bude upravene, dam vediet.

  1. mrzí ma to o to viac, že sme už v marci milého roku spracovali vaše dáta zo http://data.sazp.sk a zahrnuli sme ich do LOD Slovakia (aby boli voľne prístupné pre všetkých),
    publikovali sme to napr. na slovensko.digital aby to každý videl
    LOD Slovakia (Linked Open Data Cloud) - #2 by liska

Som presvedceny, ze aj tieto udaje bude mozne upravit. Uz od minuleho roku ziadame posilnenie kapacit, pricom sme aj podali aj nejake projektove navrhy. Ak by daco vyslo, snad na to bude priestor. Bohuzial momentalne musime riesit riesit prioritnejsie ulohy.

  1. navyše, teraz v rámci K9.4 navrhujeme, aby vydávanie URI bolo v kompetencii jediného metainformačného systému verejnej správy a to Centrálneho metainformačného systému, a myslím že v tomto je aj logicky podpora, aby skrátka boli aj dáta, aj metadáta sémanticky interoperabilné s ostatnými referecnými registrami, aj s ontológiami INSPIRE
    Len pre uplnost. Tie INSPIRE ontologie, vo ci ktorym su natransformovane udaje na https://data.sazp.sk/dataset taktiez nie su jedine a zavazne, aj ked vidiet, ze sa Europska komisia snazi aj o vyvoj nastrojov v tejto oblasti (LD proxi).
    , aj s ontológiami ISA2 napr. atď … čiže obzvlášť rád tu by som sa chcel vyhnúť potrebe,aby ste museli publikovať aj mapovacie datasety na referenčné URI. Bližšia informácia o zmenách v dokumente K9.4 je napr. tu:
    MIRRI Pracovná skupina K9.4 Lepšie dáta - #63

čo s tým teraz?

  • Ponúkam, že im zadarmo (zdôrazňujem) pomôžem nahodiť do RPI prvky tak (spracujeme krátku kuchárku na URI), že sa zaregistrujú do MetaIS, a súčasne i do RPI. Nech sa v RPI vypne validácia URI (lebo to nepĺňa bod 1), a bude to OOK. Keď začne metaIS poskytovať službu registrácie URI automatizovane, tak sa to do RPI môže dopracovať.

Super, velmi radi vyuzijeme tuto ponuku a za seba pomozem, kde to bude mozne. Zriadis tu na SD platforme nejaky priestor, alebo to mam urobit ja, alebo niekde inde, aj ked tu je vyssia sanca na prispevok z komunity?

Vdaka, m.

miro

Od: Martin Tuchyna [martin.tuchyna@sazp.sk]
Odoslané: 17. februára 2017 8:53
Do: Líška Miroslav; Martin Koska; Peter Mozolik (SAZP); Radoslav Chudý; Peter Hanecak; Ján Tóbik
Predmet: Ad identifikator a URI v RPI vs Meta is

Zdravim vospolok

koncom minuleho tyzdna ma Miro Liska upozornil, ze struktura identifikatorov a suvisiacich URIs nezodpoveda legislativnym poziadavkam Vynosu ISVS.

V zmysle uvedeneho by som Ta chcel Miro poprosit, aby si nam upresnil, kde presne RPI nie je v tejto oblasti v sulade s Vynosom, pripadne inou legislativou.

Pre jednoznacnost niekolko klucovych “URI related” informacii:

RPI v sucasnosti poskytuje moznost/povinnost vytvorit jedinecne identifikatory na baze URI pre nasledovne koncepty:

  • súbor priestorových údajov (dataset)
  • série priestorových údajov (súbor datasetov)
  • služby (aplikačná služba v zmysle MetaIS)
  • metaúdaje popisujúce vyššie uvedené koncepty

Tieto identifikatory sa vytvaraju v nastroji s nazvom MetauDajovy Editor (MDE) .

Ten ma dve instancie:

  1. MDE - dostupný cez verejnu cast - bez potreby registracie a prihlasenia
  2. MDE - dostupny cez cast prispievatelov - tu je potrebna registracia a prihlasenie

V 1.MDE je mozne identifikatory volne upravovat, nakolko ucelom tohto nastroja je umoznit zaujemcom vytvorit metaudaje, ktore si nasledne uloza pre svoje potreby (tieto metaudaje sa neukladaju do RPI a preto nie su v rezime kontorly IDs a URIs)

V 2.MDE je vyssia kontrola , kde je prva cast URI pod spravou RPI (pre zachovanie jedinecnosti mennych priestorov) a jediny editovatelny priestor je pre samotne identifikatory, ktore musia pridelit tvorcovia metaudajov, nakolko oni su vlastnici/spravcovia popisovanych zdrojov.

Spominal si https, strukturu uri ako aj skutocnost, ze URIs by mal generovat MetaIS.

Mozes nam prosim upresnit, co je z toho uz legislastivne zavazne a procesne nastavene a co je vo faze pripravy?

Ako som Ti spominal, je nasim zaujmom zabezpecit sulad nie len s legislativou ale aj s poziadavkami praxe, predovsetkym v ramci vyuzitia metaudajov a v buducnosti aj samotnych udajov a sluzieb nielen pre potreby INSPIRE, ale aj eGov a Open Data. Kde to bude mozne samozrejme radi podporime spristupnenie udajov aj prostrednictvom technologiii semantickeho webu, ale tiez mame urcite priority a kapacitne a financne limity.

Vdaka za porozumenie ako aj usilie pomoct.

Zatial, Martin

Dakujem

2 Likes