ahojte,
dovoľte mi ešte pred zajtrajším dôležitým hlasovaním vyjadriť sa k nemu (ku konkrétne dvom bodom spojených s cieľmi a princípmi LinkedData). Tie body nie sú o tom, či Centrálny model údajov a URI je správny prístup, alebo nesprávny. Hlasuje je sa o tom, ako silno/systémovo má byť linkeddata prístup zavedený. Či má existovať povinný centrálny dátový koordinačný orgán pre ISVS, ktorý bude koordinovať a vynucovať dodržiavanie dátových štandardov, alebo bude na svojvôly dodávateľa štátnej zákazky, aké dáta si vytvorí. Samozrejme také dáta budú len veľmi ťažko dbat na interoperabilitu s inými datasetmi od iného dodávateľa, čiže vždy treba všetko opakovane integrovať nanovo. Súčasný nevyhovujúci stav.
O čom sa teda hlasuje?
Možno sa teda strácate, že @Lubor toto podporuje, veď od slovenska.digital by sa toto očakávalo, tento prístup. Ja som teda už tiež stratený. lebo opak je pravdou. Tesne pred ukončením dokumentu
1)
Lubor navrhuje aby skrátka nemuseli byť otvorené dáta publikované ako datasety, ale postačia len API. A to teda najmä pre úroveň 4* a 5* (hoc takmer na každom gov portále je ZVÝRAZNENÁ podpora linkedata) .
Všiimnite si plís SPARQL Search priamo na uvode Europskeho data portalu
Teda nebude sa dať stiahnuť súbor, čo je základná požiadavka na open data, ale bude musieť postačiť API. Pritom takmer na každom gov open data portály sú formáty RDF, OWL publikované.
a dokonca už aj na našom data.gov.sk sú publikované prvé LinkedData
Takže v tomto prípade dúfam, že API nemôže nahradiť otvorený dataset. Ten je základnou formou reprezentácie open data. Ale určite je dobré mať aj API, ale nenahrádza ho.
2)
Hlasovanie o pravidlách interoperability otvorených dát pre nové datasety za verejné peniaze
- Toto už bolo na dvoch stretnutiach dohodnuté, tj.
Nové dáta 4*, Nové centrálne dáta 5*, Publikačné minimum 3*
Avšak chybou sa to stotožnilo s percentami pre Cieľový pomer počtu datasetov (70% zo všetkých má byť 5*).
Tu má platit vyššie uvedená definícia (bez percent). Je to ale veľmi kľúčové, je to učite zatial najdôležiteľší pilier dátovej interoperability na Slovensku, tj. systémové zavedenie linkedata. Tak nech sa prosím čo najviac schváli nahlas.
Ide o to, aby nemohli niektorý dodávatelia ignorovať štátne dátové štandardy - na identifikáciu (URI) a popis údajov (Centrálny model údajov verejnej správy). Nielen že dátová interoperabilita je prínosná pre tvorbu aplikácií, tvorbu dátových analýz, prehliadanie a objavovanie všetkých vzťahov entít so súvisiacimi entitami, ale dátová interoperabilita je kľúčová aj na efektívnu integráciu rôznych dodávateľov, ciže tu vyhráme všetci. A dôležité je, aby sa toto nedalo obchádzať, aby to malo systém, dalo sa to kontrolovať, rozvíjať, a podobne.
@lubor často argumentuje - “som proti novym projektom ktore potrebuju financie a technológie, ktoré nemám rád” “Čo keď všetko bude tunel, vy si chcete iba postaviť dom pri mori”, “najlepšie bude počkať až kým to bude niekde inde opensource (historický okamih)”. tu ale nejde o to, pretekať sa s rakúskom, anglickom, holandskom a tak ďalej, kto vie utratiť peniaze. napísal si, že “koľko bude sranda ako dereferenciácia stáť”. A marek Ti odpísal, že nie veľa, že ide o nastavenie presmerovania + univerzálnu stránku nad ľuvovoľnou entitou. Celý centrálny model údajov sme urobili zadarmo za 3 roky, a bol od začiatku publikovaný tu, a bol aj schválený na PS1. Predstav si. Takže to máme náklady ďalšie dolu. Už je v metais subsystém na registráciu URI a všetky entity v ňom majú URI. Ďalšie náklady preč. LOD Slovakia predstavuje zadarmo príklady prepojenia kľúčových referenčných registrov. Ďalšie náklady dole.
Veď podme to vyskúšať, o čom snívame. Centrálne spravovať dátové štandardy, aby boli dáta ISVS interoperabilné, a s takými dátami sa dá robiť všetko oveľa efektívnejšie. Otázka nákladov je samozrejme na mieste. Čo nám môžu také dáta priniesť? pre človeka, novinára, vývojové firmy, štát, eú, výskum, iot … ako toto vyčísliť? Neviem. Ale stanoviť si hru v informatike, a dávať pozor ako sa hrá, to podľa mňa vieme dať.
Prosím preto otvorene o podporu @hanecak , @mtuchyna, @msurek, ale aj @jsuchal @Lubor resp. všetkým ostatným samozrejme, ktorí si myslia že toto je cesta.
Čiže v tomto prípade pre nové open dáta VS za verejné zdroje platí: Nové dáta - aspoň 4★, Nové centrálne dáta - 5★, Publikačné minimum 3★
ktoré prispôsobujú postupné zavedenie linked data o ohľadom na zdroje. Ak sa robí veľký projekt dodávateľom a robí open data, tak jednoznačne musí dodržať URI + centrálny model. Ak ale nie sú dukáty, tak umožniť hociku vôbec publikovať aspoň niečo.
Ešte mi toto dovoľte zakončiť screenshotom s dokumentu
European Data Portal
Open Data Goldbook for Data Managers and Data Holders
Practical guidebook for organisations wanting to publish Open Data
4. Putting in place an Open Data lifecycle
4.1. Collecting data.
4.1.5. The Final Check::Check if metadata is described as LinkedData
ďakujem všetkým za podporu