Otvorené údaje (filozofia, legislatíva, transparentnosť)

Ahojte,

chcel by som informovať o diskusii, ktorú teraz riešime na MIRRI spolu s OVMkami, ako aj dodávateľom CSRÚ. Je pomerne podstatná, rád by som ju zverejnil a získal prípadne pripomienky.
Kedže viacero OVMiek potrebuje publikovať otvorené údaje (kvoli rôznym projektom/dopytovým výzvam), množstvo z nich buduje (alebo plánuje budovať) OpenDataAPI, tak sa začína jasne profilovať zo samotných OVMiek preferencia buď:

  • jednoduchej katalogizácie zoznamu OpenDataAPI (ktorý sa v čase nemení rýchlo), ako napr. skatalogizované služby ITMS ,
  • alebo harvestácie lokálneho katalógu OVM (podľa DCAT-AP-SK 2.0) v prípade väčšieho počtu datasetov, ktoré vznikajú priebežne a sú rôznej povahy,

pričom samotné opendata sa nebudú ani do Centrálneho portálu nahrávať, a teda pre tento účel nebude potrebné použiť na to CSRÚ. Čo je rovnaký princíp ako v Česku, alebo Anglicku (decentralizované opendata). Jednak sa tým zjednoduchší portál, zeefektívni dátovy prenos (nebudú sa zbytočne prenášať dáta - na portál a potom ku jeho konzumentovi), dáta budú uložené na strane OVMka, ktoré je za neho zodpovedné. Samozrejme, do NKODu sa bude dať pridať katalogizačný záznam aj ručne cez GUI, ale linka už musí smerovať niekde na priestor (webstránku) OVM.

Ja som tento prístup preferoval už od začiatku, a keďže sa naskytla táto príležitosť - jednak kvoli názoru OVM, jednak kvoli potrebe portálu, podporujem tento prístup úplne. Zatiaľ je všetko v rovine diskusií, ale smeruje tadiaľto.

Tu je to možné vidieť na diagrame (ktorý sa dá urobiť ešte presnejšie, ale už by bol menej prehľadný) .

  • Ak má OVM taký ISVS, ktorá má služby OpenData, tak tie stačí ručne skatalogizovať na data.gov.sk, čím sa dajú nájsť hocikým. API ktoré poskytuje privátne API ani nie je skatalogizované, ani nie je verejnosti prístupné. (viď OpenData Publisher 1)

  • Ak má OVM taký ISVS, ktorý produktuje množstvo datasetov, ktoré sú rôzne, a vznikajú neustále v čase, vtedy je lepšie začať ukladať tieto súbory do vlastného úložiska u seba, a vytvoriť ich katalóg (tzv. lokálny katalóg LKOD), ktorý si poskytovateľ nahrá do svojej RDFDatabázy (napr. free), ktorá štandardne poskytuje SPARQL Endpoint. Tento Endpoint sa registruje na data.gov.sk, ktorý si sám automatizovane bude tento katalóg sťahovať k sebe. Tým opäť každý dokáže nájsť v katalógu opendata tohto poskytovateľa.(viď OpenData Publisher 2)

  • Ostatné ISVS môžu pristupovať a konzumovať priamo ľubovoľné OpenDataAPIčka alebo zverejnené opendata súbory u poskytovateľa, alebo Privátne dátové APIčka ak sú oprávnené zo zákona* (či už CSRÚ, alebo iné ISVS).

*Tu vidím v budúcnosti priestor na RPP (Register práv a povinností), ale toto zatiaľ neriešim.

1 Like