LOD Slovakia (Linked Open Data Cloud)

Projekt Otvorených linkovaných verejných dát Slovenska vôbec nespí, naopak, postupne spracovávame jednotlivé zdrojové registre. Keďže riešime príliš veľa vecí, rozhodli sme sa častejšie pridávať jednotlivé zdroje namiesto veľkej aktualizácie každých 10 rokov :wink:

Práve teraz sme dokončili návrh na sémantizáciu viacerých datasetov Životného prostredia, na čom robíme spolu s @msurek + @hanecak + @mtuchyna, čo je postavené na vynikajúcom projekte data.sazp.sk, kde sme zladili niektoré URI s návrhom Sémantických dátových štandardov (zabalenie do DCAT ontológie, úprava URI identifikátorov na data.gov.sk a podobne). Musím sa priznať že (okrem našich LD :blush:) je tento portál určite najlepšie v sémantike čo sme na slovensku našli a opäť sme sa hodne priučili (použitie INSPIRE ontológií, GEOSPARQL a podobne).

Formálne sa jedná o nový DCAT katalóg environement s datasetmi chránených území, environmentálnych záťaží, kategórií povrchu krajiny … (Register Environmentálnych záťaží) navyše doplnený o dataset Skládky odpadov (Register odpadov), pričom sa ale zohľadňuje jednotný prístup k verejných linked data (katalógy, datasety (číselníky, hierarchie), ontológie, …). Vidieť je to možné na nasledovnom výňatku zo špecifikácie katalógu živ. prostredia:

<dcat:Catalog rdf:about="http://data.gov.sk/set/catalog/environment">
    <dct:title xml:lang="sk">Katalóg data.sazp.sk</dct:title>
    <dct:title xml:lang="en">data.sazp.sk Catalog</dct:title>
    <odp:gestor rdf:resource="http://data.gov.sk/id/corporate-body/00626031"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/species-distribution-unit"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/species"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/protected-site"/> 
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/contaminated-site"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/environment-burden-type"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/environment-priority-level"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/contaminating-activity-type"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/corine-land-cover"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/bio-geographical-region"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/garbage-dump"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/garbage-dump-type"/>
</dcat:Catalog>

Stiahnuť si ich môžete tu:
http://data.slovpedia.com/dumps/lod-0.9.1-sazp-diff.zip a môžete si ich naloadovať do ľubovoľnej triplestorovej databázy, napr. AlleGrograph alebo iných. Na uvedenom linku je len nový prírastok environmentálnych dát, čiže ak chcete mať celý LOD Slovakia v DB, je potrebné si naloadovať aj 0.9 dump, čo je prvá linka v predchádzajúcom príspevku.

Dôvod prečo sme to hneď nespojili je, že to spravíme naraz aj s ďaľšími pripravovanými datasetmi z registra adries, ale aby sa veci hýbali, tak to robíme takto. Idea použitia v budpúcnosti je, že dáta budú zaregistrované na data.gov.sk ako RDF datasety (5★) pričom fyzicky budú dostupné na data.sazp.sk

Nasledovný obrázok ilustruje reprezentáciu vybranej enviromentálnej záťaže - Bývalej galvanizovne v BB, ktorá je v enviroportále vedená pod ID = 1, čiže jeho URI po transformácií je

http://data.gov.sk/id/environment-burden/1

Akékoľvek pripomienky sú vítané a vopred za ne ďakujeme.

1 Like