LOD Slovakia (Linked Open Data Cloud)

LOD Slovakia sa rozširuje o Register adries.

Register adries sa snaží zjednotiť referencovanie adries naprieč celým spektrom verejných dát. Bohužiaľ, tým že nie je vytvorený v sémantike, ale len v klasickej relačnej databáze, tak k existujúcim používaným dvom typom identifikátorom (napr. raz má BSK kód 1 (číselník CL0049), raz má kód SK010 (číselník CL0023)) sa vlastne musel pridať ďaľší, tretí - “najdôležitejší” (napr. BSK má novú hodnotou 2) :cry:

No a teraz keďže v súčasnosti všetky verejné dáta používajú pôvodné identikátory (tj. pre BSK 1 alebo SK010), a náš milovaný štát chce nariadiť (ak už nenariadil) že všetky dáta musia byť integrované na nový identifikátor, (tj. 2 pre BSK) , je veľmi otázne, ako sa chce tento cieľ naplniť. Neviem aké sa pre toto plánujú realizovať projekty, a určite to nebude nič jednoduché.

Ledaže :innocent: tu opäť vstúpi na scénu sémantika, resp. LinkedData, resp. LOD Slovakia a pomôže nám. Najnovšia verzia voľné stiahnuteľných linkovaných verejných dát - LOD Slovakia 0.9.2 už obsahuje spracovaný register adries (cena 0EUR!), pričom riešenie spomenutého problému je jednoduché a elegantné. Samotný register v sémantike je reprezentovaný ako katalóg nasledovných datasetov:

<dcat:Catalog rdf:about="http://data.gov.sk/set/catalog/address-register">
    <dct:title xml:lang="sk">Register adries</dct:title>
    <dct:title xml:lang="en">Address Register Catalog</dct:title>
    <odp:gestor rdf:resource="http://data.gov.sk/id/corporate-body/00151866"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/region"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/county"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/municipality"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/district"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/street"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/data/street-geometry"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/building"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/apartment"/>
    <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/entrance"/>
 </dcat:Catalog>

čo sú LD formáty (5★) už publikovaných datasetov registra adries na data.gov.sk. Keďže LOD Slovakia už obsahuje štatistické číselníky http://data.gov.sk/set/codelist/stat-region (CL0049) a http://data.gov.sk/set/codelist/nuts3 (CL0023), jeho katalóg mapovaní bol rozšírený o datasety mapujúce jednotlivé entity cez reláciu owl:sameAs, výsledkom je nasledovný graf, ktory reprezentuje matching medzi jednodlivými uzlami reprezentujúcimi BSK prostredníctvom všetkých kódov, tj. (1,2,SK010) . Týmto spôsobom sa dá použiť akýkoľvek kód pre BSK a rovnako. akýkoľvek existujúci publikovaný dataset je k registru adries primiešateľný. :wink:

Tu na obrázku si možete všimnúť príklad BSK. Kľúčový je ten trojuholník v strede tvorený modrými uzlami (to sú jednotlivé URI BSK), každý je spojený so svojím zeleným uzlom, ktorý reprezentuje samotný identifikátor (kto ho vydal, platnosť od - do).

No a to je presne riešenie, ktoré si integrácia vyžaduje a je to voľne stiahnuteľné.
Najnovšia plne mergnutá verzia je dostupná na adrese:

http://data.slovpedia.com/dumps/lod-0.9.2.zip

2 Likes