LOD Slovakia (Linked Open Data Cloud)

Milí priatelia.

dovoľte, aby sme Vás pozvali na spoluprácu pri budovaní Otvoreného cloudu prepojených dát nazvaného LOD Slovakia (Linked Open Data SK), čo je v rámci SK chýbajúca aktivita prebiehajúca vo viacerých štátoch EÚ či USA.

LOD Slovakia je tvorený datasetmi získanými zo Štatistického úradu, Obchodného registra, Štatistického registra organizácií, Slovakiani, MetaIS, Štátneho ústavu pre kontrolu liečiv a ďalšími.

Celý dump databázy (verzia 0.9) si môžete stiahnuť tu:
http://data.slovpedia.com/dumps/lod-slovakia-all.zip

Databáza obsahuje 473.691 tripletov, po rozbalení má veľkosť 44 MB (OWL súbory, ktoré si môžete naloadovať do ľubovoľnej tripletovej databázy).

Táto výzva je určená pre všetkých záujemcov o problematiku Linked Data vo verejnej správe. Ak si programátor, anylytik, či zástupca komerčnej alebo štátnej organizácie, a chceš sa podieľať na novej dátovej základni údajov verejnej správy, aktuálny cloud LOD Slovakia môžeš obohatiť o nové datasety, s ktorými ti v návrhu radi pomôžeme (prostredníctvom sémantických dátových štandardov).

Sémantické dátové štandardy pre údaje verejnej správy SR (návrh)

Čo je naväčšia výhoda takéhoto prístupu: Asi najdôležitejšia výhoda je, že s dátami sa dá pracovať ako s jedným celkom, teda môžem ich miešať a dopytovať sa cez viaceré registre. Archiktúra Linked Data je založená na grafových databázach podporujúcich strojové spracovanie s ohľadom na význam dát, čo reprezentuje 3-tiu generáciu webu, tzv. Sémantický web.

3 Likes

Projekt Otvorených linkovaných verejných dát Slovenska vôbec nespí, naopak, postupne spracovávame jednotlivé zdrojové registre. Keďže riešime príliš veľa vecí, rozhodli sme sa častejšie pridávať jednotlivé zdroje namiesto veľkej aktualizácie každých 10 rokov :wink:

Práve teraz sme dokončili návrh na sémantizáciu viacerých datasetov Životného prostredia, na čom robíme spolu s @msurek + @hanecak + @mtuchyna, čo je postavené na vynikajúcom projekte data.sazp.sk, kde sme zladili niektoré URI s návrhom Sémantických dátových štandardov (zabalenie do DCAT ontológie, úprava URI identifikátorov na data.gov.sk a podobne). Musím sa priznať že (okrem našich LD :blush:) je tento portál určite najlepšie v sémantike čo sme na slovensku našli a opäť sme sa hodne priučili (použitie INSPIRE ontológií, GEOSPARQL a podobne).

Formálne sa jedná o nový DCAT katalóg environement s datasetmi chránených území, environmentálnych záťaží, kategórií povrchu krajiny … (Register Environmentálnych záťaží) navyše doplnený o dataset Skládky odpadov (Register odpadov), pričom sa ale zohľadňuje jednotný prístup k verejných linked data (katalógy, datasety (číselníky, hierarchie), ontológie, …). Vidieť je to možné na nasledovnom výňatku zo špecifikácie katalógu živ. prostredia:

<dcat:Catalog rdf:about="http://data.gov.sk/set/catalog/environment">
  <dct:title xml:lang="sk">Katalóg data.sazp.sk</dct:title>
  <dct:title xml:lang="en">data.sazp.sk Catalog</dct:title>
  <odp:gestor rdf:resource="http://data.gov.sk/id/corporate-body/00626031"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/data/species-distribution-unit"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/species"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/data/protected-site"/> 
  <dcat:dataset rdf:resource="http://data.gov.sk/set/data/contaminated-site"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/environment-burden-type"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/environment-priority-level"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/contaminating-activity-type"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/data/corine-land-cover"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/data/bio-geographical-region"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/data/garbage-dump"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/garbage-dump-type"/>
</dcat:Catalog>

Stiahnuť si ich môžete tu:
http://data.slovpedia.com/dumps/lod-0.9.1-sazp-diff.zip a môžete si ich naloadovať do ľubovoľnej triplestorovej databázy, napr. AlleGrograph alebo iných. Na uvedenom linku je len nový prírastok environmentálnych dát, čiže ak chcete mať celý LOD Slovakia v DB, je potrebné si naloadovať aj 0.9 dump, čo je prvá linka v predchádzajúcom príspevku.

Dôvod prečo sme to hneď nespojili je, že to spravíme naraz aj s ďaľšími pripravovanými datasetmi z registra adries, ale aby sa veci hýbali, tak to robíme takto. Idea použitia v budpúcnosti je, že dáta budú zaregistrované na data.gov.sk ako RDF datasety (5★) pričom fyzicky budú dostupné na data.sazp.sk

Nasledovný obrázok ilustruje reprezentáciu vybranej enviromentálnej záťaže - Bývalej galvanizovne v BB, ktorá je v enviroportále vedená pod ID = 1, čiže jeho URI po transformácií je

http://data.gov.sk/id/environment-burden/1

Akékoľvek pripomienky sú vítané a vopred za ne ďakujeme.

1 Like

Super, toto je paradna aktivita. Ono je to mozno teraz frustrujuce, kedze sa tu velmi vela aktivity nedeje, ale treba to chapat tak, ze to v najblizsej dobe pride. Akonahle zacne metais2 realne publikovat jednoznacne URI a pusti vonku metodiku co s tym a pretransformuju sa zakladne ciselniky a registre tak, ze budu mat v sebe aj URI cela link data hra sa rozbehne. Tym vam len chcem naznacit, ze je super, ze ste do tejto aktivity dali tolko energie a urcite sa to cele zuzitkuje. Treba realisticky zhodnotit situaciu. Kym nebude par referencnych dat stat v centre grafu tento je tento na vode. Verim, ze sa to coskoro pohne.

3 Likes

LOD Slovakia sa rozširuje o Register adries.

Register adries sa snaží zjednotiť referencovanie adries naprieč celým spektrom verejných dát. Bohužiaľ, tým že nie je vytvorený v sémantike, ale len v klasickej relačnej databáze, tak k existujúcim používaným dvom typom identifikátorom (napr. raz má BSK kód 1 (číselník CL0049), raz má kód SK010 (číselník CL0023)) sa vlastne musel pridať ďaľší, tretí - “najdôležitejší” (napr. BSK má novú hodnotou 2) :cry:

No a teraz keďže v súčasnosti všetky verejné dáta používajú pôvodné identikátory (tj. pre BSK 1 alebo SK010), a náš milovaný štát chce nariadiť (ak už nenariadil) že všetky dáta musia byť integrované na nový identifikátor, (tj. 2 pre BSK) , je veľmi otázne, ako sa chce tento cieľ naplniť. Neviem aké sa pre toto plánujú realizovať projekty, a určite to nebude nič jednoduché.

Ledaže :innocent: tu opäť vstúpi na scénu sémantika, resp. LinkedData, resp. LOD Slovakia a pomôže nám. Najnovšia verzia voľné stiahnuteľných linkovaných verejných dát - LOD Slovakia 0.9.2 už obsahuje spracovaný register adries (cena 0EUR!), pričom riešenie spomenutého problému je jednoduché a elegantné. Samotný register v sémantike je reprezentovaný ako katalóg nasledovných datasetov:

<dcat:Catalog rdf:about="http://data.gov.sk/set/catalog/address-register">
  <dct:title xml:lang="sk">Register adries</dct:title>
  <dct:title xml:lang="en">Address Register Catalog</dct:title>
  <odp:gestor rdf:resource="http://data.gov.sk/id/corporate-body/00151866"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/region"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/county"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/municipality"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/district"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/street"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/data/street-geometry"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/building"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/apartment"/>
  <dcat:dataset rdf:resource="http://data.gov.sk/set/codelist/entrance"/>
 </dcat:Catalog>

čo sú LD formáty (5★) už publikovaných datasetov registra adries na data.gov.sk. Keďže LOD Slovakia už obsahuje štatistické číselníky http://data.gov.sk/set/codelist/stat-region (CL0049) a http://data.gov.sk/set/codelist/nuts3 (CL0023), jeho katalóg mapovaní bol rozšírený o datasety mapujúce jednotlivé entity cez reláciu owl:sameAs, výsledkom je nasledovný graf, ktory reprezentuje matching medzi jednodlivými uzlami reprezentujúcimi BSK prostredníctvom všetkých kódov, tj. (1,2,SK010) . Týmto spôsobom sa dá použiť akýkoľvek kód pre BSK a rovnako. akýkoľvek existujúci publikovaný dataset je k registru adries primiešateľný. :wink:

Tu na obrázku si možete všimnúť príklad BSK. Kľúčový je ten trojuholník v strede tvorený modrými uzlami (to sú jednotlivé URI BSK), každý je spojený so svojím zeleným uzlom, ktorý reprezentuje samotný identifikátor (kto ho vydal, platnosť od - do).

No a to je presne riešenie, ktoré si integrácia vyžaduje a je to voľne stiahnuteľné.
Najnovšia plne mergnutá verzia je dostupná na adrese:

http://data.slovpedia.com/dumps/lod-0.9.2.zip

2 Likes

Nová verzia LOD Slovakia 0.9.4. prináša otvorené prepojené údaje z Obchodného registra, Štatistického registra organizácií, Registra daňových subjektov, Registra adries, Štatistických číselníkov, Enviroportálu, Slovakiany, Meta-informačného systému a Slovensko.sk.

Celý LOD si môžete stiahnuť tu:
http://data.slovpedia.com/dumps/lod-slovakia-all.zip

Ak by mal niekto záujem o viacej informácií, dnes budeme robiť prezentáciu na dnešnom OpenData Meetupe vol.6, budeme veľmi radi akýmkoľvek pripomienkam.

Pozn: Datasety verzie 0.9.4 nie sú väčšinou úplné (obsahujú len príklady dát a ich prepojení), sú určené na štúdium pred prichádzajúcou štandardizáciou. Verzia 1.0 bude obsahovať aj naplnené dáta.

4 Likes

LOD Slovakia 0.9.4 (Linked Open Data) - Videoprezentácia z OpenData Meetupu 6.

Sémantické technológie (Web 3.0) umožnia generačne lepšiu prácu s dátami verejnej správy či už pre účely biznisu alebo transparentnosti. Kedže ku koncu roku plánujeme release novej verzie LOD Slovakia, dovoľte mi pridať video z vyššie spomenutého Open Data Meetupu 6 práve o tomto projekte.

1 Like

Nový LOD Slovakia 0.9.8 releasnutý!

Presne po roku zverejňujeme novú verziu LOD Slovakia 0.9.8 (LinkedOpenData), ktorá ukazuje, akoby mohol vyzerať výsledok informatizácie v oblasti kvality a prepojenia dát. Nová verzia LODu prináša množstvo zlepšení: nová verzia Centrálneho modelu údajov verejnej správy založeného na ontológiach, s konkrétnymi príkladmi vybraných entít a ich vzájomné väzieb z kľúčových registrov ako Register právnických osôb, Register adries, Centrálny metainformačný systém a ďalšie, a to aj s automatizovanou podporou správy referenčných údajov.

LOD Slovakia 0.9.8. je možné jednoducho a efektívne prehliadať jednak prostredníctvom textového prehliadača linkovaných dát na súčasnej adrese LODu, a to

http://lod.slovpedia.com

pričom entity je možné prehliadať aj prostredníctvom tripleskopu na adrese

http://lod.slovpedia.com/tripleskop/

Odporúčaný postup je najskôr použitie textového vyhľadávania a neskoršie prejsť do Tripleskopu, kde je možné používať rozšírené možnosti vizuálneho preskúmavania grafu.

Ak chcete vidieť ako vyzerajú vybrané prepojené údaje, tak jednoducho si pozrite nasledovné linky:
Ministertvo financií Slovenskej republiky je právny subjekt popísaný Ontológiou právneho subjektu s rôznymi vlastnosťami ako napr. názov, dátum vzniku, identifikačné číslo a ostatnými; ktorý sídli v budove Ministerstva financií na Štefaničovej ulici č. 5 v Bratislave - Staré mesto. Historická krása Bratislavy Starého mesta je zachytená napr. na obraze Pohľad na Bratislavu. Je fajn, že na prechádzky už nemusím nosiť vo vrecku Betadine (dezinfekčný roztok), lebo skládku na Chalupkovej už dávno odviezli.

Čo obsahuje LOD 0.9.8
Kompletný prehľad dát je možné vidieť na adrese
http://lod.slovpedia.com/data.html

Centrálny metainformačný systém verejnej správy
Katalóg sémantickej infraštruktúry (ontológie, mapovania …)
Register priestorových informácií
Katalóg číselníkov Štatistického úradu SR
Register adries
Register daňových subjektov
Register právnických osôb
Štátny ústav pre kontrolu liečiv

Aký je cieľ LOD Slovakia?
S nástupom Sémantického webu podobne ako v zahraničí, LOD Slovakia poskytuje otvorené prepojené údaje v najvyššiom stupni kvality podľa klasifikácie 5* Open Data. LOD Slovakia v súčasnosti pokrýva primárne doménu údajov verejnej správy SR so zameraním na dôležité registre ako Register adries, Register právnických osôb, Register priestorových informácií a podobne pričom jeho kľúčovou časťou je aj tzv. sémantická infrašturktúra, čo je množina národných ontológií a ich mapovaní na otvorené externé ontológie pre zabezpečenie sémantickej interoperability. Pre vývojarov sémantických aplikácií tvorí LOD Slovakia obrovskú pridanú hodnotu v podobe znovapoužiteľnosti rôznorodých prepojených dát a zníženia úsilia na integráciu rôznych zdrojov.

2 Likes

Je plan tam mat niekedy aj realne aktualizovane kompletne data? Z RPO tam vidim par subjektov.

Mam technicku: Ako sa tu riesia temporalne data? Ked si pozries len RPO, tak uplne vsetko ma historiu. Cize takmer akekolvek prepojenie ma nejaku casovu platnost od-do. Ako toto modelujete v RDF?

Ahoj, sorry za dlhší response time, posledné dni som bol mimo kompíka, napriek tomu že noťas po mne pokrikoval a posmieval sa mi, že ho neviem ani zapnúť. :expressionless:

Verím že toto samozrejme bude raz fungovať úplne, ale či to bude v rukách štátu, našej firmy (ak ešte v nejakej alebo akejkoľvek budem), ale zatiaľ je všetko otvorené. LOD Slovakia sa snažíme robiť otvorený, a aby sme našli kompromis že to vyvíja komerčná firma, tak je to spravené ako ukážka prepojených dát, kde LOD plánujeme zatiaľ rovíjať do šírky, tj. pridávať nové a nové domény - kde bude len pár príkladov. Klúčové je ale obsiahnutie základnej sémantickej infraštruktúry pre ISVS ako plné verzie ontológií + riešenie podstatných vecí ako referečné údaje, stotožňovanie, číselníky, rôzne identifkátory a podobne - čo bude predmetom štandardizácie.

Navyše, tajne dúfam, že aj u Vás je už pár developerov ktorý už poškulujú po LinkedData verzii Vášho ekosystému. Tým že výsledné RDFka sú otvorené, urobiť transformácie určite nie je problém. :innocent:

Toto je možné robiť viacerými spôsobmi, podľa konkrétnej situácie. Skúsim to rozdeliť do dvoch skupín:

A) Informácia o čase je naviazaná na špecifický uzol grafu

Napr. základné imanie WebSupportu je 6640E od 12.08.2004, tj. v takomto prípade to je

<https://data.gov.sk/id/legal-subject/36421928>
   lsub:equity
     <https://data.gov.sk/id/equity/36421928-2004-08-12> .
     
<https://data.gov.sk/id/equity/36421928-2004-08-12>
   rdf:type
     lsub:Equity;
   res:validFrom
     "2004-08-12"^^xsd:date;
   lsub:equityValue
     "6640"^^xsd:long.

A keby od dnes malo byť základné imanie vyššie o 1E, tak by sa jednoducho pridalo

<https://data.gov.sk/id/legal-subject/36421928>
   lsub:equity
     <https://data.gov.sk/id/equity/36421928-2017-04-20> .
     
<https://data.gov.sk/id/equity/36421928-2017-04-20>
   rdf:type
     lsub:Equity;
   res:validFrom
     "2017-04-20"^^xsd:date;
   lsub:equityValue
     "6641"^^xsd:long.
     
<https://data.gov.sk/id/equity/36421928-2004-08-12>
   res:validTo
     "2017-04-19"^^xsd:date.     

B) Informácia o čase je naviazaná na vybraný graf (subgraf)

V tomto prípade existuje sú aktuálne dáta reprezentované platnou (poslednou) distribúciou napr. datasetu RPO, napr. k včerajšiemu dňu by to bolo

https://data.gov.sk/set/data/legal-subject/2017-04-19.rdf

ktorá obsahuje informáciu o základnok imaní WebSupportu takto (URI uzla základného imania neobsahuhe čas, tj. …/equity/36421928-2004-08-12, ale stačí len …/equity/36421928), tj.

<https://data.gov.sk/id/legal-subject/36421928>
   lsub:equity
     <https://data.gov.sk/id/equity/36421928> .
     
<https://data.gov.sk/id/equity/36421928>
   rdf:type
     lsub:Equity;
   res:validFrom
     "2004-08-12"^^xsd:date;
   lsub:equityValue
     "6640"^^xsd:long.

pričom ak by sa opäť navýšilo o 1EURO, tak nová distribúcia datasetu RPO z dnešného dňa, tj.

https://data.gov.sk/set/data/legal-subject/2017-04-20.rdf

by už obsahovala aktualizované údaje o základnom imaní, tj.

<https://data.gov.sk/id/legal-subject/36421928>
   lsub:equity
     <https://data.gov.sk/id/equity/36421928> .
     
<https://data.gov.sk/id/equity/36421928>
   rdf:type
     lsub:Equity;
   res:validFrom
     "2017-04-20"^^xsd:date;
   lsub:equityValue
     "6641"^^xsd:long.

V tomto druhom prípade by platilo, že nová verzia datasetu nahradzuje staršiu verziu, tj.

<https://data.gov.sk/set/data/legal-subject/2017-04-20.rdf>
   dct:replaces
      <https://data.gov.sk/set/data/legal-subject/2017-04-19.rdf>

A v prípade dereferenciácie, keď by som žiadal o dataset, tj.
https://data.gov.sk/set/data/legal-subject/

tam by mi systém vrátil poslednú správnu, tj.
https://data.gov.sk/set/data/legal-subject/2017-04-20.rdf

ale toto je samozrejme závislé od konfigurácie dereferenciácie. Čo je ale ešte dôležité povedať v tomto druhom prípade je, že ak by som chcel mať naloadované všetky verzie súčasne, pretože chcem napr. robiť prehlad vývoja základného imania,
tak toto sa rieši prostredníctvom nahratia verzie do kontextu, ktorý je definovaný časovou verziou.

Zhrnutie:
Oba prístupy sú kombinovateľné, ten druhý prístup je vhodný práve v situáciach, keď je potrebné publikovať nové časové verzie datasetov, a toto platí aj pre ontológie, číselníky, referečné registre, atd, tj. napr. číselník typ identifikátora, tj.

https://data.gov.sk/set/codelist/CL004001/2017-01-01-example.rdf

je aktuálne platná časová verzia, pričom ak vznikne nová, tak je to ten istý mechanizmus ako v horeuvedenom príklade.
Každopádne, tento prístup nepočíta s historickým prístupom, kde sa používali tzv. dátové prvky s históriou. Možno @msurek by vedel k tomu povedať ešte viac.

Celkom na záver:
Včera sa uvoľnila pracovná verzia Ontológia času od W3C, ktorá rozširuje pôvodné xsd časové prvky ako xsd:dateTime, …, a zavádza celú ontológiu na lepšie vyjadrenie času elementmi ako napr. Okamih, Interval, atď, ktorými je možné presnejšie modelovať vzájomné vzťahy medzi rôznymi entitami. Túto ontológiu plánujeme samozrejme tiež umožniť “podporovať” v linkovaných dátach aby to bolo jednotné.

Rozumiem, to vyzera, ze to je trosku v plienkach este. SQL:2011 a podpora temporal data je sice standardizovana dlhsie, ale s podporou to tiez nevyzera slavne. https://wiki.postgresql.org/images/6/64/Fosdem20150130PostgresqlTemporal.pdf

Myslim si ze to treba vnimat v dvoch rozdielnych rovinach. Jedna vec je ako zapisujes data tj. datovy model a druha vec je schopnosti databazy riesit nejake advanced veci ako napriklad geo dopyty alebo aj tie temporalne dopyty.
Ak mas namysli specialne handlovanie temporal data, tak toto sa neda momentalne moc porovnavat.
Skorej by som toto vnimal ako datovy format, ktory jednoducho a jednoznacne integruje rozne entity a z daneho formatu je mozne si robit exporty tak ako je potrebne a do takej platformy/databazy ako je potrebne.
Dolezity je sposob verzionovania, ktory vychadza z programovania tj. mas snapshoty a ked ich releasnes tak mas novu verziu niecoho. Preto vzdy ked sa budu systemy integrovat na urovni datasetu (aj ontologia, alebo XSD schema je specialny typ datasetu), vzdy sa vie voci ktorej verzii a ta kedze je to release tak je nemenna.
Verzia moze byt diff ale aj kompletny dump, ak je to diff tak je to vzdy nalinkovane voci akej verzii a tym padom je jednoduche spravit crawler, ktory bude postupne prechadzat takto diffy a transformovat si ich do takej DB ako potrebuje. Niekto nepotrebuje prave tieto temporalne zavislosti a niekto zasa nie, dolezite je ze to vies vzdy zrekonstruovat a o ziadne data neprichadzas. Aspon takto to vnimam ja.

1 Like

Takže v súvislosti s prijímaním sémantických dátových štandardov mi dovoľte uviesť príklady LinkedData reprezentácie osôb. Nová verzia LODu počíta s príkladmi údajov tej istej osoby z RPO a tej istej osoby v politikaopen.sk.

Samozrejme, že údaje s RFO sú neprístupné, a teda nejde tu o stotožňovanie, ale o model údajov s nadväznosťou na iné referenčné registre, ako napr. Register adries a podobne. Čiže na tomto odkaze si môžete pozrieť ako vyzerá príklad záznamu pre Andreja Kisku (identifikátory sú zámerne nečitateľné, tj. štýl XXXX):

https://data.gov.sk/id/physical-person/XXXXXXXXXX (URI funguje cez lod.slovpedia.com)

Keďže údaje o Andrejovi Kiskovi sú publikované aj na politikaopen.sk, tak ich sémantická reprezentácia môže vyzerať napr. takto:

https://fair-play.sk/id/public-person/824 (URI funguje cez lod.slovpedia.com)

Tu si napr. môžete všimnúť, že v tomto prípade nemá Andrej Kiska v URI https://data.gov.sk/…, ale je to https://fair-play.sk/…, čo je prípad tzv. 4★ úrovne (tj. nie sú povinne používané inými subjekty verejnej správy), aj keď v tomto prípade by fair-play nemusela použiť ani ontológie z navrhnutého Centrálneho modelu údajov verejnej správy, ani by nemusela použiť URI z metaIS (napr. URI fair-play.sk, že je MetaIS). Samozrejme, od výborného riešenia by to bolo veľmi vzdialené, keby tak spravila. :wink: Ako môžete vidieť, v tomto prípade je osoba definovaná ontológiou public-person v gescii Aliancie fair play, pričom v ontológii je len vzťah že
osoba zverejnená na politikaopen.sk je rdfs:subClassOf dátový prvok Fyzická osoba. Týmto spôsobom je možné ontológiu špecializovať, či linkovať napr. ontológie ktoré popisujú oblasť transparentnosti, ako napr.

PPROC, an Ontology for Transparency in Public Procurement
http://www.semantic-web-journal.net/content/pproc-ontology-transparency-public-procurement-0

alebo
Public Contracts Ontology

a podobne.

Bezpečnosť: Jednak sú tieto URI samozrejme rozdielne, čiže ani technicky nereferencujú rovnakú osobu, a ako som už spomenul, RFO je neprístupné, takže tu stotožňovanie asi nehrá rolu.

Do budúcna bude asi potrebné jasne stanoviť, kedy je stotožňovanie legálne. Napr. ak sa jedná o osobu s rôznymi SIFO (sektorovými identifikátormi), ktoré podliehajú povinnému zverejneniu, napr. jednak je členom nejakej pracovnej skupiny, resp. vystupuje ako štatutár v nejakej firme ktorá sa zúčastňuje obstarávania, tak musí byť aj tento vzťah verejný. Napr.

<https://data.gov.sk/id/ps1-member/liska>
owl:sameAs
<https://data.gov.sk/id/statutory-body/35810734-miroslav.liska>

PS: Ten druhý identifikátor je vymyslený, v súčasnosti nie som (bohužiaľ) štatutárom žiadnej spoločnosti. :wink:

Ahojte. Takže pre rok 2018 vyzerá náš LODSlovakia takto:

Založili sme sa otvorenú skupinu LODSlovakia.EU, kde je možné jednak samotné dáta + viac informácií. Problematika je stále problematická, tak som o tom urobil “film”.

Je to trošku náročné sledovanie, uznávam. Niekedy príliš zoširoka, veľa informácií. 35 minút. Och.

Tak či onak, začal som postupne pracovať na novej verzii, ktorá bude snáď viac zaujímavejšia. Už urobenú časť beriem ako povinnú jazdu (agrodotácie, celkový koncept). Teraz je cieľom postupne prejsť jednotlivé články J. Kuciach a z nich urobiť graf, ktorý poprepája poprepájané registrové dáta. Musím povedať, že keď som si natiahol na pláno NDranghetu, vyzerá to desivo. Zaujímavé bude podľa mňa nájsť zaujívamé vzory a tie vyhľadávať vo všetkých firmách SR, kde sa napr. zakladajú komplikované siete firiem, resp. verejné obstarávania a ich vzťahy na firmy.

Na tomto nižšom obrázku je možné vidieť firmu CO.BE.R sro, ktorej konateľom je DRoda, pričom táto firma je spolupodielnikom v ďalších N firmách, ktorej konateľom je opäť DRoda. (firmy sú modré vrcholy).

Keďže dáta transformujem sám, chvíľu to potrvá.

1 Like

Ndrangheta - osoby - (Východné Slovensko)

Ndrangheta - legal subjects (Východné Slovensko) - Obchodný register


príklad žiadateľa o dotácie (BIO - FINIŠs.r.o.)
http://www.slovpedia.com/#/https://data.gov.sk/id/legal-subject/36453561

príklad pôdy
http://www.slovpedia.com/#/https://lodslovakia.eu/id/agro/soil-block-part/SK0415520691-0001-1