Jednotné URI subjektov RPO

#1

Milí priatelia/kolegovia, dovoľte mi toto vlákno “odštiepiť” z vlákna Sémantické dátové štandardy ISVS. Pôvodné vlákno sa bude viac zameriavať na sémantickú anotáciu, tj. použitie ontológií (Linked Government Data), pravidiel a podobne, kým toto sa zamerá na samotné identifikátory a problematiku dereferenciácie URI.

Na tvorbu data.gov.sk URI existuje zverejnená metodika

https://wiki.finance.gov.sk/pages/viewpage.action?pageId=1641678222
(PS1: Pripomienky nám prosím kľúdne napíšte i sem)
(PS2: Ak by mal niekto záujem o návrch URI pre nejaké entity, veľmi radi skúsime pomôcť našim pohľadom.)

Metodika tvorby URI je v súčasnosti high-level orientovaná, a ponecháva dostatok voľnosti pri tvorbe jednotlivých časti URI (keďže je treba podporiť automatické generovanie URI zo súčasných systémov). Súčasne však, na úplných detailoch existuje množstvo otázok.

Pekným príkladom je otázka, aký smerodajný URI identifikátor by bolo ideálne používať pre organizáciu?

V súčasnosti je to http://data.gov.sk/id/corporate-body/[IČO], tj. pre Slovensko.Digital by to bolo teda

http://data.gov.sk/id/corporate-body/50158635

Lenže začíname sa jemne prikláňať k identifikátoru organization_id v rámci RPO, tj. pre Slovensko Digital by to bolo

http://data.gov.sk/id/organization/6562824

Technicky môžu existovať oba, pričom sa pri stotožňovaní povie len že

<http://data.gov.sk/id/corporate-body/6562824>
   owl:sameAs
       <http://data.gov.sk/id/organization/50158635>

lenže teraz nám ide kým sa ešte dá, ideálne vyhnúť sa už pri návrhu sémantickej reprezentácie entít rôznym identifikátorom. Vedeli by sme si predstaviť aj použitie organizationID do URI, lenže tu nám to komplikuje špecifikácia referenčných údajov, ktorá viaže dátové prvky na IČO, viď
https://metais.finance.gov.sk/refregisters/detail/80d31646-5ca4-47f4-87fa-8fc3210769a6?page=1&count=10&sorting[order]=asc&tab=basicForm

Čiže dovoľte nám otázku:
a) Je IČO to isté ako IPO?
b) Je IČO v rámci RPO unikátne?
c) Existujú organizácie, ktoré majú IČO ale nie sú v RPO?
d) Existujú organizácie, ktoré majú RPO::organization_id ale nemajú IČO?

ďakujeme za pomoc.

#2

Co sa tyka duplicitnych ICO viem, ze existuju duplicitne ICO, dokonca v https://rpot.statistics.sk/ je v casto kladenych otazkach napisane:

RPO nema kompetencie riesit duplicitne ICO. Duplicitne ICO bude sucastou RPO a v odpovedi na dotaz na duplicitne ICO budu vratene vsetky vyhovujuce zaznamy.

1 Like
#3

Nie. IPO je udajne 12 miestne.

Nie. Existuju historicke zaznamy kde doslo ku koliziam. Po novom (od zmeny pridelovania ICO/IPO cez RPO) by uz unikatne byt mali. Tie historicke ci sa budu menit neviem.

Opacna otazka. Vieme o nejakych zdrojoch PO co maju ico a nie su tu?

organization_id maju vsetky v RPO, je to primarny kluc. Je to vsak nieco co nie je nikde zakotvene a vyzera, ze sa tam tie idcka recykluju (zmazu a potom pouziju znova).

ICO niektore subjekty nemaju.

SELECT COUNT(*)
 FROM rpo.organizations o 
 LEFT JOIN rpo.organization_identifier_entries oi ON o.id = oi.organization_id 
 WHERE oi.ipo IS NULL
 AND o.source_register IS NOT NULL 
 AND deleted_at IS NULL

6778

Pozor, toto su subjekty co IPO mali niekedy v historii NULL, nie nutne tie co maju null aktualne.

2 Likes
#4

Áno existujú, len napríkladmo:

  1. organizačné zložky občianskych združení napríklad Slovenský červený kríž v jednotlivých mestách odvodený od Slovenského červeného kríža alebo rôzne rodičovské združenia odvodené od Slovenskej rady rodičovských združení. Technicky ale nijaký takýto register neexistuje, čiže nie je čo do RPO prenášať
  2. slobodné povolania, a ostatné FO ktoré nie sú živnostníkmi (napr. notári, advokáti, exekútori), ktorí majú IČO avšak nie sú v žiadnom registri (teda určite sú evidovaní na ŠÚ keďže majú IČO)
  3. štátna správa a samospráva - nespočetné množstvo organizácií s IČOm (ďalej rôzne organizácie napojené na štátny/obecný rozpočet, napr. školy), avšak jednotný register neexistuje (možno okrem obcí a miest)
  4. pozemkové spoločenstvá - združenia vlastníkov spoločných nehnuteľností (bývali urbárnici, pasienkári a pod.) títo sú registrovaní na odboroch pozemkových a lesných na okresných úradoch príslušných
  5. verejnoprávne inštitúcie (RTVS, vysoké školy a iné)
1 Like
#5

Ano. RPO ma postupny nabeh, cize je este vela PO, FO podnikatelov, organov verejnej moci a organizacnych zloziek, ktore v RPO zatial nie su. Podla zakona by mali byt vsetky zdrojove evidencie v RPO do novembra 2017. Blizsie pozri § 12 v zakone o RPO - http://bit.ly/2g7FJ8G
Cielovy stav samozrejme je, ze vsetci s ICO budu v RPO. Plus ale treba povedat, ze to, ci niekto ma alebo nema ICO nie je podstatne pre jeho zapis do RPO.

Toto by malo byt komplet:
Obchodný register
Register nadácií
Register neinvestičných fondov
Register občianskych združení, odborových organizácií
Záujmové združenia právnických osôb
Register neziskových organizácií
Register pozemkových spoločenstiev
Register spoločenstiev (vlastníkov bytov a NP)
Register poľovníckych organizácií
Register cirkví a náboženských spoločností
Register právnických osôb, ktoré odvodzujú právnu subjektivitu od právnej subjektivity cirkví a náboženských spoločností
Register združení účastníkov pozemkových úprav
Register (politických) strán
Register krajských a oblastných organizácií cestovného ruchu
Register združení obcí
Register európskych zoskupení územnej spolupráce

Zivnostensky register ee, ten sa netyka registracie PO na ucely ich vzniku. Ten riesi len opravnenia na podnikanie.

2 Likes
#6

V poslednych dnoch som sa snazil dopatrat k informaciam z oficialnych zdrojov a tu je sumar :

  1. IPO (identifikator pravnickej osoby) ako skratka pravne neexistuje. Tento pojem mal nahradit povodne ICO, ale kvoli tomu ze by bolo treba opravit X formularov co by bolo nakladne, zostalo sa stale pri nazve ICO. Pojem IPO sa preto nema pouzivat lebo v principe neexistuje.

  2. Na zaklade konvencie ma ICO vzdy 8 alebo v specialnych pripadoch 12 ciselnych znakov (ked identifikuje organizacnu zlozku). Takze treba ratat s tym, ze ICO ako take moze mat bud 8 alebo 12 ciselnych znakov na urovni tohto cisla netreba robit ziadne heuristiky len identifikator preberat.

  3. ICO musi byt VZDY unikatne pre pravnicku osobu a pravnicka osoba ho MUSI mat. Prax sice pri zlievani registrov ukazala ze existuju pripady kedy doslo k omylu. Toto je ale vzdy po odhaleni takejto chyby riesene a opravovane definovanymi pravidlami zo zakona. Netreba preto riesit stav, ze treba ICO este zunikatnovat identifikatorom registra z ktoreho ten udaj je. Preto referencny udaj treba vzdy identifikovat cez ICO (a nie organization_id, IPO, ICO+ID registra a podobne).

  4. ICO musi byt unikatne pre pravnicku osobu a toto ICO moze byt distribuovane v N roznych registroch. Zjednoduseny priklad zivnostnik je v registry geodetov aj architektov. Stale vystupuje pod tym istym ICOm. Mozu ho kedykolvek vylucit z niektoreho registra ale ICO mu zostane. Tym padom ID registra je vazba na PO a nie je nutne ho zohladnovat v identifikatore PO.

  5. V RPO vo finale bude VSETKO co ma na slovensku ICO.

  6. RPO pouziva na integraciu registrov ciselnik “Zdrojový register” s ciselnikovym ID: CL010112, ktory je na statistickom urade. Tento ciselnik nie je ale schvaleny ako zakladny a MetaIS, planuje spravit ciselnik vsetkych registrov (nakolko niektore v nom chybaju) a ten bude zakladny. Tu ale vystava problem s tym, ze prebehla s mnohymi sluzbami integracia, ktore vychadzaju prave z tohto ciselnika a preto bude nutne doriesit ako bude vysledny ciselnik vsetkych registrov v MetaIS vyzerat a ake identifikatory jednotlive registre prepouziju. To je ale problem na ine vlakno a bude rieseny separatne.

  7. V sucasnosti existuju este mierne zakonne nedokonalosti, ktore by mohli byt vyriesene pripravovanym zakonom a preto ich zatial netreba specialne riesit lebo by mali vo finale byt doriesene.( Ide ale specialne pripady pouzitia napr. s obcianskymi zdruzeniami, ich organizacnymi zlozkami a ich trestnostou.)

1 Like
#7

Aby som tu ešte ukončil predchádzajúcu debatu.
Na základe vyššie uvedeného vyplýva, že referencovateľný identifikátor pre právnickú osobu je zatiaľ navrhovaný správne, tj.

http://data.gov.sk/id/corporate-body/[ICO]

pričom to IČO môže byť v súčasnosti 8, alebo 12 miestne. Technický identifikátor v rámci RPO bude vedený ako ďalší môžný technický identifikátor a bude súčasťou ontológie identifier, ktorá okrem iného “zbiera a upratuje” v množstve používaných identifikátorov.

Čiže napr. Slovensko.Digital potom v grafe vyzerá takto:

a RDF/XML zas takto:

1 Like
#8

Milí priatelia/kolegovia,

dovoľte mi Vás poprosiť o pomoc pri návrhu kľúčovej ontológie pre “pravnické osoby”. Problém je možno viac právny ako technický, ale nielen. Aby som bol konkrétny, je potrebné definovať triedy a najmä ich vzájomné postavenie v hierarchii, pre entity Fyzická osoba podnikateľ, Právnická osoba, Orgán verejnej moci a Fyzická osoba. Iste poznáte také čudnosti, že napr. Fyzická osoba Podnikateľ má IČO (čo je haluz, lebo on nie je organizácia). Chápem historickému vývoju, ale teraz práve pri prechode na sémantiku, by sa to mohlo/dalo upratať.

súčasný návrh:

My sme po dlhých úvahách prišli s riešením, ktoré je dokonca konzistenté sú súčasným stavom, a to registra RFO a RPO. Platí, že hlavnými osobami sú Fyzická osoba a Právnicka osoba. Právnická osoba sa delí na Podnikateľkú osobu a Orgán verejnej moci, kým podnikateľská osoba sa delí Podnikateľa fyzickú osobu a organizáciu. Tj.

máme dve ontológie, Ontológia fyzyckej osoby a Ontológia právnickej osoby:

prefix pper: http://data.gov.sk/def/ontology/physical-person
prefix lper: http://data.gov.sk/def/ontology/legal-person

potom hierarchia je:

toto sedí aj s RFO, tam je pper:PhysicalPerson aj RPO, tam je lper:LegalPerson tj. Fyzická osoba podnikateľ, Organizácia, a Orgán verejnej moci. IČO potom je naozaj IPO (identifikátor právnickej osoby). A všetko by bolo fajn.

lenže:
s čím to nesedí? Zatiaľ sa to nepáči mr. Szilvovi, ktorý poukázal na rôzne naše právne predpisy. Napr. tu:

Citát zo zákona, §2:
https://www.slov-lex.sk/pravne-predpisy/SK/ZZ/2015/272/

“(2) Do registra právnických osôb sa zapisujú údaje o
a) právnickej osobe,
b) fyzickej osobe – podnikateľovi,
…”

čo je zo sémantického hľadiska čistá nepresnosť. Raz hovorím o registry právnických osôb, a potom vymenujem popri iných entitách (napr. fyz. osoba podnikateľ) zase právnickú osobu, ako keby to bolo čosi samostatné.

tak či onak:
Kedže ale zatiaľ ma nenapadá lepšie riešenie, aj samotný uvedený paragraf je nepresný, dovoľte sa ma spýtať na Váš názor. Bola by uvedená hierarchia pre Vás OK?

ďakujem

PS: Z toho vyplýva, že Právnická osoba by mala mať URI
http://data.gov.sk/id/legal-person/[IČO],
kde IČO=IPO

#9

Len by som upozornil, že existujú subjekty, kedy jedno IČO má do istého dátumu pridelený jeden subjekt a odvtedy neskôr iný subjekt. Rovnako že viaceré subjekty majú totožné IČO v tom istom čase. Rovnako že jeden subjekt má postupne pridelené rôzne IČO.
Vôbec ma to neteší, tiež by som bol najradšej, keby sa RefId dal automatizovane generovať z IČO…

#10

RefId ma vydavat referencny register s tym ze namespace si zaregistruje v MetaIS. Preto si myslim ze toto su problemy RPO, ktory sa s tym musi vysporiadat a data precistit. V opacnom pripade to nebude referencny register, ale zliate nesurode data z roznych registrov. Z toho co som sa bavil so statistickym uradom, tak problemy kolizii a prekryvov sa riesia aby prave taketo pripady boli aj spatne odstranene. Kazdopadne rozne ICO by nebol problem lebo ho vieme stotoznit cez sameAs. Problem je zdielanie ICO identfifikatora, kde postup by musel byt v sulade s tym ako sa to rozhodli riesit v RPO a podla nich prebrat aj metodiku udelovanie RefId pre oblast pravnickych osob, zivnostnikov a OVM identifikovanu cez ICO.

1 Like
#11

Relevantne aj tu: ÚPVII Pracovná skupina K9.4 Lepšie dáta

Pokracujem tu.

Ak to SU riesi tak to ma tesi, avsak cakat na to kym to RPO cele precisti by bolo na skodu. Realita je podla mna taka, ze uplne ciste to nebude nikdy asi. Nezabudajme ze RPO je zaciatok, pride kataster a snad nebudeme cakat kym bude 100% aby sa to mohlo spustit. To do 2020 nestihneme ani aktualne vyhlasene ref. registre.

Ak to SU naozaj riesi, tak im mozem poslat nejake nase zistenia z ekosystemu. Oni to asi najskor vedia lepsie sami. Nemas tam nejaky kontakt?

#12

Jasne. Na 100% to v blizkej buducnosti asi nebude, kazdopadne vyuzitie URI len zvysi tlak na ciste data nakolko podpori odhalovanie problemov pri integraciach. Preto na viacnasobne URI existuje jednoduchy mechanizmu. No zdielane URI je problematicke aj z pohladu toho ako to riesia na RPO nakolko napr. pri tresnopravnej zodpovednosti zdielanie ICO som zvedavy ako by riesili.

V danom case som s nimi riesil kolko znakov ma ICO moze mat a vtedy som komunikoval s Keruľ Tomáš [Tomas.Kerul@statistics.sk] . Do problematiky sa vyznal a on aj vravel o cisteni dat. Kazdopadne som mal vtedy z rozhovoru taky pocit ze v celkovom ponimani ide v sucasnosti o minoritne percenta problemov.

1 Like
#13

Kedže som dostal aj celkom zaujímavú nótu ale zas s pridanou hodnotou z okolia PS1, skúsim túto tému ešte dalej posunúť a uviesť konkrétne 4 návrhy. Toto som poslal na PS1:

Návrhy (4 varianty) URI subjektov v Registry právnických osôb

Aby som ešte upresnil motiváciu, okrem nutnosti vôbec priradenia URI subjektu v RPO, snažil som sa vyriešiť/pomenovať aj problém, že napr. existuje číselník Právnej formy organizácie, no niektoré jeho položky nie sú organizácie ale podnikateľské fyzické osoby, zivnostníci, farmári …, čo by som chcel v modeli vylepšiť. Tieto FO (hoc podnikatelia) používajú IČO - čo by sa tiež dalo spresniť, a to aj v rámci RPO.
No a KDP toto nerieši už vôbec. Trieda CorporateBody (korporácia, organizácia, nie jednotlivec) ukazuje do číselníka Právna forma organizcie, čiže ak chcem nadefinovať FO-Podnikateľa, tak ho musím označiť ako CorporateBody. A toto som sa snažil opraviť/vylepšiť.

Čiže otázka je, čo zjednocuje osoby v RPO a súčasne odlišuje od osoby v RFO?

keď som hľadal jasné odlíšenie fyzickej osoby, čo by nebola hned organizácia, ale mohla to byt aj podnikatelska osoba, ale zase nie fiktivna osoba (napr. postava z knihy), takisto nie hneď business osoba pretože máme ešte orgány verejnej moci, tak som nasiel pojem LegalPerson (RPO-SUBJEKT).
@stefan.szilva má pravdu, že tá hierarchia čo som uviedol nie je správna, pretože FO podnikatel je FO.
Ja som tam zabudol pridat tento vztah, vedel som samozrejme o nom, bol taky jasny, ze som sa zameral na strukturu LegalPerson (RPO-SUBJEKT).
Druha vec je zaužívanie pojmu Register právnických osôb. Aj v zákone je raz spomenuté “Register právnických osôb”, a potom sa vymenuje pravnicka osoba samostatne. Tak či onak, vraciam sa k tomu, že i ontológia bude len abstrakcia.

Čiže opravená hierarchia vyzerá (a, b, c. d. sú varianty)

VariantaA:

Tu si myslim ked sa pouzije termín LegalPerson, čo sa neprekladá ako právnická osoba do slovenčiny, ale skôr “právna osoba” a v rámci KDP sa nepoužíva, čiže nedochádza ku konfliktu, tak je to OK. Definoval by sa význam - osoba/org. právna ale iná od fyzickej osoby, tj. tá ktorá je evidovaná v RPO (popis); tak je to omnoho lepšie než súčasný KDP stav.

čiže takto budú vyzerať konkrétne URI subjektov RPO

úrad podpredsedu vlády
http://data.gov.sk/id/legal-person/50349287

slovensko.digital
http://data.gov.sk/id/legal-person/50158635

Marcel Ferko - Autoškola Bearli
http://data.gov.sk/id/legal-person/45420246

predpokladám že nebude vznikať niečo nové ako RPO, takže je to OK.

VariantaB:

Keď mám byť okamžite presný, tak to môže byť napr. RPOPerson,
lenže URI by potom boli takéto škaredé, to plís nerobme kým nemusíme

úrad podpredsedu vlády
http://data.gov.sk/id/rpo-subjekt/50349287

slovensko.digital
http://data.gov.sk/id/rpo-subjekt/50158635

Marcel Ferko - Autoškola Bearli
http://data.gov.sk/id/rpo-subjekt/45420246

VariantaC:

Kompromis môže byť, že použijeme triedu LegalSubjekt - vo význame odlíšenia od Fyzickej osoby, a súčasne sa ešte viac oddialime od prekladu právnická osoba. a toto by sa už dalo podľa mňa lepšie čítať.
URI nie sú len pre roboty :wink:

úrad podpredsedu vlády
http://data.gov.sk/id/legal-subject/50349287

slovensko.digital
http://data.gov.sk/id/legal-subject/50158635

Marcel Ferko - Autoškola Bearli
http://data.gov.sk/id/legal-subject/45420246

VariantaD:

Aby som bol ešte úplný, keď použijem súčasné KDP 1:1 a nebudem sa snažiť riešiť že fyz. osoba podnikateľ nie je to isté čo organizácia, tak by URI vyzerali takto:

úrad podpredsedu vlády
http://data.gov.sk/id/corporate-body/50349287

slovensko.digital
http://data.gov.sk/id/corporate-body/50158635

Marcel Ferko - Autoškola Bearli
http://data.gov.sk/id/corporate-body/45420246

Takto to inak bolo už aj nahodené v metais, ale nedalo mi to neriešiť to, už aj preto, že som chcel aj kvoli jednoznačnosti referenčných údajov oddeliť doménu RFO a RPO dvoma samostatnými ontológiami (physical-person, legal-person), hoc sa vzájomne rôzne prepájajú.

Suma sumárum: Ja sa osobne prikláňam k variantám A, C, … a potom radšej k lepším iným návrhom než D, B :wink:

#14

Takže dostal som názor aj za Štatistický úrad, tj. LegalSubject, resp. LegalUnit, čiže aktuálny stav pre URI subjektu RPO je

a) http://data.gov.sk/id/legal-person/[ICO] - 1
b) http://data.gov.sk/id/rpo-subjekt/[ICO] - 0
c) http://data.gov.sk/id/legal-subject/[ICO] - 2
d) http://data.gov.sk/id/corporate-body[ICO] - 0
e) http://data.gov.sk/id/legal-unit/[ICO] - 1

#15

Ved si dajme normalne hlasovanie :slight_smile:

  • http://data.gov.sk/id/legal-person/[ICO]
  • http://data.gov.sk/id/rpo-subjekt/[ICO]
  • http://data.gov.sk/id/legal-subject/[ICO]
  • http://data.gov.sk/id/corporate-body[ICO]
  • http://data.gov.sk/id/legal-unit/[ICO]

0 voters

1 Like
#16

Pre zastancov jednotneho URI tu mam od @balgava takuto chutovku. Toto su duplicitne ICO/IPO v registri RPO. Netusim co vracia oficialne statne API podla ICO, ale z tohto mi vychadza, ze asi niekedy aj viac vysledkov.

https://bi.ekosystem.slovensko.digital/public/question/60a47fa6-bda8-4bcd-8d5c-453cb3fc25ea

#17

@jsuchal ako sa tam da prihlasit?

#18

Upraveny link.

#19

…cez CSRU z RPO, ak si dobre pamtam, chodil iba jeden vysledok…preto sme pri vytvarani konta do ITMS2014+ museli nechat atributy subjektu editovatelne, aj ked prisli z referencneho registra…

…akym pravidlom vyberali ten jeden vysledok, to uz neviem…snad na to v SU mysleli…

1 Like
#20

Nakolko to nepoznam, ten report znamena ze tolko pravnickych subjektov nema unikatne ICO?

Ako je to ratane? Napriklad ak ma jedno ICO 2 subjekty tak su zaratane oba? Smerujem len tam ze kolko je tych zaznamov, ktore treba zmenit, lebo ak maju 2 subjekty to iste ICO tak fixnut by sa to malo len pre jedneho z nich. A je mozne ze ma 10 odlisnych subjektov to iste ICO?

Ako vyzera vyhodnocovaci algoritmus tych duplicit, ktory povie ze je to ina firma? Meno? Adresa?