MIRRI Pracovná skupina K9.4 Lepšie dáta

Na UPPVII dnes bolo dalsie zasadnutie K9.4 . Program:

  1. Zhrnutie činnosti Pracovných skupín a Dátovej kancelárie za rok 2019
    • Dátová kvalita (meranie dátovej kvality na rezortoch)
    • Referenčné údaje (plán vyhlasovania referenčných údajov)
    • Otvorené údaje (úlohy, rebríčky; EU regulácia OD a PSI, FFoD)
    • Moje údaje (technologické riešenie na otestovanie konceptu)
    • Legislatíva (Zákon o údajoch, Stop byrokracii,…)
    • Podujatia
  2. Informácia o stave národných projektov v gescii Dátovej kancelárie a dopytových výzvach v oblasti údajov
  3. Prerokovanie návrhov na vyhlásenie základných číselníkov a referenčného registra (v prílohe pozvánky):
    • Návrh na vyhlásenie referenčného registra adries
    • Návrh na vyhlásenie základného číselníka Časť obce
    • Návrh na vyhlásenie základných číselníkov Úradu geodézie, kartografie a katastra
  4. Priority na rok 2020
  5. Iné, navrhnite

Prilohy:

Par mojich poznamok:

Zhrnutie činnosti Pracovných skupín a Dátovej kancelárie za rok 2019

dat. kancelaria vznikla cca 2019/03 v pocte cca 5, dnes ich je 10

Dátová kvalita (meranie dátovej kvality na rezortoch)

zakl. vyznam/ucel/ciel: zavedenie exaktnych meratelnych ukazovatelov

zodpovedni su najma spravcovia registrov

  • UPPVII je “organ vedenia”
  • vid z. 95/2019 a novo pripravovany zakon o udajoch

aktualne vystupy su na stranke UPVII

  • pripravovala KPMG
  • obsahuje: navody, pilotne merania, …

merania sa budu/maju robit aj opakovane, aby bolo mozne hodnotit dopad vykonanych opatreni

pilotuju na cca 20 dat. zdrojoch/OVM

Referenčné údaje (plán vyhlasovania referenčných údajov)

narazili o.i. na leg. obmedzenia:

  1. UPPVII moze reagovat iba na navrhy predkladane spravcami, nepredklada sam
    • ale ziadne OVM sa zatial neprihlasilo same od seba
  2. ref. udaje “zverejnovane/poskytovane” cez CSRU: niektore “poskytnutia” su real-time, t.j. dopyt na konkretnu polozku, takze ziaden dataset, cize neexistuje ziadny uceleny zaznam o tom, kedy aka hodnota plati(-la)

plan vyhlasovania:

  • RA
  • nedopatky na daniach a clach
  • nedplatky soc. poist.

bariery pri vyhlasovani: nizka kvalita zdroj. udajov

  • “pikoska”: MS prezentovalo ze udaje o skl. odchadzke su ba 99%, neskor ale nedostatocmu kvalitu pouzili ako argument pri pomalom vyhlasovani prisluchajuceho ref. registra

zakon proti byrokracii:

  • zajra (18.12.2019) ide na vladu navrh na dasich 9 vypisov
  • viazu sa na to urcite data:
    • reg. upadcov
    • reg. hosp. zvierat
    • projemcovia min. st. pomoci

plany na 2021-2022: cca 200 navrhov/napadov

  • UDZS, ZVJS, UV SR, …
  • napr. ZA a PO VUC planuju rozne registre, ale ostatne VUC nie - mierne otazne, kedze by chybali udaje za ostanych 6 VUC
  • pri niektorych planoch chyba predstava, komu by to na co bolo: vcely, krmiva, …

otazka zucastneneho: zislo by sa poskytnut zoznam projektov, kedze mnohe slubuju nejake data

  • preco:
    • napr. MZP potrebuje vyhodnotit prekryv s INSPIRE
    • samotne UPPVII tiez vyhodnocovalo a bude vyhodnocovat urcite atrubuty projektov
    • MNO sa tiez radi pozru, vyhodnotia, porovnaju, …
  • MetaIS je to miesto, kde su resp. maju byt dostupne dokumenty o schvalenych projektoch, o.i. kvoli analyze/kontrole, ze kto ci slubil
    • schvalene projekty maju byt zverejnene uz dnes, bez potreby prihlasenia
    • Datalab (a.k.a. datova kancelaria UPPVII) uz ma tabulku/analyzu projektov (cca 30) za prve kolo schvalovania, posnazia sa zverejnit

vyzvy/financovanie: financie uz su takmer vycerpane

Ciselniky

doplnok k tomu, co je v casti “plan vyhlasovania” (vid vyssie)

o.i. katalogizovali udaje o spravcoch a vytipovavali zoznam ref. ciselnikov

vztah. s kvalitou: aby ref. udaje boli zadavane do registrov podla ciselnikov (t.j. nie “free style” ako jezial caste dnes)

Otvorené údaje (úlohy, rebríčky; EU regulácia OD a PSI, FFoD)

plnenie NKIVS cielov:

  • niektore metriky su “sialene”: pocet stiahnuti, …
  • zatial sa teda pracuje na metodike vykazovania
  • dovolil som si pripomenut, ze:
    • pre komunitu su vyznamnejsie KPI typu “v top 5 rebricka EUDP”, kedze to ma zmysluplnejsiu a prepracovanejsiu metodiku
    • a naopak napr. pocty stiahnuti datasetov povazujeme za bezvyznamne (a nepamatam si, kto to tam pridal)
    • plus ze KPI su z 2016, kedy boli velke ambicie, lebo:
      1. “zhruba dalsia miliarda na IT”
      2. dokonca data a Open Data boli (a su) jednou z priorit programoveho obdobia a IT balika eurofondov
      3. (v tom casebolo) 4-7 rokov na implementaciu

v EU rebrickoch sme 4. od konca (vs. ciel “prva 5”)

novy akcny plan OGP:

  • USV ROS “odstupuje” od Open Data …
  • … “vedenie” prebera “Strategia NASES” (dokument)

publ. minumum pre st. spravu bude UPPVII vypracuvat od 2020/01

  • publ. minimum pre samospravu “bolo skusene”, nevyslo

EU regulacia:

  • nova PSI: “high value” datasety

Moje údaje (technologické riešenie na otestovanie konceptu)

vystupy:

  1. koncept
  2. OpenAPI standard
    • autorizacia:
      a) vo vlastnej rezii alebo
      b) cez CSRU; autorizaciu overuje vo vysledku IAM (cez “mobile ID” od DEUS)
  3. proof of concept aplikacia
    • v uzavretom rezime je Datapp apka pre Android uz dnes v AppStore
      • je to “vedlajsi produkt” na otestovanie hlavneho vystupu: OpenAPI
      • budu zdrojaky?
        • budu (v zmysle platneho zakona o ISVS)
        • uz dnes by na Datalab mala byt starsia test verzia

63 schvalenych nar. projektov → UPVII sa im bude venovat z pohladu spristupnovania osob. udajov

par technickych hintov:

  • DEUS: mob. ID
  • Digi.me: sifrovany prenos

Legislatíva (Zákon o údajoch, Stop byrokracii,…)

zakon o udajoch

finalizuju MPK k zakonu o udajoch

upravena verzia pojde este raz do MPK

  • o.i. teda z toho bude “zakonnik udajov”
  • “presuvaju” don niektore “polozky” z inych zakonov:
    • ref. registre
    • zrejme neskor Open Data (t.j. buduca transpozicia novej PSI bude zrejme v tomto nmvom zakone)
  • vacsie previazanie s GDPR: analyticke jednotky, opravnenia a povinnosti dat. kuratorov, moje udaje, …

zakon proti byrokracii

bezi 3. vlna

uspory kol 1 a 2 boli vycislene na 8M€ rocne, uspory 3. kola su odhadnute na 18M€

dalsie vlny: nadalej ist po zivotnych situaciach a pocetnostiach

ale: napr. RFO je uz rok referecny, mnohe urady vsak nadalej nestotoznuju a pytaju potvrdenia od obcanov

naraza sa aj na technologicke limity:

  • napr. system dochodkovych davok je z r. 1975 (niesom si isy, ci som dobre pocul) => pre zdielanie sa musi
    spravit “udelatko”
  • inde maju “distribuovanu DB” na baze FoxPro a emailov

Informácia o stave národných projektov v gescii Dátovej kancelárie a dopytových výzvach v oblasti údajov

vyslo na to uz len poslednych cca 3-5 minut

dopytove vyzvy mali uspech, o.i. kvoli vzorovym projektom

UPPVVI ma 4 projekty:

  • Open Data 2.0 schvaleny
  • EVS Open Data projekt pozastavneny (niekde na MV SR)

pripravuju hackathony

Prerokovanie návrhov na vyhlásenie základných číselníkov a referenčného registra (v prílohe pozvánky):

Návrh na vyhlásenie základných číselníkov Úradu geodézie, kartografie a katastra

11 ciselnikov: udaje o pozemku, stavbe, …

priprava na neskorsie vyhlasenie ref. registra parciel

Návrh na vyhlásenie základného číselníka Časť obce

sucast RA

tiez priprava na neskorsie vyhlasenie RA ako ref. registra

vid navrh

udrzba: ocakava sa cca 5 zmien rocne

  1. MV SR, v MetaIS
    • hlavne miesto zverejnia
    • uz je dostupny dnes, na login, v test. verzii
  2. Stat. Urad, v ich systeme

dolezite su polozky prislusnosti k obci, cez SK NUTS kody - tot aby bolo jasne, kam ktora cast patri

vtah tohto ciselnika k registru zakladnych sidelnych jednotiek (SJ) v gescii MZP?

  • neriesili, lebo SJ nie je spravna jednotka
  • SJ dnes nema “pravne silne” postavenie

Návrh na vyhlásenie referenčného registra adries (RA)

referencne nebudu vsetky “stlpce”

  • typicky sa vynechavaju koordinaty, kedze ich vela chyba, us nespravne a pod.

su tam aj URI: kazdy adresny bod bude mat jednoznacny identifikator

  • o.i. budu pouzite pri stotoznovani

ocakacane vyhlasenie registra:

  • odhadom 2020/01-02
    • po KS a MPK

Priority na rok 2020

nevysiel cas

1 Like

asi zrejme tu: MetaIS

Tot tu, ak si dobre pamatam: https://www.slovensko.sk/_img/CMS4/strategia_otvorene_udaje.pdf

Resp. historicka referencia aj tu: OpenData stratégia - pripomienkovanie

Dnes na tom pracuje MNO Alvaria, vid napr. Chýbajúce publikačné open data minimum na Slovensku | Alvaria.sk

Nemile, kedze EVS cast ma zabezpecit ludi a IT cast “Open Data 2.0” ma tym ludom zabezpecit adekvatne vybavenie. Len teda ako ta IT cast vie, co bude adekvatne pre ludi, ktori pridu neskor a teda nemaju sancu sa v IT projektu vyjadrit?

Tot use-case na repozitar zdrjovych kodov (aktualne pripravovany projekt “Open Data 2.0”). Ale zase NASES take zvladol uz v minulosti, dokonca pocas vyvoja, vid:

28.1.2020 sa na ÚPVII konalo stretnutie “PS Referenčné údaje”. (Kedze v tom zacinammat chaos, lebo o.i. nepojuzivaju MetaIS ale len maily s “vela ludi v TO:”, tak to dam zatial sem.)

Ohlasena agenda:

  1. Informácia o aktuálnom stave návrhu Zákona o údajoch a o zahrnutí témy “Referenčné údaje” do návrhu zákona

    1. Informácia o aktuálnom procese pri vyhlasovaní Registra adries za referenčný register a o nových číselníkoch
  2. Diskusia k vyhláseniu vybraných údajov katastra nehnuteľností ako referenčných údajov a to za nasledovné oblasti:

    a) Geografické názvy nesídelných objektov

    b) Geografický priebeh administratívnych hraníc, Hranice katastrálneho územia (KÚ), kraja, okresu, obce

    c) Údaje o nehnuteľnostiach: Parcelné číslo reg. C a reg. E, druh pozemku reg. C, BPEJ

    d) Geometrické a polohové určenie parciel reg. C a reg. E (katastrálna mapa a mapa určeného operátu)

Poznamky nemam, nestihol som sa zucastnit. Zapis neviem ci je resp. ci bude.

Dna 9.6.202 sa konalo dalsie stretnutie PS K9.4 Lepsie Data. Par mojich poznamok:

Administrativne informacie

UPVII -> MIRRI, ICO ostava

dalsie stretnutia: on-line?

  • chcu testovat mix model, kedy X ludi je fyzicky pritomnych, Y bude “remote”
  • hladaju sa odporucania vhodne na tech. riesenie (kludne napiste aj sem na platforme, kto viete)

novi kolegovia:

  • projekt (asi EVS) sa rozbehol, 10 pozicii obdadenych, 3 su este volne -> hladaju sa zaujemci (opat, kludne piste aj sem na platorme, posunieme)
  • temy: datova analytika, architektura/modelovanie udajov, …
  • platova trieda: najvyssia

Zhrnutie cinnosti resp. stav Datovej kancelarie za 2020

Datova kvalita

robia sa pilotne merania datovej kvality (DQ) na X vybratych IS (vzdy jeden IS za jeden rezort)

  • pri kazdom merani sekunduje/spolupracuje aj Dat. kanc. UPVII
  • vysledky: do cca 2-3 mesiacov
  • feedback nateraz viazne

priebezne pribudaju hodnotiace spravy, vid https://datalab.digital/hodnotiace-spravy/

zistenia posluzia pri priprave noveho zakona o udajoch (tot aby zakon zohladnoval prax)

DQ suvisi s vyhlasovanim ref. udajov (tie musia byt kvalitne skor, nez sa vyhlasia)

Referencne udaje

vyhlasenie novych ref. udajov:

plan dalsieho vyhlasovania:

  • priorita: vybrane udaje z Katastra
  • udaje, ktore budu priebezne pribudat v CSRU
  • prijemcovia st. pomoci
  • nedoplatky: uz boli skoro spristupnene, ale kvoli korone existuju odsunute platby a kedze terminy sa posuvali a Soc. p. nestiha posudzovat, udaje maju “znizenu vierohodnost”, preto nateraz pozastavili export do CSRU a teda aj vyhlasovanie
  • info o ziakoch a studentoch

projekt datovej integracie meska

pozor pre dat. kuratorov: do roka po vyhlaseni ref. udajov treba spravit stotoznenie

  • t.j. teraz uz treba pracovat na stotoznovani fyz. adries voci RA!!!

specialna “vyzva”: ako vyhlasit aj vektorove data Katastra za referencne ked CSRU vektorove udaje nepodporuje?

  • vraj vyhlasit ref. udaje bez CSRU “sa neda”
  • debata o tomto bude na dalsom stretnuti

robi sa analyza procesov okolo zivotnej situacie narodenie dietata (pred porodom): zrejme prvy krat, kedy je cielom nie len preklopit papierove procesy na formulare, ale aj navrhnut proces optimalne, aj pre obcanov

  • neskor z toho (=procesu) maju byt aj data
  • v Nemecku riesili “iba” dane a este jednu agendu a trvalo im to 5 rokov
  • padol navrhli zriadit k tomuto specialnu PS
  • inak sme (ako clenovia PS) samozrejme radi, ze a) UPPVII toto riesi a b) ze nam o tom UPPVII povedalo

Zakladne ciselniky

novo vyhlasene:

  • cast obce
  • klasifikacia nehnutelnosti

(vid potom aj https://metais.vicepremier.gov.sk/codelists/publiclist?page=1&count=20&sorting[code]=desc )

tesne pred dokoncenim:

  • katalog odpadov

rozpracovane:

  • regulovane povolania,
  • ucel budovy

alokuju uz aj URI

vystupy pojdu na PS Ref. udaje a potom PS1

Zakon o udajoch

kvoli volbam a MPK dost prepracovali

pojde do MPK opat

ciatocne zasiahne aj el. schranky, obc. zakonnik, …

suvisi aj s GDPR, kedze UPVII / CSRU bude spracuvat vela dat

planovany termin ucinnosti: k 1.1.2021

  • PS dostane text o par tyzdnov, po schvaleni vedenim UPVII

v buducnosti by sucastou vyhlasky/zakona malo byt aj publikacne minimum pre statnu spravu

Otvorene udaje

publikacne minimum st. spravy: poslu navrh, do 2 tyzdnov

high-value datasets:

  • EC uzatvara konzultaciu

rebricky resp. uniestnenie SR v nich:

  • DESI, … - povacsinou sme na konci
  • co spravit, aby to malo pre obcanov zmysel a aj aby to pomohlo zlepsit umiestnenie?

opatovne sa mapuje “datovy inventar” (znamy aj ako “nulty dataset”, t.j. zoznam IS a udajov v nich), aby bol presny podklad pre dalsie debaty o tom zverejnovani

Open Data je vcelku vysadne spominane v prog. vyhlaseni Vlady

konkretny podnet: Covid-19 data z NCZI (per okres, s historiou)?

  • “zdovodnenie”, ze preco zatial nie je otvorene: data vraj “vlastni” niekto iny ako NCZI, atd., atd.
  • z medzinarodnych dat vieme o SR viac nez z *.gov.sk

El. schranky

k 1.6.2020 NASES aktivoval aj “pravnickym osobam, ktore nie su v obch. registri

  • formulacia vcelku zakerna, kedze stat vlastne nevie co presne su to a teda ani ktore presne su to (ake su vsetky typy organizacii, ktory typ organizacii je vedeny kde, atd.)
  • UPVII sa teda pustilo do patrania po udajoch a ich cistenia
    • cca 30 typov org.
    • X registrov je na MV SR, pricom integracia na RPO a nasledne NASES je vcelku OK
    • Y registrov ma Statisticku urad, …
    • vidno, ze kvalita dat je rozna

ovplyvnuje stav aktivacie schranok:

  • napr. zakonny zastupca v NASES: chyba informacia o statutaroch k cca 34k organizaciam

niekde su dokonca pravne problemy:

  • napr. statutar spolocenstva vlastnikov bytov: nezapisuje sa RC -> v NASES sa neda stotoznit -> riesia v novom zakone o udajoch

Stav projektov

Dat. kanc. mala byt v 5 projektoch

  • robi sa audit projektov, nie je zatial ani “stop” ani “go” (tyka sa 4 projektov v OPII)
  • EVS OpenData projekt nebude, kedze paniaze sli na Min. soc. veci na riesenie pandemie (ak som dobre pochopil)

dopytovky: vid na webe (asi https://www.vicepremier.gov.sk/projekty/projekty-esif/ )

  • 41 schvalene
  • dalsie? posudi sa po audite

pikoska na zaver: pri odchode sme poniektori letmo pozreli spravodajstvo a tam: “razia NAKA na Urade Vlady, UPVII a NASES” - update: je tu k tomu aj vlakno: NAKA v UV, UPVII a NASESe

3 Likes

Debatu teda mozem nacnut (aj) tu: Specificky teda ide napr. o vektorove udaje z Katastra (napr. obrysy parciel, okresov a pod.) a ja napr. problem vidim v tom, ze CSRU v tomto vystupuje ako “zbytocna komplikacia”:

  1. Uz dnes vieme (niektore) vektorove udaje Katastra spracuvat v GIS systemoch (napr. programe QGIS) vdaka tomu, ze su poskytovane cez INSPIRE sluzby (WMS, a pod.) T.j. vyhlasenie za referencne je skor len formalita, aby sa formalne mohlo zacat stotoznovanie a aby UGKK pripadne doladilo existujuce servisy (tam, kde nefunguju dost dobre resp. ak niektrore data este chybaju + pridanie metaudajov do RPI a data.gov.sk).

  2. Ak by vyhlasenie udajov za referencne bolo podmienene “implementaciou v CSRU”, tak by sme si (IMHO zbytocne) pripdavali pracu navyse ohladom specificky slovenskej implementaciu postavenej na uz existujucich nadnarodnych INSPIRE standardoch a implementaciach. Urcite by trvalo by dlhsie. A tazko povedat, ci by bolo lepsie. T.j. “pridana hodnota” je nejasna.

Zaroven “definicia” CSRU v zakone nevyzera byt uplne jasna, kedze je to pojem zastresujuci X systemov/modulov/… a teda je mozne, ze na CSRU sa s vyhlasovanim vobec cakat nemusi.

Poslal som na UPVII aj ako “quick win” (vid aj Výzva ÚPVII: Zber quick winov ) a pre istotu poznacil aj sem: Covid-19 udaje · Issue #12 · OpenDataSk/data-requests · GitHub

K casti Open Data uz prislo na review: Analýza zverejňovania datasetov ústredných orgánov štátnej správy na portáli otvorených dát 2020

Je vonku draft: Open Data Publikačné Minimum pre samosprávy

Pripomienky mozno pridavat k samotnemu dokumentu. Vopred vdaka.

Seva Peto. Bohuzial som na tom stretnuti nebol a az teraz som zachytil tieto poznamky. Isto to bude treba prediskutovat na tom dalsom stretnuti aj s kolegami z UGKK SR, lebo sme zaciatkom roku s kolegami z UPVII/MIRI brainstormovali moznosti a predbezny outlook bol, ze by sme pre geozdroje mali zabezpecit konsolidaciu cez Narodne projekty zamerane na podporu INSPIRE a tym aj podporu pre dataflow geozdrojov cez ISCRSU. Dovtedy by sa dali navrhnut aj docasne riesenia, ako napriklad rozsirenim sucasnych INSPIRE sluzieb pre temu I.6 Parcely katastra nehnuteľností aj o dalsie polozky tak ako to urobili kolegovia v CR.

1 Like

To znie koncepcne a rozumne. Slabou strankou je ale to, ze kedy to bude hotove a data/sluzby dostupne? Tipujem roky?

T.j. aby sme dalsie roky neboli na nule, tak ma zaujimaju aj tie “docasne riesenia”.

12.1.2021 sa konalo on-line stretnutie K9.4 . Par mojich poznamok:

uvod

plan vytvorit podskupiny:

  • otvorene udaje
  • referencne udaje
  • moja udaje (nove)
  • analyticke udaje (nove)
  • legislativa (obnovene)
  • datova kvalita
  • datovi kuratori (obnovene)

ak su novi zaujemci o vyssie uvedene (okrem “kuratori”), mozu sa hlasit

cinnost K9.4

Open Data

2020

publikacne minimum pripravene - vid MetaIS: MetaIS

prebehli stretnutia s dat. kuratormi

novy Open Data 2.0 projekt:

  • aktualny data.gov.sk vela naumoznuje
  • novy projekt ma dodat novy lepsi portal

ziadane datasety / high value datasets:

  • zdrziava “vybavovanie” (ci sa musi resp. moze zverejnovat a pod.)
  • zdrziava tiez “ako”, kedze od napr. “dajte Kataster” k “X datasetov s konkretnou strukturou” je vcelku dlha cesta

2021

spustit Open Data 2.0

  • otazka: interne MIRRI alebo VO?
    • odpoved: MIRRI zistuje, ci a ako vyuzit “Slovensko IT”
  • cielom je v novom rieseni co najviac vyuzit existujuci kod od EUDP
  • plan spustenia: ASAP, radovo najblizsie dni
  • otazka: personalne obsadenie? tot data.gov.sk aj praveze kopu veci vie a vedel, len nik v NASES nevedel inym PO poradit, co a ako pouzit => buduce personalne kapacity?
    • odpoved:
      • “teraz” (po zluceni MIRRI + NASES a posilneni Datovej kancenalrie na MIRRI) toto bude riesit tento team, teraz 4 ludia
      • EVS projekt nebude (peniaze slo na Covid), t.j. personal bude v rezii MIRRI, prislub je este na cca 5 ludi
      • plus MIRRI pri projektoch tlaci poziadavku na “15% vykonu internymi kapacitami”

semanticka interoperabilita

pokracovat v podpore publikovania najziadanejsich datasetov

  • k tomu sa pripoja “high value datats”, vid novu verziu PSI
  • o.i. aj pokracovanim v stretnutiach z org. VS s tym, ze Dat. kancelaria MIRRI realne pomoze s prvymi krokmi pri publikovani (analyza toho, co je, navrh uvodnych krokov a struktury a pod.)
  • MIRRI ma o.i. v plane zverejnit Java kod, ktory sluzi na konvertovanie dat z roznych formatov do “zverejnovacej formy”
  • MIRRI pripravi aj zoznam natrojov, ktore sa na zverejnovane a menezovanie zverejnovania pozuvaju resp. mozu pouzit
    • povacsinou pojde o existujuce a najma Open Source natroje pouzivane v EU

rebricky:

ziadane datasety / high value datasets

ETL:

  • napr. Ministerstvo hospodarstva: vsetko maju v XLS → treba ETL nastroje (aj) v data.gov.sk
  • p. Liska: MIRRI pomoze s katalogizaciou

p. Hajduch: CSRU je pred spustenim a mal by umoznovat stahovanie datasetov + nejake transformacie

  • Hanecak: presne take v bledo-ruzovom ma aj data.gov.sk (od 2016) → “vyzva” pre NKIVS 2021 a MIRRI, aby sa a) nerobilo N-krat to iste, b) sa vedelo co je urobene a c) boli ludia, ktori poskytnu support k nastrojom ktore mame naimplementovane, nech sa teda aj pouzivaju

referencne udaje

2020: Register Adries

2021: ZBGIS, informacie o zarucenej konverzii, udaje k potvrdeniam o navsteve skoly

p. Suja (MV SR): k RA:

  • PSC sa planuje vyhlasit za ref. udaj tohto roku
  • adresny bod sa planuje vyhlasit neskor
    • chyba este cca 10% adr. bodov, po doplneni zacnu vyhlasovanie

otazka: co je to referencny udaj?

  • vraciame sa k starym temam, ale teda s ohladom na nedavne vetovanie navrhu ohladom vyhlasenia ref. udajov si treba ujasnit, ktore udaje chceme referecne a ktore netreba (priority a pod.)
  • toto teda bude tema na cinnost pre 2021: ujasnit “co” a “preco” ohladom ref. udajov
  • p. Illek: ref. udaje nemaju byt o “G2G vymene vypisov” (=oversi.sk) a ale o “vymene udajov” (t.j. ktokolvek chce nieco referencovat ci validovat, ma pracovat priamo so zdroj. datami)
  • p. Illek: nadalej je nedorieseny vcelku zasadny problem “identifikator fyzickej osoby”

identifikator fyzickej osoby:

napr. MŠ SR bude potrebovat riesit “zakonny zastupcovia”:

  • typicky to je rodic, ale nie vzdy → citlivy ale dolezity problem/register
  • p. Illek:
    • legislativa existuje uz cca 5 rokov: register splnomocneni
    • MV SR ho ma realizovat
    • register este neexistuje

ciselniky

2020: MZP, UGKK

2021: dalsie ciselniky od UGKK, …

analyticke udaje

projekt Konsolidovana analyticka vrstva

zladenie projektu s pripravovanym Zakonom o udajoch

priprava koncepcie vyuzivania analytickych udajov vo verejnej sprave

  • navod, ako dobre vyuzivat udaje vo VS

Moje udaje

2020: priprava CIP/MOU

2021:

  • spustenie CIP/MOU
  • plan spristupnovania Moje udaje

koncepcne sa vzdy pocita so spristupnovanim aj pomocou Open API, aby aj 3rd party aplikacie (s povolenim uzivatela) mohli s danymi udajmi pracovat

principialne sa toto podoba na “prioritne datasety”, t.j. ze “niekto” musi povedat “toto su Moje udaje a budu sa poskytovat obcanom” + povedat “takto sa budu poskytovat”

datova kvalita

2020:

  • dost vela energie islo do riesenia problemov okolo aktivovania el. schranok: Dat. kancelaria riesila, kde su registre, v akom su stave, atd. tot aby NASES ako zriadovetel schranok mal relevatne udaje na zaklade ktorych zriaduje

2021:

  • skolenia pre kuratorov
  • doraz na ref. udaje
  • budovanie automtizovanych merani dat. kvality

p. Ilek + MZP: kvalita je dolezita, kedze a) nie je to uplne jasne (co a ako) a b) nizka kvalita negativne ovplyvnuje uzitok, ktory z dat je/moze byt

aktualne sa velmi intenzivne riesi RPO

  • najviac chyb je v samotnych zdrojovych registroch (RO, …)
  • cast chyb je len v RPO (=zle prevzate data zo zdroj. registrov)

legislativa

2020:

  • rozpracovany Zakon o udajoch
  • Zakon proti byrokracii

2021:

  • Zakon o udajoch + rozsirenia
    • nadalej ako “maly zakon”, kedze riesi iba statnu spravu a vynechava samospravu, firmy, atd.
  • Zakon proti byrokracii
  • Zakon e eGovernmente
  • implementacia EU regulacii: Open Data a PSI, FFoD, DGA

skolenia, komunita

skolenia, newsletter, diskusie na platofrma.slovensko.digital

hackathony s ohladom na pandemiu zatial pozastavene

Analiticka jednotka: planuju predstavit (videokonferencia a pod.) “KO” (asi som prepocul nazov)

ine

vacsina/vsetky OPII projekty maju byt spustane v najblizsich dnoch az tyzdnoch, kedze cely OPII ma jasny dead-line v 2023

projekty

Datova integracia:

  • CSRU
  • masivne zvysenie zapojenia organizacii

Centralna integracna platforma a Menezment osobnych udajov

  • realne obcanom spristupnit niekolko desiatok “datasetov”

Konsolidovana analyticka vrstva

Open Data 2.0

Centralna API menezment platforma

  • zatial caka, kvoli kapacitam Dat. kancelarie

k niektorym: uz bol riadiaci vybor => coskoro vypublikuju zapisy

NKIVS 2021

na toto nevyslo vela casu

ciele:

  • mat hotove do maja
  • mat koncepciu do 2030, s niekolkymi milnikmi (cca 2023, 2026 a 2030)

vychodiska:

  • ma to nadvazovat na NKIVS 2016
  • ma to vyhodnotit nesplnene ciele
  • ma to aktualizovat uz neaktualne veci

z komentarov:

  • v2021 pisu ludia, ktori neboli pri v2016 → zle
  • po NKIVS 2016 boli dopracuvane “strategicke dokumenty”, ktore NKIVS 2016 doplnili pripadne poopravili → treba s nimi pocitat do buducna
  • NKIVS 2008 ma lepsiu strukturu a citatelnost nez v2016 a v2021
  • ciele: mnohe z cielov v2008 a v2016 nadalej nie su splnene ale nadalej su dobre a relevantne → urcite nemame vymyslat nove + …
  • … ciele do r. 2030 urcite treba podlozit vyhodnotenim, ako boli plnene ciele v2016
  • v2021 sa ma naozaj vyrobit rezimom “doplnit a zrevidovat v2016”, nie prepisovat

otazka: co po NKIVS 2021? budu updaty strategickych dokumentov?

  • odpoved: predpoklada sa vytvorenie nadvazujucich ciastkovych kratkodobejsich planov

k NKIVS 2016 su pre data dva strategicke dokumenty:

otazka: datovy audit? datovy inventar, datovy katalog

  • Hanecak: toto by malo sluzit ako zaklad na zmysluplny KPI typu “z tohto su tieto high value → z high value chceme X% vypublikovanych ako Open Data”
    • tot aby sa to neratalo z “len nove projekty” ale naozaj “% zo vsetkych realne existujucich”
    • audit treba spravit aj kvoli kybernetickej bezpecnosti, aj kvoli GDPR, t.j. nie je to samoucelne
    • ref: vid Aktualizácia NKIVS 2021 - #14 by hanecak
  • odpoved: (som zial nezachytil do pisanych poznamok, aj ked som sa teda pytal → kto pamatate, doplnte prosim)
2 Likes

Takze zajtra (9.2.2021) bude stretnutie podskupiny Open Data. Program:

  1. Otvorené údaje a NKIVS (návrhy za DK)
  2. Projekt OD2.0 (DCAT-AP-SK)
  3. Publikačné minimum štátnej správy (problémy s centrálnymi ISVS, ktoré nepublikujú otvorené údaje - nedajú sa stiahnuť - crz.sk, …)
  4. Dátová inventarizácia
  5. Najžiadanejsie datasety
  6. Publikačné minimum samosprávy

Par mojich poznamok:

  • bolo nahravane, t.j. neskor bude zapis aj nahravka
  • prezentovalo najma MIRRI, bola aj mensia diskusia ku kazdemu s bodov

Stav open data v SR

velka mnozina dat je, ale tazko hlada: su zavesenie “niekde hlboko” na roznych weboch, chyba linka z data.gov.sk na data a pod.

mnoho dat je, ale tazko sa stahuju: neexistuje machine-readable forma → treba robit harvestery

mnoho dat je, ale tazko sa s nimi pracuje: komplikovana struktura, zle formaty datumov ci cisel, atd.

mnoho dat je, ale tazko sa zistuju aktualizacie: malokey su k dispozicii rozhrania, ktore vedia vratit uaje zodpovedajuce dopytu napr. “daj mi vsetko nove ci pozmenene za ostatny tyzden”

o.i. aj kvoli dezinformaciam je dnes naozaj kriticke spristupnovat udaje tak, aby sa dali najst lahko, pochopit lahko, pouzit lahko

“hviezdicky” (5* = cca RDF) v tomto kontexte su nadalej “riesene”, ale nie ako priorita, t.j.

  • v prvom rade ide o to, aby udaje vobec boli zverejnene (takmer akokolvek),
  • kvalita (a aj “hviezdicky”) sa bude doladovat dodatocne
  • 3* ( = cca CSV) su minimum

zlepsenie Open Data v SR sa o.i. bude odvijat od Open Data Maturity Index, kedze su tam dobre metriky a “tah” na realny uzitok

  • ak spravime dobre, mali by sme v rebricku poskocit resp. aspon ziskat lepsie skore
  • ale teda nmajma by mali vdaka tomu byt badatene vysledky

Slovensko.Digital (S.D): ciele pre Open Data su v zasade vcelku jasne, lebo zakon(-y) definguju, co zverejnene byt ma a co nie, tj. “len” treba plnit

  • pri tomto je dolezite robit (datovy) audit, aby z neho bolo zjavne, ako plnime

MV SR oprava: MS SR (spravodlivost): ma na data.gov.sk datasety, ale zatial neeviduju, ze by ich niekto pouzil resp. mal pripomienky → maju pocit, ze investovat do toho je plytvanie, ak teda nie je zaujem ci vyuzitie

MK SR: je to “oxymoron”, ak sa v pripade Open Data bavime o dokumentoch v proprietarnych formatoch → ak udaje nemaju specialny rezim (utajovane a pod.) tak ich treba rovno od zaciatku vytvarat v otvorenych formatoch, aby neskor mohli byt udaje lahko/lahsie vytiahnute a publikovane (ked vznikne na verejnosti dopyt a pod.)

  • tym sa naraza aj na pracovne pomocky na samotnom MIRRI, ktorymi sa o.i. riadia Open Data konkretne, alebo OPII/eGov celkovo: MIRRI bezne vytvara subory v proprietarnych formatoch → nasledne sa z dokumentov tazko vytazuju informacie a pod.

Projekt Open Data 2.0

SU (studia uskutocnitelnosti) je hotova uz davnejsie, dnes sa upresnuju detaily viazane na zaciatok realizacie

cielom nie je mat najslepsie riesnie na svete, ale dosiahnut realny posun vo veciach, ktore nas teraz brzdia (vid vyssie ciel vylepsit nase skore v “maturity index” a pod.)

CZ data portal za ostatne roky velmi pokrocil v klucovych funkcionalitach:

  • dopytovanie metadat
  • harvestovanie lokalnych portalov

konkretnejsie poziadavky budu skompletovane a zavesene niekam do cca tyzdna, budeme pripomienkovat

MZP, …:

  • volakedy sme robili prieskumy najziadanejsich datasetov a nedopadlo to velmi dobre
  • dnes zase mame od EU “high value datasets” a teda ak nechceme zpakovat tie “nie velmi dobre” vysledky, tak treba lepsie uchopit napr. datovy audit, aby bolo lahsie mapovat “prioritne okruhy” na konkretne datasety, z konktretnych ISVS od konkretnych OVM/PO
  • obdobne “publikacne minimum”

S.D: v Maturity index mame “portal features” nad EU priemer, naopak “impact” mame hlboko pod EU priemer

  • t.j. otazka: kolko casu/zdrojov bude MIRRI venovat OD portalu a kolko publikovaniu impaktovych/dolezitych datasetov?
  • navrh: mat financovanie 20:80, t.j. 20% = data.gov.sk a 80% = OVM/PO na datasety a API
  • vid potom to, ako vznika a vylepsuje sa opendata.bratislava.sk
  • implementovat univerzalne ETL zrejme nema zmysel (tot centralne ETL komponenty a pod.), vyplyva z dlhorocnych skusenosti nsprt. v S.D
    • je lahsie a lacnejsie robit “specialne ETL” pre ten ktory datovy zdroj

zrejme MV SR?: zaujimava myslienka lokalneho katalogu

  • OVM si jednoduchcie zmenezuje data vo vlastnom lokalnom katalogu
  • data.gov.sk zharvestuje lokalny katalog

Publikacne minimum statnej spravy

vid MetaIS

nateraz su tam konkretne priklady v XLS

  • presna schema, t.j. zoznam sltpcov, nazvy, formaty stlpcov
  • neskor vyrobia SW (bude Open Source, bude zvrejneny), ktory bude vyrabat ine formaty (CSV, RDF, …)
  • prva vlna = cierne polozky; druha vlna = sede polozky

teraz je priestor na pripomienky

  • o.i. aj jednotlive OVM/PO mozu “konfrontovat”, ci to, co maju, sa “zmesti” do navrhovanych struktur

ma to byt pomocka, vdaka ktorej:

  1. kto nieco publikuje, rovno ma navod ako
  2. kto nieco spracuva, aby vedel lahsie pochopit a pospajat ata

ak niekto povedzme info o zmluvach realizuje cez CRZ, tak sulad s minimom bude realne implementovat CRZ

Publikacne minimum samospravy

prezentovala Alvaria

NKIVS 2016 mala velke ciele do cca 2020, neplnia sa

  • o.i. preto, ze samosprava o Open Data stale takmer nevie
  • a ked vie, tak chyba prehlad: co, preco, ako, …

toto minimum ma napomoct, aby sa tie ciele plnili lahsie tym, ze okument poskytne informaciu otom, co a ako + voditka na sirsi kontext (legislativa, atd.)

dokument vznikal uz aj s pomocou obci a miest, specificky napr. kontrolorov

aby bolo jasne “co a ako”, dokument zacina uz aj mapovanim, ake vsetky povinnosti samosprava ma v kontexte eGov a Open Data

  • vsetko su to exitujuce povinnosti, nie nove, t.j. publ. minimum neprinasa nove povinnosti, len pomaha lepsie sumarizovat existujuce

plus “sprava” z PS Samosprava: okrem “digitalizacie” a “publikovania” sa urcite treba pozriet aj celkovo na optimalizacie procesov a agiend

  • ak sa vyoptimalizuje agenda, ulahci sa jej digitalizacia a budu sa aj lahsie publikovat udaje

pocas lock-down sa lepsie ukazuje, kde vsade a ako by vedeli pomoct zverejnene udaje

dolezity atribut: data su pomenovane aj terminmy, ktore su pouzite v legislative, aby tomu rozumeli nie len obcania, ale aj uradnici

  • pomocka pri intepretacii legislativy

Najziadanejsie datasety

zoznam je priebezne aktualizovany, vid Prieskum najžiadanejších datasetov - B.8 + B.15 - Google Tabellen

opat bude dalsie kolo konzultacie s verejnostou, v spolupraci s USV ROS

  • vysledky ocakavane najneskor 15.3.2021

Ine

Hanecak (a.k.a. “ja”), navrh konkretnej temy na dalsie stretnutie: velmi dosledne podchytit temu datoveho auditu, lebo:

  • chceme oznacit dolezite datasety, ale opakovane obcania hovoria, ze najprv musime vediet, z coho sa da vyberat; tot aby sme neziadali “hluposti” ci “nemozne” resp. “nesli naslepo”
  • chceme mat v NKIS relevatne KPI, tie teda treba opriet o realny zoznam “toho co mame” aby sme si potom mohli presnejsie povedat “z tohto cheme zvrejenit toto” a na tom aj postavit KPI
  • mame tu zaroven od cca 2016 X kol datovych auditov a planov zverejnovania, ktore az tak dobre nedopadli, o.i. lebo 1) aj tak sa malo publikuje a 2) je z toho “guca” XLS (vid teda aj poznamku od MK ohladom udrziavania inforamcii v uzavretych formatoch)
  • mame tu GDPR, a teda ak mame chranit osobne udaje, musime vediet kde a ake mame → datovy audit
  • make tu kyberneticku bezpecnost a (opat) ak mame chranit udaje (a systemy), musime vediet kde a ake citlive data mame → datovy audit

S.D: lepsie zapisy so stretnuti s OVM/PO, aby sa lepsie dalo dodatocne kontrolovat, ci a ako sa plnia dohody zo stretnuti

  • netreba podrobnejsie a urcite nie “dlhsie”, treba najma dobre podchytit konkretne dolezite veci, teda ktore datasety, kedy, kto

?: otazka/podnet k prieskumom ziadanych datasetov: lepsie povedat, co je chcene

  • priklad: Zoznam execkucii - naozaj vsetko? lebo tam su osobne udaje
  • ja: z pohladu komunity tento komentar trafil “bezny zadrhel” pri mnohych doteraisich dopytoch, spojene s tym, ze operujeme zvycajne iba s nazvom systemu ci datasetu, ale nepozname strukturu
    • navrhujem teda k dopytom pripajat aj informaciu o strukture (=zoznam stlpcov), aby sme mali podklad na lepsiu a presnejsiu definiciu toho, co je ziadane
    • typicky ak vopred vieme, ze su v systeme (povedzme zoznsm exekucii) rodne cisla, tak ich rovno nebudeme chciet (alebo budeme, citujuc specificky poziadavku verejneho zaujmi alebo legislativu)
    • naopak, ak nevieme, povieme “vsetko” a nasledne riskujeme “zakopovu vojnu”, lebo OVM/PO sa bude snazit ochranit rodne cisla tym, ze nic neda → problem
2 Likes

Oh classic. Register adries uz funguje?

2 Likes

MV SR: ma na data.gov.sk datasety, ale zatial neeviduju, ze by ich niekto pouzil resp. mal pripomienky → maju pocit, ze investovat do toho je plytvanie, ak teda nie je zaujem ci vyuzitie

To bol preklep. Namiesto MV SR by malo byt MS SR (Ministerstvo spravodlivosti).

2 Likes

Vdaka, opravujem.

Nový level, tuto je zvukový záznam z PS:

2 Likes

8.4. sa konalo stretnutie/call v podskupine “Open Data”. Kedze on-line a “novy level” (ako spomina Lubor vyssie), tak neskor by mal byt zaznam aj z tohto. Medzicasom par mojich viac ci menej surodych poznamok:

Celková architektúra (ekosystém) otvorených údajov

zakladne pojmy:

  • katalog, dataset, distribucia

priklady:

aktualny stav: Open Data 1.0

  • data (presnejsie: udaje o tom, kde su data = metadata) mame rozbite: nieco na data.gov.sk, nieco na crz.gov.sk, nieco na opendata.bratislava.sk, atd.
  • metadata mame nie uplne dobre (vid tie priklady vyssie)

chceny buduci stav: Open Data 2.0

  • data.gov.sk bude harvestovat metadata z ostanych katalogov/portalov aby …
  • … clovek/pouzivatel/obcan mohol na data.gov.sk najst vsetko …
  • … nech uz su data fyzicky umiestnene/zverejnene kdekolvek
  • metadata budu zaroven lepsie (harmonizovane, kvalitnejsie)
  • t.j. crz.gov.sk, atd. nadalej budu existovat a zverejnovat data, ale teda “po novom” budu data najditelne aj na data.gov.sk (a vdaka nemu aj na EUDP)

Dopytová výzva Manažment údajov

pripravuje sa nova vyzva, ktora ma napomoct mensim rieseniam/subjektom

  • scope: zverejnovanie Open Data, analyticke data, integraciew na CSRU, …
  • o.i. teda aj na pridanie API do vlastnych katalogov/portalov, cez ktore bude neskor data.gov.sk harvestovat metaudaje

vyzva pre OVM/PO: ozvat sa MIRRI, ze asi aky scope ma OVM/PO v plane a v akej sume; tot aby MIRRI spravne nastavilo limity pre “male/mensie projekty”

  • aby sa teda nestalo, ze subjekty potrebuju radovo povedzeme 100k€ ale min. limit vo vyzve by bol 500k€

neskor bude pripraveny aj vzorovy projekt, aby tym MIRRI ulahcilo podavanie ziadosti

Q&A: spodny limit na prokjekty?: vezmime priklad “mesto: dorobime API, aby data.gov.sk mohol harvestovat” → vec za radovo tisice EUR (ak uz mesto nejaky katalog ma)

  • extrem jedna: vela malych projektov → strasne vela byrokracie, ktoru MIRRI nezvladne
  • extrem dva: par velkych projektov → mnoho miest sa nekvalifikuju, zopar ano ale len velkym nafuknutim projektov → vysledky nebudu velmi zodpovedat ocakavaniam
  • mozne riesenie: patnersky projekt, kde povedzme MIRRI spravi jeden projekt a X miest by ako partneri dostali mensie ciastky
  • preco nizky limit, pre ilustraciu: uz cca 4 roky dozadu napr. SU pre data z RPO vycislil naklady na cca 30k€
  • zaroven je chcena aj co najnizsia byrokracia, napr. kvoli samosprave

Q&A: SAP ci ine velke existujuce systemy?

  • moze zastresit povedzme MIRRI, aby sme sa vyhli tomu, ze to iste API bude nekoordiovane obstaravat X OVM od toho isteho dodavatela?

Q&A: financovanie zberu dat?

  • lebo mat katalog a datove ulozisko je fajn, ale castokrat je drahe mat v nom zmysluplne data resp. jezbytocne mat ho prazdny rsp. naplneny nepotrebnymi udajmi
  • zatial nejasne

Publikačné minimum

Publikačné minimum štátnej správy

finalne, vid MetaIS

  • aktualny oficialny stav: “pred zavedenim”

hlavnym cielom standardu je zladit:

  • co sa zverejnuje: temy, datasety
  • ako sa zverejnuje: formaty a struktura

vsetko z publ. minima su datasety a teda maju byt neskor okrem zverejnenia aj evidovane v dat. katalogu data.gov.sk

  • t.j. nie je to nejaky “separatny vesmir” ktory sa katalogizuje ci vykazuje separatne

Q&A: ak PO vyplublikuje povedzme CSV podla tohto standardu, bude neskor k dispozicii nastroj ci sluzba, ktora z toho vyrobi JSON ci RDF?

  • planuje sa tvorba Open Source natroja presne na toto

Q&A: semantika / slovniky, a.k.a. konzistentne pomenuvanie stlpcekov?

  • ano, dolezite, je to v merku
  • bude dolezite aj neskor pri generovani RDF, kedy sa pouziju “pojmy” rovno z centralneho modelu udajov

Publikačné minimum MIRRI

MIRRI aktualne podla vyssie spomenuteho minima pracuje na publikovani svojich datasetov, ktore tym padom posluzia pre tento standard aj ako spravna ukazka

Publikačné minimum samosprávy

vid MetaIS

  • aktualny oficialny stav: zaciatok pripomienkovania

zakladom je navrh od Alvaria, vid Návrh Open Data Publikačného Minima pre samosprávy: Zapojte sa do diskusie. | Alvaria - občianske združenie

Zákon o údajoch a otvorené údaje

nadalej “work in progress”

o.i. sa aktualne pracuje aj na ujasneni povinnosti zverejnovat, tot aby bolo jasne ze crz.gov.sk, atd. ma tiez poskytovat Open Data

Stav projektu Centrálny portál otvorených údajov 2.0

kompletuju fukncne aj nefunkncne poziadavky od verejnosti

skratenie casoveho harmonogramu: 40 → 30 mesiacov, kedze 2023/12 musi byt koniec

uprava rozpoctu: aby bolo minimalne 15% internych kapacit

verejne obstaravanie by malo byt typu “in house”

  • vyhlasenie este len bude

posudenie UHP (kedze je to nad 1M€): jedno uz bolo, ale UHP si vyziadalo opat

formality by mali byt hotove do 2021/06

Špeciálny hosť: Pavol Škápik - Otvorené údaje mesta Bratislavy

hlavny rozdiel oproti inym: nie len “data Bratislavy (vlastnene/spravovane mestom)” ale aj “data o Bratislave (kludne od inych, napr. od SU, len teda podmnozina k BA)”

este pred spustenim portalu:

  • vypracovali smernicu: co a ako s datami, …

inkrementalny postup: katalog, smernica, datasety, … sa pridavaju, vylepsuju, … priebezne

obstaravanie kapacit na spravu a podporu existujucich Open Source riesni (napr. CKAN) vnimane ako komplikovane (v kontexte SR, ale napr. aj CR - referencia z Brna), preto nakoniec zvolili “in-house development”

neskor pribudlo:

  • vizualizacia dat cez PowerBI
    • dovod: ludia chceli vizuzaliacie a PowerBI cena je radovo 8€/mesiac
  • zdrojove kody na GitHub - magistrat-bratislava/opendata
  • preklad do ENG, kedze na zaklade statistik navstevnosti eviduju zaujem zo zahranicia

portal (a data) sluzi nie len verejnosti ale aj interne Magistratu

covid-19 dashboard:

  • najrpv postaveny na rucnom prepisovani udajov zo statnych portalov
  • dnes uz takmer plne automatizovane

prioritizuju zverejnnovanie tych udajov, po ktorych eviduju dopyt

v plane je novy geoportal specificky pre geo-data, na baze existujuceho interneho GIS systemu

naklady na portal doteraz: 20k€, vacsinou mzdove naklady na internych ludi

navstevnost: cca 300k/rocne (nerataju sa dopyty na API)

zaujimave datasety:

  • “vitaz”: hlasovania poslancov
  • cestovne poriadky
  • cykloscitace

v priprave:

  • on-line data z MHD, do cca 2-3 tyzdnov
  • dalsie cykloscitace
  • scitace dopravy
  • kvalita ovzdusia
  • odpad

Q&A: dataset register adries BA vs. register adries narodny?

  • organizacia datasetu BA tak, aby s nim vedeli robit aj menej zdatni uzivatelia
    • lebo eviduju dopyty z Magistratu ci mestskych casti, ze nevedia pracovat s datami z narodneho datasetu
  • je “vyrobeny” z narodneho datasetu

Q&A: ma Magistrat “povolenie” povedzme od SU na prepouzivanie dat?

  • nema, netreba, lebo su to “otvorene udaje”
  • poznamka od zastupcu SU: nemaju namietky, naopak sa tesia, lebo o to pri zverejnovani ide: aby sa udaje prepouzivali a posuvali dalej

BA aj SU a par dalsich hlada riesnie, ako mat prehlad o vyuzivani/pristupoch na API


p.s.: Medzi aprilom a februarom boli este aj ine veci, ale tie som nestihal, t.j. ak sa k tomu dostanem, podopisujem sem neskor.

toto je v zasade konzistetne s “neskorsim vyvojom” (= po tom, ako sme nieco take definovali v nasich standardoch), obdobne pnali napr. v CR: “Základním pravidlem je, že pokud má datová sada více distribucí, liší se pouze formou, nikoliv obsahem” - Špatné dělení dat do distribucí datové sady - Otevřená data

V (opat) CR maju uz dlhsie zavedene pojmy NOKD (=narodny open data katalog) a LKOD (=lokany open data katalog) a k LKOD maju o.i. toto: Zprovoznění lokálního katalogu otevřených dat a jeho registrace v NKOD - Otevřená data (do obrazku sa da klikat … pisem, lebo mna nenapadlo :slight_smile: )

Veľmi jednoduché na používanie je
https://data.gov.sk/dataset/adresy-podla-krajov
alebo čerstvejšie dáta na
http://proxy.freemap.sk/minvskaddress/adresy.zip

1 Like

Pri datach z RA bolo zdovodnenie, ze teda povedzme ludia z bratislavskych mestkych casti nevedia, co s velkymi subormi ci API-nami v Exceli. Ja napr. ten 300MB CSV (z adresy.zip) dam, API na data.gov.sk tiez, ale oni vraj nie. Natiska sa potom otazka, ze pre aku “cielovku” sa ten ktory dataset robi. To by som odbil navratom do minulych debat, ze:

  1. stat nech hlavne da kompletne, aktualne a co najspolahlivejsie data, v otvorenom formate, up-to-date, za primerane peniaze a
  2. vsetky tie rozne dalsie use-cases moze osetrit “trh” = ekosystem firiem, neziskoviek a obcanov, ktori z tych statnych dat vyrobia odvodeniny na osetrenie konkretnych potrieb (chcete to v XLS, nie CSV? chcete to nasekane len pre vas kraj ci mesto? chcete to spojene s ujadmi o lesoch od MZP? …?)

A ono sa to v zasade deje, kedze:

  1. samotny stat napr. v pripade uvedeneho RA dava k dispozicii viacero foriem/odvodenin (CSV, API, kompletky, inkrementy, …),
  2. dalsie odvodeniny vytvara napr. Magistrat BA pre “seba, svojich ale aj inych”,
  3. zapajaju sa aj neziskovky (vid teda pre RA ten uvedeny proxy.freemap.sk alebo napr. pre RPO ekosystem.slovensko.digital) a
  4. nieco urcite riesia a poskytuju aj sukromne firmy (viem napr. o tom, ze Here do svojich produktov zakomponuva napr. adresy priamo z Presovskych datasetov alebo povedzme Finstat poskytuje dalej nie len vylepsene data, ale rovno sluzby/pridanu hodnotu nad nimi).