MIRRI Pracovná skupina K9.4 Lepšie dáta

8.4. sa konalo stretnutie/call v podskupine “Open Data”. Kedze on-line a “novy level” (ako spomina Lubor vyssie), tak neskor by mal byt zaznam aj z tohto. Medzicasom par mojich viac ci menej surodych poznamok:

Celková architektúra (ekosystém) otvorených údajov

zakladne pojmy:

  • katalog, dataset, distribucia

priklady:

aktualny stav: Open Data 1.0

  • data (presnejsie: udaje o tom, kde su data = metadata) mame rozbite: nieco na data.gov.sk, nieco na crz.gov.sk, nieco na opendata.bratislava.sk, atd.
  • metadata mame nie uplne dobre (vid tie priklady vyssie)

chceny buduci stav: Open Data 2.0

  • data.gov.sk bude harvestovat metadata z ostanych katalogov/portalov aby …
  • … clovek/pouzivatel/obcan mohol na data.gov.sk najst vsetko …
  • … nech uz su data fyzicky umiestnene/zverejnene kdekolvek
  • metadata budu zaroven lepsie (harmonizovane, kvalitnejsie)
  • t.j. crz.gov.sk, atd. nadalej budu existovat a zverejnovat data, ale teda “po novom” budu data najditelne aj na data.gov.sk (a vdaka nemu aj na EUDP)

Dopytová výzva Manažment údajov

pripravuje sa nova vyzva, ktora ma napomoct mensim rieseniam/subjektom

  • scope: zverejnovanie Open Data, analyticke data, integraciew na CSRU, …
  • o.i. teda aj na pridanie API do vlastnych katalogov/portalov, cez ktore bude neskor data.gov.sk harvestovat metaudaje

vyzva pre OVM/PO: ozvat sa MIRRI, ze asi aky scope ma OVM/PO v plane a v akej sume; tot aby MIRRI spravne nastavilo limity pre “male/mensie projekty”

  • aby sa teda nestalo, ze subjekty potrebuju radovo povedzeme 100k€ ale min. limit vo vyzve by bol 500k€

neskor bude pripraveny aj vzorovy projekt, aby tym MIRRI ulahcilo podavanie ziadosti

Q&A: spodny limit na prokjekty?: vezmime priklad “mesto: dorobime API, aby data.gov.sk mohol harvestovat” → vec za radovo tisice EUR (ak uz mesto nejaky katalog ma)

  • extrem jedna: vela malych projektov → strasne vela byrokracie, ktoru MIRRI nezvladne
  • extrem dva: par velkych projektov → mnoho miest sa nekvalifikuju, zopar ano ale len velkym nafuknutim projektov → vysledky nebudu velmi zodpovedat ocakavaniam
  • mozne riesenie: patnersky projekt, kde povedzme MIRRI spravi jeden projekt a X miest by ako partneri dostali mensie ciastky
  • preco nizky limit, pre ilustraciu: uz cca 4 roky dozadu napr. SU pre data z RPO vycislil naklady na cca 30k€
  • zaroven je chcena aj co najnizsia byrokracia, napr. kvoli samosprave

Q&A: SAP ci ine velke existujuce systemy?

  • moze zastresit povedzme MIRRI, aby sme sa vyhli tomu, ze to iste API bude nekoordiovane obstaravat X OVM od toho isteho dodavatela?

Q&A: financovanie zberu dat?

  • lebo mat katalog a datove ulozisko je fajn, ale castokrat je drahe mat v nom zmysluplne data resp. jezbytocne mat ho prazdny rsp. naplneny nepotrebnymi udajmi
  • zatial nejasne

Publikačné minimum

Publikačné minimum štátnej správy

finalne, vid MetaIS

  • aktualny oficialny stav: “pred zavedenim”

hlavnym cielom standardu je zladit:

  • co sa zverejnuje: temy, datasety
  • ako sa zverejnuje: formaty a struktura

vsetko z publ. minima su datasety a teda maju byt neskor okrem zverejnenia aj evidovane v dat. katalogu data.gov.sk

  • t.j. nie je to nejaky “separatny vesmir” ktory sa katalogizuje ci vykazuje separatne

Q&A: ak PO vyplublikuje povedzme CSV podla tohto standardu, bude neskor k dispozicii nastroj ci sluzba, ktora z toho vyrobi JSON ci RDF?

  • planuje sa tvorba Open Source natroja presne na toto

Q&A: semantika / slovniky, a.k.a. konzistentne pomenuvanie stlpcekov?

  • ano, dolezite, je to v merku
  • bude dolezite aj neskor pri generovani RDF, kedy sa pouziju “pojmy” rovno z centralneho modelu udajov

Publikačné minimum MIRRI

MIRRI aktualne podla vyssie spomenuteho minima pracuje na publikovani svojich datasetov, ktore tym padom posluzia pre tento standard aj ako spravna ukazka

Publikačné minimum samosprávy

vid MetaIS

  • aktualny oficialny stav: zaciatok pripomienkovania

zakladom je navrh od Alvaria, vid Návrh Open Data Publikačného Minima pre samosprávy: Zapojte sa do diskusie. | Alvaria - občianske združenie

Zákon o údajoch a otvorené údaje

nadalej “work in progress”

o.i. sa aktualne pracuje aj na ujasneni povinnosti zverejnovat, tot aby bolo jasne ze crz.gov.sk, atd. ma tiez poskytovat Open Data

Stav projektu Centrálny portál otvorených údajov 2.0

kompletuju fukncne aj nefunkncne poziadavky od verejnosti

skratenie casoveho harmonogramu: 40 → 30 mesiacov, kedze 2023/12 musi byt koniec

uprava rozpoctu: aby bolo minimalne 15% internych kapacit

verejne obstaravanie by malo byt typu “in house”

  • vyhlasenie este len bude

posudenie UHP (kedze je to nad 1M€): jedno uz bolo, ale UHP si vyziadalo opat

formality by mali byt hotove do 2021/06

Špeciálny hosť: Pavol Škápik - Otvorené údaje mesta Bratislavy

hlavny rozdiel oproti inym: nie len “data Bratislavy (vlastnene/spravovane mestom)” ale aj “data o Bratislave (kludne od inych, napr. od SU, len teda podmnozina k BA)”

este pred spustenim portalu:

  • vypracovali smernicu: co a ako s datami, …

inkrementalny postup: katalog, smernica, datasety, … sa pridavaju, vylepsuju, … priebezne

obstaravanie kapacit na spravu a podporu existujucich Open Source riesni (napr. CKAN) vnimane ako komplikovane (v kontexte SR, ale napr. aj CR - referencia z Brna), preto nakoniec zvolili “in-house development”

neskor pribudlo:

  • vizualizacia dat cez PowerBI
    • dovod: ludia chceli vizuzaliacie a PowerBI cena je radovo 8€/mesiac
  • zdrojove kody na GitHub - magistrat-bratislava/opendata
  • preklad do ENG, kedze na zaklade statistik navstevnosti eviduju zaujem zo zahranicia

portal (a data) sluzi nie len verejnosti ale aj interne Magistratu

covid-19 dashboard:

  • najrpv postaveny na rucnom prepisovani udajov zo statnych portalov
  • dnes uz takmer plne automatizovane

prioritizuju zverejnnovanie tych udajov, po ktorych eviduju dopyt

v plane je novy geoportal specificky pre geo-data, na baze existujuceho interneho GIS systemu

naklady na portal doteraz: 20k€, vacsinou mzdove naklady na internych ludi

navstevnost: cca 300k/rocne (nerataju sa dopyty na API)

zaujimave datasety:

  • “vitaz”: hlasovania poslancov
  • cestovne poriadky
  • cykloscitace

v priprave:

  • on-line data z MHD, do cca 2-3 tyzdnov
  • dalsie cykloscitace
  • scitace dopravy
  • kvalita ovzdusia
  • odpad

Q&A: dataset register adries BA vs. register adries narodny?

  • organizacia datasetu BA tak, aby s nim vedeli robit aj menej zdatni uzivatelia
    • lebo eviduju dopyty z Magistratu ci mestskych casti, ze nevedia pracovat s datami z narodneho datasetu
  • je “vyrobeny” z narodneho datasetu

Q&A: ma Magistrat “povolenie” povedzme od SU na prepouzivanie dat?

  • nema, netreba, lebo su to “otvorene udaje”
  • poznamka od zastupcu SU: nemaju namietky, naopak sa tesia, lebo o to pri zverejnovani ide: aby sa udaje prepouzivali a posuvali dalej

BA aj SU a par dalsich hlada riesnie, ako mat prehlad o vyuzivani/pristupoch na API


p.s.: Medzi aprilom a februarom boli este aj ine veci, ale tie som nestihal, t.j. ak sa k tomu dostanem, podopisujem sem neskor.