8.4. sa konalo stretnutie/call v podskupine “Open Data”. Kedze on-line a “novy level” (ako spomina Lubor vyssie), tak neskor by mal byt zaznam aj z tohto. Medzicasom par mojich viac ci menej surodych poznamok:
Celková architektúra (ekosystém) otvorených údajov
zakladne pojmy:
- katalog, dataset, distribucia
priklady:
- dobre: Zoznam členov samosprávy mesta Prešov (od 15.12.2010 do aktuálneho dátumu) - Datasety -data.gov.sk
- lebo distribucie predstavuju ten isty obsah (data), len v inom formate
- nespravne: https://data.gov.sk/dataset/faktury-za-tovary-a-sluzby-ruvz-cadca
- lebo distribucie su datasetmi, a teda dany datraset je akoby katalog
- spravne by bolo evidovat dany dataset ako X datasetov
aktualny stav: Open Data 1.0
- data (presnejsie: udaje o tom, kde su data = metadata) mame rozbite: nieco na data.gov.sk, nieco na crz.gov.sk, nieco na opendata.bratislava.sk, atd.
- metadata mame nie uplne dobre (vid tie priklady vyssie)
chceny buduci stav: Open Data 2.0
- data.gov.sk bude harvestovat metadata z ostanych katalogov/portalov aby …
- … clovek/pouzivatel/obcan mohol na data.gov.sk najst vsetko …
- … nech uz su data fyzicky umiestnene/zverejnene kdekolvek
- metadata budu zaroven lepsie (harmonizovane, kvalitnejsie)
- t.j. crz.gov.sk, atd. nadalej budu existovat a zverejnovat data, ale teda “po novom” budu data najditelne aj na data.gov.sk (a vdaka nemu aj na EUDP)
Dopytová výzva Manažment údajov
pripravuje sa nova vyzva, ktora ma napomoct mensim rieseniam/subjektom
- scope: zverejnovanie Open Data, analyticke data, integraciew na CSRU, …
- o.i. teda aj na pridanie API do vlastnych katalogov/portalov, cez ktore bude neskor data.gov.sk harvestovat metaudaje
vyzva pre OVM/PO: ozvat sa MIRRI, ze asi aky scope ma OVM/PO v plane a v akej sume; tot aby MIRRI spravne nastavilo limity pre “male/mensie projekty”
- aby sa teda nestalo, ze subjekty potrebuju radovo povedzeme 100k€ ale min. limit vo vyzve by bol 500k€
neskor bude pripraveny aj vzorovy projekt, aby tym MIRRI ulahcilo podavanie ziadosti
Q&A: spodny limit na prokjekty?: vezmime priklad “mesto: dorobime API, aby data.gov.sk mohol harvestovat” → vec za radovo tisice EUR (ak uz mesto nejaky katalog ma)
- extrem jedna: vela malych projektov → strasne vela byrokracie, ktoru MIRRI nezvladne
- extrem dva: par velkych projektov → mnoho miest sa nekvalifikuju, zopar ano ale len velkym nafuknutim projektov → vysledky nebudu velmi zodpovedat ocakavaniam
- mozne riesenie: patnersky projekt, kde povedzme MIRRI spravi jeden projekt a X miest by ako partneri dostali mensie ciastky
- preco nizky limit, pre ilustraciu: uz cca 4 roky dozadu napr. SU pre data z RPO vycislil naklady na cca 30k€
- zaroven je chcena aj co najnizsia byrokracia, napr. kvoli samosprave
Q&A: SAP ci ine velke existujuce systemy?
- moze zastresit povedzme MIRRI, aby sme sa vyhli tomu, ze to iste API bude nekoordiovane obstaravat X OVM od toho isteho dodavatela?
Q&A: financovanie zberu dat?
- lebo mat katalog a datove ulozisko je fajn, ale castokrat je drahe mat v nom zmysluplne data resp. jezbytocne mat ho prazdny rsp. naplneny nepotrebnymi udajmi
- zatial nejasne
Publikačné minimum
Publikačné minimum štátnej správy
finalne, vid MetaIS
- aktualny oficialny stav: “pred zavedenim”
hlavnym cielom standardu je zladit:
- co sa zverejnuje: temy, datasety
- ako sa zverejnuje: formaty a struktura
vsetko z publ. minima su datasety a teda maju byt neskor okrem zverejnenia aj evidovane v dat. katalogu data.gov.sk
- t.j. nie je to nejaky “separatny vesmir” ktory sa katalogizuje ci vykazuje separatne
Q&A: ak PO vyplublikuje povedzme CSV podla tohto standardu, bude neskor k dispozicii nastroj ci sluzba, ktora z toho vyrobi JSON ci RDF?
- planuje sa tvorba Open Source natroja presne na toto
Q&A: semantika / slovniky, a.k.a. konzistentne pomenuvanie stlpcekov?
- ano, dolezite, je to v merku
- bude dolezite aj neskor pri generovani RDF, kedy sa pouziju “pojmy” rovno z centralneho modelu udajov
Publikačné minimum MIRRI
MIRRI aktualne podla vyssie spomenuteho minima pracuje na publikovani svojich datasetov, ktore tym padom posluzia pre tento standard aj ako spravna ukazka
Publikačné minimum samosprávy
vid MetaIS
- aktualny oficialny stav: zaciatok pripomienkovania
zakladom je navrh od Alvaria, vid Návrh Open Data Publikačného Minima pre samosprávy: Zapojte sa do diskusie. | Alvaria - občianske združenie
Zákon o údajoch a otvorené údaje
nadalej “work in progress”
o.i. sa aktualne pracuje aj na ujasneni povinnosti zverejnovat, tot aby bolo jasne ze crz.gov.sk, atd. ma tiez poskytovat Open Data
Stav projektu Centrálny portál otvorených údajov 2.0
kompletuju fukncne aj nefunkncne poziadavky od verejnosti
skratenie casoveho harmonogramu: 40 → 30 mesiacov, kedze 2023/12 musi byt koniec
uprava rozpoctu: aby bolo minimalne 15% internych kapacit
verejne obstaravanie by malo byt typu “in house”
- vyhlasenie este len bude
posudenie UHP (kedze je to nad 1M€): jedno uz bolo, ale UHP si vyziadalo opat
formality by mali byt hotove do 2021/06
Špeciálny hosť: Pavol Škápik - Otvorené údaje mesta Bratislavy
hlavny rozdiel oproti inym: nie len “data Bratislavy (vlastnene/spravovane mestom)” ale aj “data o Bratislave (kludne od inych, napr. od SU, len teda podmnozina k BA)”
este pred spustenim portalu:
- vypracovali smernicu: co a ako s datami, …
inkrementalny postup: katalog, smernica, datasety, … sa pridavaju, vylepsuju, … priebezne
obstaravanie kapacit na spravu a podporu existujucich Open Source riesni (napr. CKAN) vnimane ako komplikovane (v kontexte SR, ale napr. aj CR - referencia z Brna), preto nakoniec zvolili “in-house development”
neskor pribudlo:
- vizualizacia dat cez PowerBI
- dovod: ludia chceli vizuzaliacie a PowerBI cena je radovo 8€/mesiac
- zdrojove kody na GitHub - magistrat-bratislava/opendata
- preklad do ENG, kedze na zaklade statistik navstevnosti eviduju zaujem zo zahranicia
- …
portal (a data) sluzi nie len verejnosti ale aj interne Magistratu
covid-19 dashboard:
- najrpv postaveny na rucnom prepisovani udajov zo statnych portalov
- dnes uz takmer plne automatizovane
prioritizuju zverejnnovanie tych udajov, po ktorych eviduju dopyt
v plane je novy geoportal specificky pre geo-data, na baze existujuceho interneho GIS systemu
naklady na portal doteraz: 20k€, vacsinou mzdove naklady na internych ludi
navstevnost: cca 300k/rocne (nerataju sa dopyty na API)
zaujimave datasety:
- “vitaz”: hlasovania poslancov
- cestovne poriadky
- cykloscitace
- …
v priprave:
- on-line data z MHD, do cca 2-3 tyzdnov
- dalsie cykloscitace
- scitace dopravy
- kvalita ovzdusia
- odpad
Q&A: dataset register adries BA vs. register adries narodny?
- organizacia datasetu BA tak, aby s nim vedeli robit aj menej zdatni uzivatelia
- lebo eviduju dopyty z Magistratu ci mestskych casti, ze nevedia pracovat s datami z narodneho datasetu
- je “vyrobeny” z narodneho datasetu
Q&A: ma Magistrat “povolenie” povedzme od SU na prepouzivanie dat?
- nema, netreba, lebo su to “otvorene udaje”
- poznamka od zastupcu SU: nemaju namietky, naopak sa tesia, lebo o to pri zverejnovani ide: aby sa udaje prepouzivali a posuvali dalej
BA aj SU a par dalsich hlada riesnie, ako mat prehlad o vyuzivani/pristupoch na API
p.s.: Medzi aprilom a februarom boli este aj ine veci, ale tie som nestihal, t.j. ak sa k tomu dostanem, podopisujem sem neskor.