Denník NP OpenData 2.0

RomanaVargova · March 3, 2023, 7:14am

Dobrý deň, prepáčte, píšem po termíne a už zrejme ani nebudete mať možné zapracovať zmeny - no pre budúcnosť - dokument Plán testov je veľmi povrchný, viac menej obsahuje len veci, ktoré uviedla MIRRI ako návrh na obsah dokumentu. Myslím si, že nie je na škodu mať ho prepracovanejší, okrem toho trvať na príprave dokumentu Testovacia stratégia a hlavne mať včas a dobre podchytenú RACI maticu, čo metodika MIRRI vôbec neuvádza a je to škoda podľa môjho názoru… Prepáčte, to len môj názor, s ktorým nemusí byť každý stotožnený. Mne pre oblasť testovania celkovo chýba viacero vecí, ktoré by MIRRI mohla odporúčať. Želám príjemný deň.

liska · March 16, 2023, 2:44pm

Dobrý deň,

ďakujeme za podnety, určite je čo vylepšovať. Prvá časť projektu OD2.0, tj. pre SPARQL Endpoint je už v úplnom závere a práve prebieha schvaľovanie dodanej dokumentácie k dielu z poslednej fázy (aj testovacie scenáre a podobne), je ich možné nájsť tu:
https://wiki.vicepremier.gov.sk/pages/viewpage.action?pageId=101835720

Dokumenty ktoré uvádzate, neboli predmetom zmluvy, čiže ich po dodávateľovi, MFF-UK Praha požadovať nebudeme.
Ak by ste chceli v tejto veci vo všeobecnosti postúpiť, napadá ma aby ste takéto dokumenty vypracovali a skontaktovali sa s našim oddelením QA

Ak by ste tie dokumenty napr. doplnili pre horeuvedené výstupy, viem si predstaviť, že Vás priamo v našej QA podporíme.

IvanK · March 17, 2023, 11:59am

moment, toto je tejto linke sa schvaluje? Ved trebars havarijny plan je prazdny.

liska · March 17, 2023, 12:40pm

Ďakujem za pripomienku. Riešime.

IvanK · March 17, 2023, 1:47pm

A celkovo je ta dokumentacia…minimalisticka, slusne povedane. Ale zrejme to pojde cez QA a ti sa vyjadria, ci im to takto postacuje…

liska · March 17, 2023, 2:00pm

Ďakujem pekne za mierne slová. Áno, je to minimalistické, ale do samotného testovania sme vložili veľa úsilia. Tu je k tomu záznam z testovania:

Ak niečo podstatné podľa Vás chýba, budeme radi pripomienkam.

liska · March 24, 2023, 11:13am

Ahojte, pár informácií o akutálnom postupne. Veľa sa toho za posledný čas udialo, takže to zosumarizujem. Minulý týždeň bola pracovaná skupina otvorené údaje, kde som prechádzal aktuálny stav projektu OD2.0, a následne sme sa už viac venovali téme HVD.

K samotnému projektu OD2.0

VO1: NKOD

Tu sme už pred ukončením tejto fázy. Riešime ešte výstupné dokumenty aby boli. Ešte potrebujeme dotiahnuť ten havvarijný plán a čakáme na interné pripomienky. Následne pošleme dokumenty na schvaľovanie na RV.

Každopádne, SPARQL Endpoint pre data.gov.sk je už funkčný a je dostupný
Národný katalóg otvorených dát

Synchronizácia údajov s aktuálnym data.gov.sk prebieha každý deň. Formálne je SPARQL Endpoint v testovaciom režime a v produkcii bude až z celým portálom. Dôležitá informácia ešte je, že nový počet datasetov je už 5398 (oproti 3190 na data.gov.sk). Dôvod je, že niektoré datasety nie sú v starom portáli nahodené správne.

V tejto súvislosti by som rád podotkol, že 5.4. plánujeme školenie Dotazovanie metadát otvorených údajov cez SPARQL Endpoint. Prihlásiť sa dá tu:

VO2: Infraštruktúra pre komerčnú časť vládneho cloudu

K tomu zatiaľ len toľko, že infraštruktúra beží, a NKOD (VO1) je v nej nasadený.

VO3: NKOD

Tu bohužiaľ situácia nie je taká ružová ako je tomu pre ostatné časti OD2.0.
Už to môžem povedať aj tu, že súťaž bola zrušená. Oddelenie verejného obstarávania už oboznámilo súťažiacich. Dôvodom bolo vyhodnenie rizika nestihnutia projektu do konca roka 2023. Resp. koniec (nielen nášho projektu) kvoli fakturáciam bol nastavený na sempterber 2023, pričom do konca roka sa rátalo ešte s postimplementačnou podporou. Tu len doplním, že toto bolo odhlasované na RV 9.3.2023 jednohlasne.

Riešenie s ktorým sme sa všetci stotožnili je zníženie predmetu zákazky na podstatné časti riešenia, a implementácia niektorých funckionalít internými kapacitmi, kde už nebudeme tak tlačení časom. Predbežne to vyzerá na to, že z Webového portálu pre NKOD vypadne subsystém Komunita (Zaevidovanie podnetu, prihlásenie člena komunity, laknutie datasetu, správa noviniek na portáli, evicencia aplikáciíá používajúcich otvorené údaje, …) a veľmi silno uvažujeme, že vypustíme aj programovanie dodačného API, či už na zápis alebo čítanie súborov do NKODu a pôjdeme veľmi podobne českou cestou - kde túto funkciu poskytuje práve existujúci SPARQL Endpoint.

Ešte jedna dôležitá poznámka: pri rokovaní s viacerými OVM ohľadom publikácie otvorených údajov z ich systémov to vyzerá že samotné OVMka preferujú najjednoduchšie riešenie, a to:

OVM rovno sprístupný API k svojim údajom
Ak je tých API málo, tak sa jednoducho ručne nahodia do NKODu (ako napr. ITMS služby). V prípade že u OVM vzniká veľké množstvo rozličných datasetov na dennej báze (napr. lokálne portály otvorených dát samosprávy alebo štátnej správy), vtedy je najjednoduchšie a najefektívnejšie riešenie vystaviť svoj lokálny katalóg cez štandard DCAT-AP-SK 2.0 , nahrať ich do free RDF databázy, sprístupniť na verejnosť a zaregistrovať v NKODe harvestovanie. O tomto ale nemám ambíciu rozhodnúť sám.

Podpora pre harvestovanie sa tvorí tu:

alebo tu:

Čiže suma sumárum: Nový portál sa bude orientovať na decentralizáciu otvorených údajov. V prípade OVM, ktoré chcú automatizovane publikovať/katalogizovať metadáta otvorených údajov do NKOD, riešenie bude postavené na harvestácii lokálneho katalógu. Pri ručnom vkladaní súboru by bolo tiež potrebné uviesť externú linku, kde sa daný dataset nachádza.

Takže toto je istým spôsobom pokus, ako vyťažiť zo zlej situácie maximum, a tým je postavenie portálu otvorených dát čisto na decentralizačnom prístupne, podobne ako data.gov.cz, alebo data.gov.uk.

Ešte aby som doplnil, kvoli výraznému zníženiu scopu VO3 budeme pravdepodobne oslovovať priamo vybrané subjekty, ktoré vieme že aktívne pracujú v oblasti otvorených údajov.

VO4: GovGit

Na RV bolo schválené OPZ GovGIt (tu bolo pridané už od januára). V jednoduchosti možno povedať, že ideme čisto anglickou cestou, tj. niečo ako:

Tu sa musíme vysporiadať z veľkou špecifičnosťou projektu, pretože väčšina zdrojov na tento komponent pôjde na licencie, neviem sa bude rozširovať (kupovať služby nad týmto repozitárom)

Ako som už povedal na pracovnej skupine, na tomto úložisku je už zverejnený aj kód metais, zatiaľ v privátnom móde. Čo nám chýba je metodika Bezpečnostného testovania zdrojových kódov pre ich zverejnenie, toto ešte interne riešime - či nám to pomôže spraviť CSIRT alebo kto. Ešte riešime aj tú web stránku code.gov.sk v ID-SK designe, či to bude súčasťou VO, a bude sa dať na ňu prihlásiť samostatne alebo nie. Na budúci týždeň by malo byť toto vyriešené a pohneme sa ďalej. Predpoklad je, že Slovensko v Mobile sa sprístupní týmto prístupom, že po vytvorení metodiky, sa sprístupní kód najskôr privátne pre jeho kontrolu a následne sa publikuje.

Z mojej strany musím povedať, že celkovo vnímam že projekt OD2.0 napreduje, hoc môhol by i rýchlejšie. Problém času, ktorý vyústil do zrušeného VO3 sa dá podľa mňa využiť a o to sa teraz maximálne snažíme.

htomas · March 24, 2023, 12:23pm

Čo sa týka webu NKOD, ak tomu správne rozumiem, tak ste súťaž 2x zrušili kvôli chybe v zadaní. Neviem koľko potencionálnych dodávateľov ste dotlačili k štúdiu dvojciferného počtu dokumentov za pár dní počas Vianoc, aby mohli vytvoriť ponuku. Vašou úlohou bolo zoradiť uchádzačov podľa jedného čísla a skontrolovať pár čísiel víťaznej ponuky. To trvalo vyše 2 mesiace. A keďže to trvalo 2 mesiace, tak už nie je čas na realizáciu.
Pri všetkej úcte si neviem predstaviť, ako by sa to dalo zvládnuť horšie.

liska · March 24, 2023, 12:59pm

K tomu poviem pár veci:

Nesúhlasím s tým, že na zúčastnenie sa súťaže VO3 bolo pár dní počas vianoc. Do VO3 sa dalo prihlásiť veľmi dlho, môžeme sa pustiť do detailov a snažiť sa to presne vyčísliť.
S veľkou pravdepodobnosťou priamo oslovíme súťažiacich, ktorí sa do súťaže zapojili.

IvanK · March 24, 2023, 2:09pm

htomas · March 25, 2023, 10:50am

Rozumiem, že ste môj príspevok vzali ako útok, ale k podstate veci ste sa vôbec nevyjadrili.

Skúsim opísať svoju skúsenosť: o súťaži som sa dozvedel zo stránky ÚVO hneď po zverejnení 27. decembra. Pôvodný termín bol o 8 dní a nepopierateľne to bolo počas vianočných sviatkov. Následne sa termín posunul o 4 dni. Na termín som poukázal preto, lebo sa mi nezdá správne dať dodávateľom čas rádovo v dňoch a potom vyše 2 mesiace s tým nerobiť nič preukázateľné.

Do súťaže som sa nakoniec nezapojil, lebo mi to prišlo neefektívne. Tento pocit bol najsilnejší pri požiadavke na test použiteľnosti s videom na 50 používateľoch. Táto požiadavka sa totiž dá spáchať natočením päťdesiatich murárov (nič pri nim), ale k vyššej použiteľnosti to nepovedie. Určite nie, ak je UI a do veľkej miery aj UX fixne dané.

Zvláštne mi prišlo aj to, že v tom čase bola ako aktívna označená rovnako nazvaná súťaž z novembra minulého roka. Mimochodom, obe súťaže sú na stránke ÚVO označené ako aktívne doteraz.

liska · March 29, 2023, 4:09pm

Ospravedlňujem sa, budem sa snažiť byť vecný.

Uviedol som, že podľa mňa bolo toto VO3 dostatočne dlho otvorené na zapojenie a myslel som tým toto:

VO3 na Webový portál začala 15.11. do 25.11., pričom kvoli chybe že linky na prílohy smerovali do nášho interného portálu sa predĺžilo do 5.12. (cca 20dní). Tu by som ešte doplnil, že tie prílohy k tomuto tu už boli vložené 22.6. (Samozrejme to nič neznamená, keď sa ale rozprávame o tejto veci tak by som to aspoň chcel uviesť).
Následne pri vyhodnodnocovaní ponúk sa zistilo, že sa musí opakovať kvoli chýbajúcej príručke, ktorá upravuje maximálne pomery rozdelenia úsilia, medzi jednotlivé role (analytik, pm, tester, a podobne). Takže sa súťaž musela opakovať. Tá trvala od 27.12. do 9.1. (ďalších 13 dní). Čiže toto je dôvod, prečo som presvedčený, že toto VO nebolo schovaté do krátkeho času okolo vianoc. Dokopy je to 33 dní. Aj keď tam boli vianoce, soboty a nedele, podľa mňa čas bol dostatočný.

Bohužiaľ, dodanie diela bolo z časových hľadísk na hrane už pri prvom obstarávaní, a po druhom sme sa už zhodli, že v tomto rozsahu by sa to nedalo stihnúť. Toto rozhodnutie mohlo byť rýchlejšie, uznávam, nie je to však také jednoduché ako sa zdá. Ideálne by bolo, keby samotný projekt začal už v roku 2019 po schválení NFP. Ja som nastúpil na MIRRI na konci roku 2020, a projekt sa rozbehol až v roku 2021.

S týmto s Vami súhlasím, tieto štandardy som netvoril.

Na toto som sa pýtal dnes nášho oddelenia OVO a odpoveď je taká, že účasníkom, ktorý sa zapojili do súťaže bolo všetko oznámené. Po uplynutí lehoty na predkladanie ponúk sa už nedali nové pridať, a dôvod neuzavretia je kvoli tomu, aby nebol prístup do systému uzamknutý, ale aby sa dali riešiť ešte rôzne námietky a podobne. Či sa toto dá vylepšiť, momentálne nechcem posudzovať.

Na záver si ešte dovolím povedať dve veci:
A) Na začiatku projektu nebolo celkom isté, že projekt pôjde do VO. My sme sa v tíme rozhodli, že sa budeme o to, za každú cenu snažiť. Tŕpol som v depresii, keď sa napr. vyhodnocovalo toto VO3, či sa prihlásia aspoň dvaja súťažiaci, aby to bolo platné. Keď som sa Ďozvedel že áno, bol som štastný pretože to som považoval za matchball projektu. Keď sa ukázalo, že sa musí súťaž opakovať, tak som sa skoro rozplakal.
Tak či onak, musím ale povedať, že nikoho v tomto neviním, druhých už vôbec nie. Pri tom malom množstve času a ľudí, si naopak myslím, že sme celkom postúpili.Hoc samozrejme, existuje možný svet, kde sa to udialo ešte lepšie.

B) Prial by som si aby viac vecí bolo inak. Každopádne situácia je aká je, a budeme sa ju snažiť maximálne využiť.

liska · April 16, 2023, 10:03am

Ahojte,

pridávam pár aktuálnych informácií o projekte:

1) NKOD + SPARQL Endpoint

Situácia je stále rovnaká. MFFUK už ukončilo práce vo Februári (SPARQL Endpoint je funkčný), no z našej strany ho nevieme ukončiť. Potrebujeme schváliť záverečný akceptačný protokol. Jemu ale predchádza dokončenie Havarijného plánu (ktorý bol napr. identifikovaný aj tu na fóre), a vysporiadanie sa s akceptačným testovaním (ktoré sa podľa mňa urobilo perfektne, všetko je nahraté a sprístupnené). Tým že všetko podrobne zverejňujeme, odhaľujeme v podstate naše byrokratické peklo (ospravedlňujem sa za výraz), ktoré si postupne budujeme. Za vecnú stránku za projektom absolútne stojím, tieto veci ale okolo pravdepodobne nezvládame na jednotku. Mrzí ma to z pohľadu MFFUK, pretože oni si svoju prácu spravili, a pomáhali nám konzultovať nie len samotný NKOD ,ale aj množstvo čiastkových problémov u OVM. Aby som pravdu povedal, hanbím sa na totálku.

Ďaľší postup verím že bude taký, že kedže sa formálne jedná o testovací beh (v produkcii bude až spolu s webovým portálom), tak napr. tento protokol bude riešení až na konci celého projektu OD2.0. s

2) Webový portál pre NKOD

Ako som už viac krát opisoval, VO3 sme zrušili kvoli veľkosti rozsahu, pretože opäť našimi chybami bol už do konca roka 2023 nerealizovateľný. Prepracované poklady môžete vidieť tu:

https://wiki.vicepremier.gov.sk/pages/viewpage.action?pageId=101838604

Projekt sme znížili o

vypustenie subystému komunita, ktorý plánujeme realizovať v interných kapacitách, v čase keď bude už čiastnočne Webový portál pripravený. Odstránili sme teda napr. možnosť lajkovať datasety, prihlasovať sa obyčajným konzumentom údajov, podávať podnety, sledovať stav ich realizácie, evidenciu aplikácií, ktoré používajú otvorené údaje, a tiež napr. odstránenie tvorby náhľadov na tabuľkové dáta.
takisto sme po mnohých konzultáciach s OVMkami pristúpili na to, že automatizované publikovanie otvorených údajov bude už možné len cez harvestáciu (buď princípom SPARQL Endpointu, alebo cez tzv. DCAT dokumenty, kde každý dataset bude mať súborovú dvojičku s metadátami). Presne ako v ČR. Toto však vnímam ako obroskú pozitívny posun dopredu, pretože CSRÚ sa nebude zbytočne napájať na OpenDataAPI a vkladať súbory do Centrálneho portálu, keď stačí registrovať len OpenDataAPI.Týmto spôsobom je automatizovaná publikácia otvorených dát už vyriešená, pretože harvestor je súčasťou NKODu.

Náš plán na ďaľší postup je priame oslovenie firiem, ktoré sa zúčastníli VO3 a predpokladáme, že to vedia dodať.

3) GovGit

Opäť, tecnická realizácia je už dávno jasná a špecifikovaná, riešime teraz obstaranie. Keďže väčšina zo zákazky je viac menej o licenciách pre Githut (alebo ekvivalenty), pričom sú potrebné aj len konfiguračné služby, a aj vytvorenie malého webového vyhľadávača (code.gov.sk), padol návrh na využitie DNS (Dynamický nákupný systém). Všetko vyzeralo úplne fajn do momentu, keď som zistil že je tam registrovaných len 22 subjektov, čo mi príde ako málo efektívne. Zatiaľ pokračujeme týmto spôsobom, snažím sa tým vnútorne vysporiadať. Tu ale nie sme ultra v časovej tiesni, takže uvidíme ako to ešte dopadne. Snažím sa pochopiť, prečo je v tom systéme len tam málo firiem. Podľa mňa by sa tento zoznam firiem mohol publikovať aj ako opendata dataset, zatiaľ však nechcem príliš prudiť.

Na záveer poviem len toľko, že napriek všetkým problémom, ktorými sa teraz bortíme, verím že projekt ide dobrým smerom, akurát škoda že už dávno mohol byť na svete. AK sa podarí tá harvestácia opendatasetov z OVM, tak si myslím to bude skvelé. Samozrejme subystém komunity je veľmi dôležitý tiež, už len kvoli indexu ODMI - kde je práve vidno, že jeho plnenie má absolútnu relevanciu.

O ďaľšom postupne budeme informovať v dohľadnom čase.

IvanK · April 16, 2023, 2:16pm

Aby som správne rozumel, hanba pramení z požiadaviek 85ky?

Siking · April 16, 2023, 3:53pm

Toto nechápem - teda ste obstarávali, vyhodnotili a víťaz súťaže vám povedal, že by to nestihol a tak idete opakovať súťaž?
Ďakujem

hanecak · April 16, 2023, 3:58pm

Mam si toto zaroven vylozit tak, ze uz je na beton jasne, ze CSRU vypublikuje ako Open Data vsetko alebo skoro vsetko (co ma resp. coskoro bude mat naintegrovane a je to open) cez API?

(Pytam sa, lebo uz od pociatkov CSRU v OPII na toto ~“nikdy nikto”~ nechcel dat jasnu opdpoved a napriek tomu,ze to dava zmysel, skor bolo badat “bocenie”, t.j. ze pre CSRU by to bolo “out of scope”.)

Inak teda <thubm up>.

liska · April 16, 2023, 4:08pm

Skôr som mal na mysli to, že mne samotnému chýbajú dobré znalosti o verejnom obstarávaní, a všetkých súvisiacich náležitostiach (fakturácie, míľniky, prechody medzi fázami, a podobne). Že sa iba dívam zúžene na technologickú stránku veci. Aj tu mám ešte čo doštudovať. Celkovo je to obrovské množstvo informácií, ktoré nedokážem popri vecniarstve efektívne naštudovať. Hoc toto bolo moje prvé VO v živote, keby som bol väčší profík aj na VO, možno by už MFF bola vyfaktúrovaná, ako druhá strana očakávala.

Nechcem sa púštať do diskusie našich procesov, dokončenie projektu OD je všetko čo je teraz pre mňa dôležité.

liska · April 16, 2023, 4:25pm

Nie, bolo to rozhodnutie naše, na MIRRI, dohodlo sa na riadiacom výbore hlasovaním. Rozsah funkcionality Webového portálu bol pripravený s ohľadom na to, aby sa stihol urobiť do konca roka 2023, nakoľko končí programové obdobie. Samozrejme do scopu sa dostalo toho čo najviac.

Avšak Vyššie som uvádzal, že VO3 - Webový portál sa raz muselo kvoli drobnej chybe predĺžiť, a druhý krát sme zistili chybu až na konci pri samotnom vyhodnocovaní, čo bola veľká škoda, lebo projekt by sme inak už mali v suchu. Tu sme už stratili veľa času a následne sme vyhlásili ďaľšie verejné obstarávanie.

Popri tom prebiehali diskusie s OVMkami, ktoré robia OpenData projekty, a vyšlo, že všetci počítajú s našim preferovaným riešením harvestácie otvorených údajov, resp. katalogizácie rovno ich OpenDataAPI, namiesto preposielania otvorených údajov cez CSRÚ. Aj tento faktor, aj to že sme už boli v sklze, a riziko stihnutia projektu v tomto rozsahu už bolo veľmi vysoké, rozhodli sme sa toto VOčko zrušiť na našej strane.

liska · April 16, 2023, 4:33pm

Skôr by som povedal, že nie, resp. zatiaľ toto nie je naša priorita.
OVMka ktoré v súčasnosti robia OpenData v rámci rôznych výziev už budú podporovať harvestáciu cez SPARQL Endpoint, alebo sa ich OpenData API rovno skatalogizujú na data.gov.sk bez toku dát.

To čo sa pýtaš ty je skôr, že keď už pretekajú nejaké opendata CSRÚ, či sa budú zapisovať do data.gov.sk ako súbory. Toto momentálne nie je naša priorita, je to skôr naozaj o tom, že chceme už katalogizovať rovno zdrojový systém.

hanecak · April 16, 2023, 6:38pm

To je OK a super, t.j. ze subory a/alebo API budu o OVM a (urcite a vzdy) bude na ne zaroven odkaz na data.gov.sk.

Zaujima ma specificky pripad, ked 1) CSRU ma (bude mat) Open Data ktore OVM samo publikovat nevie alebo 2) CSRU ma (bude mat) Open Data s “pridanou hodnotou” oproti Open Data priamo od OVM (CSRU totiz tusim sluboval aj nejake prepajanie a teda aj cistenie = pridana hodnota).

Nevravim, ze to ma byt vasa priorita (ale mohla by byt, predsa len, MIRRI = sefovia informatizacie). Len chcem vediet, ci uz za CSRU niekto riadne a jednoznacne slubil, ze BUDU publikovat Open Data. Ak uz totiz porobili X integracii, kadejake ETL, atd. atd. a nasledne aj niekam dalej tlacia/poskytuju vysleky (cez API), tak nedava velmi zmysel aby k podmnozine “open data” neposkytli API aj verejnosti. (Subory viem ze robit nechceli, t.j. ak ich nerobia vseobecne kvoli G2G, tak ich nemusia robit ani kvoli Open Data, API staci).

(CSRU stoji dost vela, t.j. dufam, ze okrem Talend licencii aj spravia nejaku uzitocnu datovu pracu a teda ak z tej prace NEbudu open data vysledky, tak by som to rad vediet ASAP a zaroven aj zdovodnene, ze “kto a preco” takto rozhodol.)

Vid druhy obrazok (pod “A teraz (moje, mozno zle) vnimanie aktualnej nasej situacie”) v Denník NP OpenData 2.0 - #45 by hanecak - t.j. scenar, ktoremu by som/sme sa rad/-i vyhol/-i.