MIRRI Pracovná skupina K9.4 Lepšie dáta

Obsah je kral, nie forma.

;D tymto vyrokom sa urcite obhajuje aj zufale UX

Tu je aktuálna verzia dokumentu z tejto PS na pripomienkovanie:
docx verzia: https://drive.google.com/open?id=0B9iFnMOIzlqNSHh6UGpUVmFCY3M
pdf verzia: https://drive.google.com/open?id=0B9iFnMOIzlqNTjFiQ1VKSUtlRDQ

Po tomto kole pripomienok a ich zapracovaní bude už výsledný dokument.
Pripomienky treba dať do konca víkendu.

Ukrizujte ma, ale toto je necitatelny chaoticky dokument. Mozno obsah je super z hladiska kvalitativneho posunu v tejto oblasti ale v tejto forme a strukture je to chaos. Miestami sa mi zda ze bol tvoreny sposobom, kto co poslal to sa tam vlozilo. Skoncil som na 40 strane, ostatne som prescrolloval a priznam neviem co je vychodisko, aky je gap a co je vlastne ciel a ako sa tam dostaneme. Mozno som to tam aj precital ale moja seda kora to v tom chaose vyhodnotila ako nepodstatne. A sucasny stav popisany na 4 strany? to znamena ze bude nevieme kde sme alebo to nechceme vediet?

Bola tu velmi dobra diskusia o generickom registri v dokumente su o tom 4 riadky, pritom si tato tema podla mna zasluzi podrobnu analyzu. Na druhej strane medzi projektami najdeme Register právoplatných rozhodnutí (to je co?) a vytvorenie chybajucich registrov (kolko vlastne je tych chybajucich registrov? Vytvorit Centralny register chybjucich registrov by sme nechceli?

Aby som len nekritizoval, sluzba moje data je super napad, ale podla harmonogramu uz mala byt, ale neviem o tom ze by som ju mal niekde ci uz ako obcan alebo ako podnikatel.

1 Like

Ak som dobre porozumel, tak správcom platformy dátovej integrácie bude správca MUK (t.j. NASES), ktorý si už “vysúťažil” platformu BigInsight od IBM. Zdá sa, že stratégia nasleduje aktuálny stav, resp. obstarávatelia predbehli dobu a správne odtušili strategické zámery UPVII. … karty sa teda rozdali už skôr a toto je len dobeh aby všetko sedelo.

P.S.: Formálne sa javí celkom správne ten dokument.

Priesiel som si dokument v0-9_SP_Manazment_udajov. Moje poznamky uvahy a pripomienky:

  • v analyze sucasneho stavu by som cakal, ze tu bude popisane ako funguje CSRU/MUK. Nasiel som iba vetu “orgány verejnej moci (pilotný rozsah 12 orgánov verejnej moci) zapojené do dátovej časti ostatných úsekov Modulu úradnej komunikácie”. Pricom CSRU je rok v produkcnej prevadzke, preco tu nie je popisane, ze ako funguje, kolko sa prenieslo udajov, ake presne typy udajov poskytuje, skusenosti s prevadzkou atd? Ved ten projekt mal vela cielov totoznych s cielmi popisanymi v tomto dokumente,

  • niektore casti su tu zbytocne a nepresne - napr. stat o RPI, kde sa tvrdi ze RPI sa buduje (na stranke RPI sa pise ze su v operacnej prevadzke od 15.1.2017) a obsahuje udaje, v skutocnosti obsahuje iba metaudaje,

  • ciele realizacie su nastavene ako uplne scifi. 99% institucii bude mat kvalitne udaje. Percenta objektov evidencie v ISVS s chybami je mensie ako 1. Neverim ze to je realizovatelne,

  • su tu dobre a realizovatelne napady (ako napr linked data),

  • je tu vela v podmienkach SR tazko realizovatelnych buzzwordov (big data, machine learning), ktore su fajn, ale najprv musia byt vyriesene elementane veci.

  • niektore casti su ako wishlist na vsetko (Prikladom je analyticka vrstva, analyticke nastroje v 5.3.2),

  • velka cast dokumentu ale vyznieva ako namet na dalsie (lepsie, drahsie?) CSRU. Centralne sluzby a funkcie pre zdielanie udajov, integraciu atd. podla mna nepomozu, ked velka cast udajov je nekvalitna. A kvalitu udajov si musia riesit rezorty u seba, tu centralne riesenie moc nepomoze.

  • aj keby boli udaje kvalitne, preco vlastne je taketo centralne riesenie lepsie ako princip pouzivania samostatnych registrov? To som a nedocital. Ak by sme napriklad pouzivali linked data, tak si myslim ze taketo navrhovane centralne riesenie nie je potrebne.

1 Like

Seva Lubor,

dostal som sa k tomu dost na poslednu chvilu, tak pripajam pre info, co somv0-9_SP_Manazment_udajov_mt_jc.doc (1.2 MB)
stihol poslat na UPVII.

m.

v skutočnosti len metaúdaje ide len obsahovať. No a to ešte ide byť zaujímavé, pretože my budeme do posledného dychu bojovať za to, aby bol iba jeden jediný metainformačný systém, a to Metainformačný systém :wink:

…, ktorý ostré údaje tiež iba “ide” obsahovať … :slight_smile:

V metais nejde o konkrétne údaje, ale o metaúdaje (ontológie) a najmä ide o pridelovanie URI entitám ISVS (samozrejme s automatizovanou podporou, napr. pri registrácii eformulárov a podobne). Samotné dáta by mali ostať v zdrojových registroch. Aj keď pôvodne MetaIS s URI nerátal, sú to ony, ktoré dali tomuto systému zmysel (podľa mňa). A určite ak sa chceme pohnúť s kvalitou dát ďalej, potrebujeme iba jeden jedíný taký IS.

Milí priatelia/kolegovia, a aj milí nepriatelia Linkovaných dát :wink:
dovoľte mi pár informácií a otázok k tomuto vláknu.

Už tri roky sa snažíme posunúť neutešený stav informatizácie na Slovensku prostredníctvom sémantiky. Od 1. stretnutia na PS1, po nTé stretnutie na PS1, tento rok na K9.4-Lepšie dáta. Píšeme publikácie, chodíme na konferencie do zahraničia (nie do tajných pivničných miestností na úradoch) Informácie publikujeme aj tu na slovensko.digital dva roky, pochopil som že aj na to je platforma. Naše návrhy sú známe, publikované, otvorené (LOD Slovakia, Sémantické dátové štandardy a podobne).

A týždeň pred schvaľovaním donesie Lubor takmer celú sémantiku preškrtnutú, že to podľa SD je nedôležité, zbytočné, atď. A opäť tá istá situácia ako dávnejšie, keď Lubor proti LinkedData neustále protestoval.

- Fakt by som to čakal od hocikoho iného, ale nie od Slovenska.Digital. Pretože, ak nechcete ťahať technológie, len byť dobrý watchdog, tak aj na to je LinkedData to najlepšie, čo môžete urobiť.

@Lubor, @jsuchal, môžete plís povedať, z čím máte s LinkedData najväčší problém?
Nevidím tu ani tú verziu, čo si Lubor včera ráno prezentoval, môžeš ju tu zavesiť?
Myslíš že má zmysel skúsiť sa o tom porozprávať? Ja verím že áno.

Ale fakt, prečo to podľa Vás nepatrí do Lepších dát??? Nabúrava to Váš koncept ekosystem.slovensko.digital, že on nie je postavený na sémantike? Čo je veľká škoda, lebo mi ľahko mohol byť rozšíriteľný, pretože ak ste si všimli, často používam entitu slovensko.digital na ukázanie niektorých vlastností sémantiky. A rád by som aj s nejakými vašimi chalanmi/dievčatami na túto tému pracoval.

Ďakujem

Prosim taketo konspiracie nie. Nam to v ekosysteme vobec nic nenaburava. A aj keby naburavalo nema to nic spolocne s tym co sa deje v PS.

Tak sa vyjadrite, prečo LinkedData nemá podľa Vás miesto v téme Lepšie dáta. Len prosím takisto, žiadne konšpirácie.

Trochu s tým mám aj ja problém. Jurajovi som to aj hovoril. @juraj.bardy
Za najdôležitejšie časti z toho považujem plán úloh, potom architektúru / komponenty, čiže vlastne čítať dokument odzadu.

Áno, myslím že tento dokument nemá riešiť generický register. To je spoločný blok (zrejme typu SaaS) mal by byť riešený tam.

Rozhodnutia je dôležité mať jednoducho dostupné v G2G.
Tiež si nemyslím že “register” rozhodnutí je najlepšie riešenie, skôr treba použiť existujúce komponenty, čiže platformu zdieľania údajov, dať každému OVM povinnosť sprístupniť rozhodnutia atď.
“Chýbajúce registre” - aj mne sa to zdá čudná úloha

Súhlas. Bohužiaľ odpoveď je, že aktuálne ide o službu “poskytnutie konsolidovaných údajov o subjekte”, ktorá bola spravená v CSRÚ, avšak veľmi použiteľná nie je.

Nie, správca platformy dátovej integrácie má byť ÚPVII a časti MÚK sa majú v zákone zlúčiť, ideálne do jednej. Takto to je aj v dokumente zachytené.
BigInsight kde si Nases obstaral?

Takýto dokument aj existuje samostatne, nemôžem ho však sem preposlať. Asi by si však s jeho obsahom nebol spokojný.

Za mňa vôbec priestorové údaje sú veľmi chabo v dokumente riešené.

Súhlas, tiež som to na skupine hovoril. Odpoveď je, že treba mať veľkú ambíciu.

Presne tak. Mne vadí že v tom dokumente sú tieto veci na rovnakej úrovni, čiže slabo vidno čo z toho je kritickejšie a čo menej.

CSRÚ je existujúca vec, samozrejme že je plánované ju ďalej použiť. Za mňa nech sa tam efektívne spravia zmeny aby to robilo presne čo treba. To samozrejme nijako neznamená že doterajšia investícia bola efektívna.
Pre info. pýtal som sa minulý týždeň ÚGKK, koľko údajov majú v stave na referenčné použitie - oni to volajú “stotožnené údaje”, odpoveď bola že cca. 45%. Je veľká škoda, že dokument nedáva konkrétne nástroje ako zdieľať a pracovať s nie_úplne_kvalitnými údajmi.

Tak “niečo” spoločné musí byť. Napr. štandardy, sieť. Ten náš návrh čo som tu poslal vyššie je presne o tom, že tá povinne centrálna časť je minimalistická, v podstate by to mal byť najmä endpoint pre API, smerovanie požiadaviek a spoločné katalógy objektov/oprávnení.

“Linkovanie” sa má robiť pomocou referencovateľných identifikátorov, tak sme to aj navrhovali a je to v dokumente. Na druhej strane skrátka nie sú žiadne “spoločné štátne dáta”, natívne sú v registroch dáta modelované relačne, treba silne riešiť riadenie prístupu atď., čím chcem povedať že výmena nech sa robí pre štandardizované objekty v XML.

Áno @mtuchyna aj ja “získanie mapových podkladov” považujem za čudnú úlohu, zaradil som do pripomienok.

Tu je dokument s pripomienkami k dokumentu za mňa:
v0-9_SP_Manazment_udajov-pripS.D.docx (604.7 KB)
(sorry že to je .docx, avšak nedá sa to jednoducho konvertovať do google doc, rtf to spraví 21MB a tak)

@liska prosím bavme sa konkrétne, vyber tu z tých pripomienok s čím máš problém.
Napr. v niektorých kapitolách sú skrátka disproporčne detailne rozpísané, skutočne si nemyslím že ontológie v tejto chvíli je to čo dokáže vytrhnúť štát z problémov zdieľania údajov. Povedzme jednoznačná identifikácia objektov pomocou ref.id. je vec ktorá má jasný zmysel, rovnako si viem predstaviť použitie kvalitne spraveného spoločného modelu dát.

V rámci tejto zákazky:
https://www.uvo.gov.sk/vyhladavanie-zakaziek/detail/403826

kde sa 24.1.2017 otvárali obálky.

V súťažných podkladoch sa požaduje dodať BigData SW, Názov SW: IBM BigInsight (str.67 - Technická príloha súťažných podkladov.) Žiadny ekvivalent tam nie je spomínaný.

1 Like

:slight_smile: myslim, ze sa “stat” (teda konkretni ucastnici zajazdu Smerom niekam) riadne smeju do xichtu celemu zdruzeniu aj aliancii …

  • kopa, ale ze kopa hardveru … pritom to ide o novy system, cize sup sup do vladneho cloudu, vramci samostatneho obstarania…
  • Požadujeme server s výkonom minimálne 150 000 SAPS Pre test SAP enhancement package 5
    for SAP ERP 6.0 - bez komentara …
  • zadanie … komplet opisane tivolli … a dalsie … komplet IBM produkty.
    Ak by mali uz 20 pouzivatelov a 5 adminov vyskolenych na IBM BigInsight … nic nepoviem …ale ak ide o komplet nove obstaranie niecoho co nemaju … tak pisat tam BigInsight, websphere a NetCool a dalsie IBM produkty je dost … drze ?
    Ak toto prejde, tak niekto bude mat, ale ze ine prazdniny …
2 Likes

Díkes za zverejnenie pripomienok. Keď sa na ne teraz pozerám, vidím že nie si proti prijatiu sémantických štandardov, URI, či spraveniu jednotného modelu údajov verejnej správy, Ty len to fakt nemáš rád. To je OK za mňa, nezazlievam, budem naopak rád ak nám budeš konštruktívne pomáhať pri jej implementácii. :wink:

Súhlasím s tým, že som dokumentu venoval veľkú pozornosť a uviedol som tam linked data kde všade podľa mňa patria. Ale posudzovať, že my máme 5 viet, a iná vec je popísaná 3, nie je celkom až také strašné, ale OK, niektoré veci sa dajú asi zmenšiť. Na druhej strane, nemyslím si, že sme predpisovali až tak príliš konkrétne. LinkedData je podľa nás presne tá vec ktorá má potenciál vytrhnúť štát z problémov. Dnes nemáme jednotný dátový model, strašne veľa peňazí sa spenduje na analýzu, či aplikačnú integráciu dát, z čoho vyplýva že systémy nie sú prepojené efektívne, niečo vyhľadať je nemožné, … a to podľa mňa je základ AŽ na ktorom sa môže stavať hocičo.

Čo sa týka kapitoly 6.2.3 Identifikácia projektových zámerov, tam si nám poškrtal sémantiku, aj vytvorenie centrálneho modelu verejnej správy založených na ontológiach, suhlasím že tá dereferenciácia by tam nemala byť samostatná ale môže byť spojená s riadkom vyššie. Viem že ti opäť vadí, že sa tú spomína sémantika takto presne, radšej by som bol aby to bolo iba brané ako Lepší model, vágnejšia definícia na neskoršie rozpracovanie (z ktorej možno vypadne, že sa žiadne LinkedData robiť nebudé, že :wink: ). Ja si práve myslím, že LinkedData je jasná vízia zlepešnia inforamtizácie na Slovensku a zaslúži si byť jasne pomenovaná.

Čiže suma sumárum, myslím si že je to nakoniec OK.
Samozrejme, dokument nie je celkom ľahko čitateľný, veď to sme viacerí vytýkali, a určite mnohé by sa dalo zlepšiť. Podľa mňa sú tam niektoré veci zbytočné, snaha o klasifikáciu dát či podobné veci si myslím nemá presnú formálnu kvalitu, ale tým že je tam už LinkedData, tak som s tým OK. Snažil som sa aj v úvode dokumentu vysvetliť, ako LinkedData vo všeobecnosti pomôže našemu štátu. Naopak, ja si myslím že by sme nemali mať príliš veľa ambícií, ale LinkedData určite áno.

16 posts were split to a new topic: URI a jeho dereferenciácia