Ahojte, krátka informácia. Minulý piatok sme mali nastavenú odstávku data.gov.sk s tým, že odnes sa už mali zapisovať datasety do nového portálu data.slovensko.sk.
Aj keď sme boli ready, vykonali sme zálohy, poslednú harvestáciu a ráno od cca 7:00 začalo fungovať viac potrebných presmerovaní, ako napr.
- data.gov.sk → data.slovensko.sk
- data.gov.sk/dataset/* → data.slovensko.sk/datasety/*
- data.gov.sk/set/* → data.slovensko.sk/datasety/*
zistili sme, že to nefunguje úplne správne a občas príde nečakaná odpoveď (stále zo starého CKANu). Takže sme to museli odložiť, pretože zneprístupnenie súčasného portálu je základná podmienka. No a keďže toto sa snažime vyriešiť cez víkend, tak odkladáme spustenie zápisu do nového portálu predbežne na ďaľší alebo ešte ten ďaľší víkend, kým to bolo úplne vyriešené. K tomuto inak aspoň krátka napíšem, že toto by malo byť systémovo riešené v novom MetaIS (presmerovanie domeny data.gov.sk, nakolko je to podla vyhlasky domena pre referencovatelny identifikator).
Som z toho trochu sklamany, ale da sa na druhej strane z toho vytazit. Mam aspon cas este lepsie vytunovat harvestovanie stareho data.gov.sk. Tu mozete vidiet tasky, ktore sa uz spravili a vylepsili kvalitu vysledneho NKODu:
Robili sme školenie na tému automatizovaná publikácia otvorených údajov:
Najbližšie školenie bude o dopytovaní data.slovensko.sk cez SPARQL Endpoint. Tam bude prezentované, ako strojovo vyhľadávať v NKODe cez API, ktoré má formu štadardného SPARQL endpointu. Termín ešte nie je stanovený, ale bude to v dohľadnej dobe.
Pre zaujímavosť by som rád napr. ukázal, ako sa “rozbili” distribúcie na datasety, ktoré mali byť už ako datasety zaevidované v starom portáli. Avšak zo zoskupenia pod dataset vieme vytiahnuť a vyrobiť dátovú sériu.
Napr. dataset Faktúry RUVZ v starom portáli bol dataset s distribúciami nahodený takto:
v novom portáli je to správne, tj. všetko sú datasety zoskupené v datasete typu dátová séria:
https://data.slovensko.sk/datasety/089adc66-2ec8-4165-8509-a72ad39ef9f8
Samozrejme, bude treba opravovať metadáta, napr. časové pokrytie datasetov. Toto bude akiste nejaký čas trvať, ale aspoň je to už na správnej ceste.