Super že to riešite.
Rozdelenie “do datasetov po mesiacoch” je nanič, lebo sa tým stráca možnosť automatizovaného strojového spracovania, t.j. celé to tak trocha stráca zmysel.
Pre zmenové dávky (ktoré pribúdajú denne) navrhujem skôr toto:
- jeden dataset RA/Zmenové dávky
- v ňom je (okrem dokumenácie) jeden dátový zdroj, je to tabuľka v CKAN, ktorá má tieto položky
- id zmenovej dávky
- timestamp prevzatia zmenovej dávky
- URL na súbor zmenovej dávky
- čiže pri aktualizácii sa dávka stiahne z MV, uloží niekde na FS, vygeneruje sa jej url, vloží sa záznam do tabuľky zmenových dávok - tým sa automaticky aktualizuje timestamp poslednej zmeny dátového zdroja a mala by sa automaticky poslať notifikácia o zmene
Aj záznam doterajšej histórie zmien v RA považujem za dosť zaujímavý - málokedy je možnosť verejne vidieť ako sa historicky menil obsah registra. Napr. bude vidieť kedy, kde pribúdali adresné body - vchody. To je super informácia pre analýzu výstavby v obciach. Vidno z toho kedy bola ktorá budova kolaudovaná (nie neskôr ako má pridelené čísla v RA). Atď… Čiže aj ak by sa jednorazovo teraz stiahli a spracovali chýbajúce údaje (od mája 2017?) v nejakom polo-manuálnom režime, rozhodne to stojí za námahu.