Slovakiana

Nedávno spustili portál http://www.slovakiana.sk je to z OPIS2 projekt Národného osvetového centra, Centrálna aplikačná infraštruktúra a registratúra za 23 072 112,16 EUR a majú tam byť prezentované výsledky digitalizácie kultúrneho dedičstva.
Najprv som si myslel, že je to nejaká recesia, veď si schválne skúste vyhľadať nejaké kultúrne objekty. Objavujú sa chybové hlášky ako “Kultúrny objekt nie je zdigitalizovaný.” a “Nepodarilo sa vytvoriť náhľad.”. Ergonómia je zúfalá a najväčšia perlička sú zdigitalizované objetky Slovenského národného archívu - sčítacie hárky z rokov 1930 a 1940.

(To začiernenie, kvôli ochrane osobných údajov, teraz rozoberať nebudem.)

Keď som zistil, že to mesto v názve hárku je okres a nie samotná obec, tak som neveril vlastným očiam…(tá obec je asi zakódovaná v tých číslach, ale to mi veľmi nepomôže). Že by existovali nejaké ďaľšie metadáta ani radšej nespomínam.

Doplním, že ani roky poriadne nesedia, lebo niektoré hárky z roku 1940 označili rokom 1920, alebo rok 1930 zamenili za rok 1903. To proste nechápem, že to asi ručne museli vypĺňať a nemali to predvyplnené, keď fakticky mali na výber len 2 hodnoty (1930,1940).

Jednoducho tam majú asi milión zdigitalizovaných objektov, ktoré sa nedajú žiadnym rozumným spôsobom vyhľadávať a prezerať. https://www.slovakiana.sk/kulturne-objekty/cair-ko1ely7?content=CAIR_DIV_IMAGES_1&contentDo=SNA-0000950097b&page=1

3 Likes

Vystizne. Najma ak sa vyznamna cast financii nezmyselne “vyhodi” na medialnu prezentaciu. Algoritmus vyhladavania si asi pozicali zo slovensko.sk. Pani z Plynarenskej, nespravte si hanbu a napiste ze to je Alfa/Beta verzia. Co k tomuto dodat: https://www.slovakiana.sk/kulturne-objekty/cair-ko2669i?content=CAIR_DIV_IMAGES_1&contentDo=PUR-020015000&page=1 (ale virtualna galeria je HTML5/WebGL, to je pozitivne)

1 Like

Nemôžem sa zbaviť pocit, že autor nečítal ani opis projektu a veľmi neporozumel konceptu Prioritnej osi 2 OPIS. NOC a projekt CAIR zdieľajú prostredníctvom slovakiana.sk náhľadové deriváty a metaúdaje, ktoré vznikli ako výstupy ďalších (digitalizačných) projektov z tej istej Prioritnej osi.

Projekt rieši vybudovanie prevádzkového informačného systému, ktorý okrem aplikačných komponentov IS zahŕňa 5 hlavných služieb.

  1. sprístupňovanie a publikovanie,
  2. vyhľadávanie (jednoduché, rozšírené),
  3. objavovanie a navigácia,
  4. uloženie vyhľadávania, triedenie podľa zvolených slov, neskoršie prezeranie,
  5. poskytovanie ďalších detailov, prezeranie objektov v pôvodnom kontexte a súvisiaceho obsahu.

Zároveň na informačný systém CAIR budú pripojené a integrované informačné systémy inštitúcií. Logicky bude informačný systém delený na:
• Národný archív realizujúci časť dlhodobého uloženia a ochrany obsahu.
• Národný portál realizujúci časť spracovania a sprístupnenia obsahu.
• Národné registre realizujúce špecificky časť podpory rozvoja inštitúcií.

Určite však nezodpovedá za kvalitu či kvantitu metaúdajov.
Ako čítam v opise projektu tak počet zverejnených digitálnych objektov je 1 030 050 do roku 2015. Celkový počet digitalizovaných objektov je viac ako 6 000 000 (je to len môj nepresný odhad po preštudovaní pár projektov OPIS PO 2). Len počet zdigitalizovaných objektov z projektu Slovenskej národnej knižnice je 2 527400 do roku 2015. Predpokladám, že obejty do CAIRU budú postupne pribúdať počas celej udržateľnosti projektu, čo je 5 rokov, teda do 2020.

A mimochodom zdigitalizované objekty sú uložené v CDA (Centrálny dátový archív).

1 Like

Toto vsetko znie pekne a samozrejme zdigitalizovat 6mil. objektov pre dalsie generacie je uslachtily ciel. Bezneho uzivatela nezaujima ze CDA ma kapacitu 10PB (strelil som), nam tu skor islo o jednoduchu otazku: Ako sa k tomu bezny uzivatel dostane? Tazko. :wink: A to je prave ulohou implementatora, cely projekt riadit a idealne ak k tomu bude k dispozicii uzivatelsky privetivy frontend. Nic viac.

Pán/pani je od niektorého z dodávateľov? Na digitalizáciu a portál išlo vyše sto miliónov eur a náhodnému radovému občanovi by asi nenapadlo len tak obhajovať nepoužiteľný produkt a tvrdiť, že chyba je v inštitúciách a že sa to dokončí niekedy v budúcnosti. Niekto s odmenou tisíc eur (zo štátneho rozpočtu) na deň ide niečo obhajovať tým, že zodpovední sú chudáci z rezortu kultúry s platom päťsto na mesiac… Tie milióny na Slovakianu a digitalizáciu už reálne odišli zo štátneho účtu na účty súkromných firiem, takže nie je čas básniť o tom, ako sa to raz bude napĺňať. Ten chaos a nekvalita, čo je teraz na slovakiane, je úplný výsmech zdravému rozumu. Linkovací nástroj za 23 mega? Na slovakiane je aktuálne 1,1 milióna objektov, z toho sú asi tri štvrtiny sčítacích hárkov, ktoré automat dokáže zoskenovať do týždňa. Kde sú public domain knihy, kvalitné kontextové metadáta, registre autorov, organizácií, disambiguation indexovanie podľa školských osnov… - tu vôbec nejde o prezentáciu kultúrneho dedičstva, ale vykazovanie kvantity pre EÚ, bez kvality a použiteľnosti. A to si skúste ešte hociktorú stránku preklepnúť cez HTML alebo Accessibility validator - stovky chýb. Slovakiana = čistý tunel, pod ktorým je podpísaný Maďarič.

1 Like

Ešte poznámka: nie je to tam síce nikde explicitne uvedené, ale Slovakiana beží na OPEN SOURCE softe FEZ/Fedora, aspoň podľa hlášky na portáli v septembri. Existuje ešte nejaký iný štát natoľko blbý, že si kúpi bezplatný softvér za niekoľko miliónov?

Pán nie je od žiadneho z dodávateľov. Len som sa snažil upresniť nepresné informácie. Rád si robím názor na základe objektívnych informácii a nie pocitov alebo na základe informácii typu “jeden nazlostený pán povedal”. Ale mám obavu, že sa to tu zmení na hon na čarodejnice alebo ako vraví pán Jahnátek “Môžu za to reťazce”. Snáď nebudem jediný komu stojí za to si nájsť a prečítať opis projektu resp. aspoň nejaký relevantný dokument, ktorý ma uvedie do obrazu.

Vďaka za objasnenie a ospravedlňujem sa za obvinenie z osobnej účasti na tuneli. Opis projektu považujem za znôšku drístov, ktoré nejaký IT lobista pretlačil na podpis nejakému úradníkovi, v tomto prípade je to štatutár Národného osvetového centra, politicky to kryje minister kultúry. Objektívne fakty: Slovakiana nie je integrovaná do Europeana.eu, chýba tam obsah niekoľkých inštitúcií (deadline sept. 2015), sú tam prázdne objekty vykázané ako zdigitalizované - to už nie je vec jednotlivých inštitúcií, pretože za tú srandu s hlasovaním a započítanie neexistujúcich objektov zodpovedá MK SR/NOCka. Dať ľuďom sčítacie hárky ako plnohodnotné objekty je možno objektívne v poriadku a bruselskí audítori to možno prehliadnu, ale de facto je to podvod na občanoch, ktorí si môžu pod objektom predstavovať skôr knihu a nie štatistické lajstro.

Aktuálny stav naplnenia CDA je na http://cda.kultury.sk/ - ťažko uveriť, že napríklad národná knižnica alebo galéria majú v CDA spolu len niekoľko terabajtov po “úspešne implementovaných” projektoch digitalizácie. Slovakiana a CDA sú nedorobky a to ani nechcem pomyslieť, koľko miliónov vysolíme z rozpočtu mimo zdrojov EÚ za údržbu, poplatky a ďalší rozvoj.

Takže zhrnuté:
5 hlavných služieb - tie poskytuje niekoľko open source riešení pre systémy digitálneho úložiska, nebolo na to treba milióny
*• Národný archív realizujúci časť dlhodobého uloženia a ochrany obsahu *- v tom nie je ani to, čo sa doteraz spracovalo
• Národný portál realizujúci časť spracovania a sprístupnenia obsahu. - detto
• Národné registre realizujúce špecificky časť podpory rozvoja inštitúcií - snažil som sa, ale nenašiel som ani jeden verejne prístupný register, vybudovaný v rámci CAIR (napríklad register autorov, predmetových hesiel a pod.).
Fail.

2 Likes

Bohuzial nie je zatial dostatok informacii na to, aby sa dalo urobit jednoznacny nazor. Tiez nie som zastanca honu na carodejnice tak skusme konkretnejsie. O efektivite a cenach za dodavky sme toho uz napisali v ramci slovensko.digital vela, bez konkretnych informacii je to ale mlatenie prazdnej slamy.
Osobne sa pohybujem v oblasti digitalizacie viac ako 8 rokov a bol som pri tvorbe europskeho rozmeru digitalizacie Europeana, Europeana Local, architektura agregatorov. Rovnako ciastocne vidim do architektury sk riesenia, ktore je podla mna osobne nadcasovo navrhnute a je to dobry zaklad.
Temu treba podla mna rozdelit na niekolko subtem.
Jedna je obsah a jeho metadatova reprezentacia, ktoru riesia pamatove institucie.
Dalsie temy su systemy jednotlivych pamatovych institucii, ich upravy jednak za ucelom linkovania ich metadat s registrami a potom ich integracia na centralnu infrastrukturu a CDA.
Dalej CDA.
Dalsia tema je CAIR a nakonniec reprezentacia tychto dat v ramci portalu - do portalu vidim najmenej.
Ak ma niekto cas venovat sa tejto teme navrhujem rozdelit temu na tieto oblasti a venovat sa im tak, aby z toho nebol jeden gulas.
Osobne sa viem vyjadrit k spominanej integracii na europeanu. Integracia prebieha opacne. Europeana si harvestuje data cez oai/pmh api rozhranie cez sprostredkovatelov - data agregatorov, ktory harvestuju data od institucii. Viac na http://pro.europeana.eu/page/provider-faqs .
Kedze ide o EU projekt, vsetko trva hrozne dlho. Je len otazka casu, kedy sa data z CAIRu objavia v Europeane, lebo oai/pmh rozhranie cairu je pre data agregatorov dostupne. To, ake metadata su v caire a v cda zalezi od toho v akom stave su data v systemoch institucii. Ich cistenie a aktulizacia je kontinualny proces a meni pracu institucii do buducna. Ocakavat vsetky data v dobrom stave len preto, ze sa odovzdava system je nepochopenie riesenia. System je dizajnovany tak, aby data mohli putovat od institucie vlastniacej objekty a ich metadatove popisy do cda a cair a nasledne si ich Europeana dotiahne. Toto je proces, ktory system zabezpecuje kontinualne. Uz len predstava nalinkovania registra autorit v zdrojovych systemoch na ich lokalne autority je otazka niekolkych rokov vedeckej prace kunsthistorikov, ktora bude viditelna postupne. Fakt sa neda cakat, ze nejaky system toto spraví sam, nehovoriac, ze na to ani nema pravo. Toto je cinnost, ktora musi mat odbornu garanciu pracovnika na to povereneho. Takze idealne data su ciel buducnosti nie tohto projektu. Tu si treba uvedomit o akej teme sa bavime.
Co sa tyka zverejnenia registrov. Na prezentacii pri spusteni riesenia bola spomenuta ambicia dostat registre vo forme otvorenych dat na data.gov.sk, co by bol skvely pocin a podla informacii z dodatocnych konzultacii je toto realne v blizkej buducnosti.

Takze ako pisem na zaciatku prispevku k samotnej efektivite pouzitia zdrojov je takze vyjadrovat sa, lebo zatial nie je dost informacii ani pre ludi, co sa v prostredi hybu aktivne. Ale temu treba rolozit na drobne, aby sa mohli davat takto generalizovane vyhlasenia.

Aby bolo teda jasne. Autor tohto prispevku vystupuje pod svojim menom :), je spoluiniciatorom vyzvy slovensko.digital, pracuje v it firme poberajucej vyskumne granty od europskej komisie, konzultuje za peniaze temy v oblasti digitalizacie, otvorenych dat, obcianskej participacie atd, dodava riesenia v tejto oblasti pre SNG atd… a robi to nielen pre peniaze, ale preto, aby tu nieco fungovalo. Moj motiv prispevku je hlavne to, ze iniciative slovensko.digital je stale vycitane, ze nekonstruktivne generalizujeme a vyhlasujeme jednovetove vyhlasenia na adresu projektov. Preto skusme rozmienat kritiku a navrhy na drobne, aby kvalita vystupov rastla.

1 Like

Este k metrikam na http://cda.kultury.sk/ nemam k tomu ziadne data. Len poznamka. Jeden SIP balik moze obsahovat viacero objektov. Nie je to 1:1.
Ale to asi viete.

Chcel som si dnes pozriet http://www.slovakiana.sk/ ale stranka mi vracia iba:

503 Service Unavailable

No server is available to handle this request.

uf parada…
Ak si niekto chce pozriet v pohode web nad datami SNG tak tu je alternativa http://www.webumenia.sk/

na https:// to funguje na http:// nefunguje
… asi chybka. :slight_smile:

mne sa ta stranka www.slovakiana.sk vobec nepaci… respektive tie sekcie virtualne vystavy, kategorie a viritualna exkurzia by sa este ako tak dali, ale to vyhladavanie a kulturne objekty su strasne…

prva vec co si tam clovek zada je npr jeho rodne mesto nech sa o nom dozvie viac… ja som tam dal Rimavska Sobota, a vystup bol uplne nezmyselny

dalej ma napriklad zaujimalo ci tam maju nieco o jaskyni Praslen (zatial druha jaskyna na slovensku kde sa nasli jaskynne malby (po Domici)) a nic… Toto je skor otazka zdroja udajov, ale to ze vizualne vyzera vyhladavnie otrasne, nema tam ziadne vahy ani relevantnost, to je dost drsne…

Len pre porovnanie, tu je HUNGARICANA.HU, podobný digitalizačný projekt. Na prvej stránke som do vyhľadávacieho riadku zadal “Nové Zámky” a vrátilo mi to 395 odkazov.

Chcel som to isté zadať do SLOVAKIANY, ale nenaśiel som ani vyhľadávací riadok. Niekto si z nás vystrelil?

Nové: Hlásim, že už som našiel vyhľadávací riadok - je v strede obrazovky, nenápadne skrytý medzi meniacimi sa obrázkami. Tak som zadal “Nové Zámky”. Našiel mi asi 7ks vyčiernených sčítacích hárkov a jednu “virtuálnu prehliadku” - okopírovanú zo stránky mesta…

2 Likes

Najprv kompetencia: rok na digitalizacii jedneho konkretneho pamatoveho ustavu.
Gabo to tu popisuje obsirne, ja len pre tych co su nie uplne vtiahnuti: Digitalizacia naplna CDA (Asi 20 projektov) . Projekt CAIR (samostatny projekt) ma naplnat portal pre verejnost zo zdrojov CDA. Pre info CDA su paskove kniznice o s LTO5 paskami a nejake diskove polia, ktore by mali byt architektonicky navrhnute podla zakladnej schemy OAIS (dobre si pozriet).

A to je zakladny problem. CDA sa totiz VOBEC nezaujima o obsah SIP balickov jednootlivych pamatovych instiucii (kedze vsetko su to samostatne projekty). Kazdej institucii co prispieva umoznuje naindexovat lubovolne polia, a sama udrziava iba strukturu DoublinCore, ktora je totalne zakladnou mnozinou metaudajov. Pred rokom vsetci riesili iba SIPy, a logistiku ich dodavok. Na to ako z toho archivu dostat DIP este pred rokom nemali v CDA ani nazor, nie to postup. Okrem toho baliky DIP defaultne umoznuju vyberat iba institucii, ktora ich tam vlozila, a keby nieco malo byt verejne dostupne, musela by vkladacia institucia na to udelit vnutri balika SIP prava. Neviem kam to dotiahli za posledny rok, ale pred rokom to vyzeralo, ze vsetko usilie sa sustredilo na vkladanie. Moj nazor vsak je ze Kniznica, kotra prevadzkuje CDA, by mala stanovitaj strukturu metadat, pre jednotlive typy obsahov a to nezavisle od vkladovej institucie, aby ich mohli jednotnym pristupom naindexovat a poskytovat aspon jednotne vyhladavacie sluzby vnutri CDA. Oni nemozu poskytovat cele diela v originalnej kvalite, lebo je to zatial technicky nemozne. Pre predstavu 1 SIP, kde je 1 3D model nejakehjo objektu ma bezne 36GB., ale obsahuje aj metadata, thumbnaily, a JPEGy o velkosti stoviek kilobytes. Zial CDA s nimi nepracuje, resp, nevie ich z AIPu vyextrahovat a poskytnut ako nejaky samostatny typ DIP.

Este poznamka k tomu softu zadarmo. … Ak si predstavite softverove dielo cojaviem za 2 Mega, tak obycajne byvaju licencie niekde na urovni 200 - 300Kilo … Cize to, ze pouzjes nelicencovany softver znamena iba, ze vies znizit cenu cca o 10 percent. A to este vtedy, ak danny soft DOBRE poznas, inac prerobis na vyskume aj tie licencie. Nemozes to prezentovat, ze to mas zadarmo. To sa da povedat len ak ste si na FedoraCommons nemali moznost siahnut tak, aby to aj nieco zmysluplne robilo. Je to boj, vyrobca ziadny, verzie rozbite, hladas ihlu v kope sena (diskusie amaterskych autorov, zvacsa muzejnikov, ktori sa vo volnom case naucili php / to mozno prehanam, ale narocky :slight_smile: )

Ale inac uznavam, ze tento(tieto) megaprojekt(y) su nedotiahnute a je to velka skoda.

2 Likes