Kodulehelt

Uudistest

Kontaktidest

---

E-kataloog ESTER

Artiklite andmebaas ISE

Digitaalarhiiv DIGAR

Raamatukogu avatud E-R 10-20, L 12-19
Raamatuid saab tagastada Endla tn 3 E-P 7-22






 

Veebiarhiiv

| Soovitan saiti | Otsing | Valikupõhimõtted | Soovitused veebimeistritele |
| Üldsusele kättesaadavaks tegemise luba | Lingid | About web archive |

 

Eesti veebiarhiivi valikupõhimõtted

Kinnitatud Eesti Veebiarhiivi Nõukoja poolt 19. novembril 2015. a.
 

1. Sissejuhatus

Eesti Rahvusraamatukogu seadusega ning Sundeksemplari seadusega on Eesti Rahvusraamatukogule antud õigus ja kohustus koguda, alaliselt säilitada ning kättesaadavaks teha eesti keeles ja Eestis ilmunud ning Eestit käsitlevad või Eesti kohta informatsiooni sisaldavad teavikud, sealhulgas veebisaidid. Selle ülesande täitmiseks on Eesti Rahvusraamatukogus loodud Eesti Veebiarhiiv, mis ainsana Eestis tegeleb veebi arhiveerimisega nii laiahaardeliselt ning on koostöös teiste Eesti mäluasutustega ühtlasi sellealaseks kompetentsikeskuseks.

Eesti veebiarhiivi valikupõhimõtete eesmärk on määratleda kriteeriumid, mille alusel valitakse üldsusele vabalt kättesaadavaid veebisaite arhiveerimiseks ning säilitamiseks.
Käesolev dokument on kinnitatud Eesti veebiarhiivi nõukoja poolt, kuhu kuuluvad esindajad erinevatest Eesti mälu- ja teadusasutustest.

Arhiveerimisel kasutatakse arhiveerimisroboti abi, mis etteantud parameetreid järgides laeb veebist alla veebisaidi koos kõigi kuvamiseks vajalike elementidega ning salvestab need WARC vormingusse. Spetsiaalse tarkvara abil on võimalik hiljem kuvada arhiivis olevat veebisaiti nii nagu see nägi välja arhiveerimise hetkel. Arhiivis on võimalik liikuda sama saidi erinevate versioonide vahel ning kõigi arhiivis olevate saitide vahel, kui need üksteisele viitavad. Alati ei ole tehniliselt võimalik saidi funktsionaalsust säilitada, näiteks on arhiveerimisroboti jaoks kättesaamatu sisu, milleni jõudmiseks tuleb sooritada otsing. Samuti on probleemsed skriptirikkad saidid ning voogmeedia abil edastatav heli või video. Arhiveeritav sait piiritletakse enamasti domeeniga, millel see asub ning seetõttu võib saidi arhiiviversioonis puududa sisu, mis asub teistel domeenidel, näiteks fotogalerii mõnes fotojagamise keskkonnas.

Kuna arhiveeritud materjali säilitatakse pikaajaliselt, siis peaksid saidid olema võimalikult terviklikud ning seetõttu ei pea arhiveerimisrobot järgima robots.txt määranguid, mis on eelkõige loodud reguleerima otsingumootorite robotite tegevust vastaval saidil.

Kogutud materjal tehakse avalikult kättesaadavaks Eesti veebiarhiivi saidil http://veebiarhiiv.digar.ee/. Vastavalt Sundeksemplari seadusele on arhiveeritud saidi omanikul õigus piirata sellele avalik juurdepääs. Sellisel juhul võimaldatakse juurdepääs saidile sundeksemplari saavate raamatukogude autoriseeritud töökohtadel. Kohtuotsuse või Andmekaitse Inspektsiooni ettekirjutuse alusel suletud saite arhiivist ei kustutata - neile pääseb ligi vaid eriloaga.

Eesti veebisaite kogutakse iga-aastase suuremahulise arhiveerimise teel, millele lisandub väikese hulga eriti väärtuslike saitide valikuline arhiveerimine ning olulisemate Eesti ühiskonda puudutavate sündmuste veebikajastuste erikogude loomine.

 

2. Suuremahulise arhiveerimise põhimõtted

Suuremahulise arhiveerimise all peetakse silmas suure hulga Eesti veebisaitide arhiveerimist. Seda kasutatakse peamiselt põhjusel, et käesoleval hetkel on võimatu ennustada, mis võib tulevikus uurijatele oluliseks osutuda. Saitide puhul rakendatakse mahu piiranguid, kogudes igalt saidilt näiteks esimesed 300 MB. Kogutud materjali osas tehakse visuaalset kontrolli pisteliselt, kogutava materjali kvaliteedi tagamiseks rakendatakse automatiseeritud kvaliteedi hindamise vahendeid. Taolist arhiveerimist viiakse läbi kord aastas.
 

2.1 Arhiveerimisele kuulub

sait, mis on autoriõiguse seaduse tähenduses üldsusele suunatud:

  1. tippdomeenil .ee;
  2. Eestiga geograafiliselt seotud tippdomeenil (nt .tallinn);
  3. muul tippdomeenil Eesti elanikele ning on oluline Eesti kultuurile.
     

2.2 Arhiveerimisele ei kuulu

  1. andmekogud, mille säilitamine on ette nähtud teiste õigusaktidega (näiteks dokumendiregistrid);
  2. reaalajas voogedastused (veebiraadiod, veebitelevisioon, veebikaamerad).

  

3. Valikulise veebiarhiveerimise põhimõtted

Osa saite vajavad oma potentsiaalse uurimisväärtuse tõttu erilist tähelepanu ja neid tuleb arhiveerida eriti põhjalikult, et tagada sisu ning funktsionaalsuse säilimist. Iga sait vaadatakse enne arhiveerimist üle, et vältida võimalikke kadusid ning kontrollitakse ka salvestamise järel, et olla kindel arhiveerimise õnnestumises. Olulised saidid on tihti ka mahukamad, ületades suuremahulisel arhiveerimisel kasutatavat mahulimiiti. Tihti muutuvaid saite (nt uudisportaalid) arhiveeritakse sagedamini kui kord aastas. Eri valdkondade kõige väärtuslikumate saitide väljaselgitamisel kasutatakse nii Eesti Rahvusraamatukogu kui teiste teadus- ja mäluasutuste spetsialistide abi. Sellisel teel arhiveeritud saitidele tehakse kirje veebiarhiivi teemakataloogi.
 

 3.1 Üldised valikupõhimõtted

Tuginedes kehtivale õigusruumile, senisele kogumistraditsioonile ja –kogemusele määratleb Eesti Veebiarhiiv eriti põhjalikku arhiveerimist vajavaid saite järgmiselt:

  1. avalike ja erainstitutsioonide, üksikisikute ja gruppide tegevust väljendav teave, mis on oluline Eesti ühiskonna toimimise ja selle uurimise seisukohalt;
  2. üleriikliku ja kohaliku poliitika kujunemist, sellega seotud otsuseid ja tegevusi peamistes sotsiaal-kultuurilistes, majanduslikes ja keskkonnaalastes valdkondades kajastav teave;
  3. kohalikku eripära, eriti kultuurinähtusi väljendav teave, mis on püsiva kultuuriloolise ja teadusväärtusega.
     

3.2 Kitsamad valikupõhimõtted

Arhiveerimisvajaduse väljaselgitamisel arvestatakse järgmiste hindamiskriteeriumidega:

Olulisus -

Veebisaidi sisu on oluline rahvuskultuuri seisukohalt ja kestva väärtusega kogu ühiskonna jaoks. Kaalu lisab ka autori või väljaandja reputatsioon.

Sisalduva teabe
uurimispotentsiaal -

Veebisaidil sisalduv teave pakub olevikus ja tulevikus uurijale adekvaatset pilti konkreetsest nähtusest ja selle erinevatest avaldumisvormidest.

Esitatava teabe ajaraam -

Pikema aja jooksul kogutud või pikema ajavahemiku kohta teavet sisaldavad veebisaidid on väärtuslikumad. Samuti veebisaidid, mis kajastavad mingit murrangulist perioodi ühiskonnas.

Esitatava teabe unikaalsus -

Veebisait on ainus või kõige täielikum olulise teabe allikas. Teavet ei leidu teistel kandjatel.

Seotus muu teabega
(sh traditsioonilistel
andmekandjatel teabega) -

Viiteinfoallikad (indeksid, bibliograafiad), mis aitavad leida informatsiooni säilitatud veebisaitide kohta (nt. neti.ee teemakataloogi leheküljed, mis viitavad teatud teema veebisaitide aadressidele mingil kindlal ajahetkel).

Samuti veebisaidid, mis on seotud muudel andmekandjatel oleva teabega (nt füüsilisel kujul olevate infokandjate veebis asuvad lisad).

Kogumistraditsioon -

Veebisaidid, mis on teiste juba arhiivis säilitatavate veebisaitidega kronoloogilises ja sisulises seoses ning lisavad neile tähendust või väärtust.

Identifitseeritavus -

Veebisaidil on tuvastatav autor või omanik.

Usaldusväärsus -

Veebisaidil sisalduvad andmed on täpsed ja täielikud.

Terviklikkus -

Veebisaiti on tehniliselt võimalik arhiveerida ilma sisu ning struktuuri oluliste kadudeta

Kasutatavus -

Suurema väärtusega on väljaanne, mille sisu ja ülesehitus võimaldab kergemini leida vastavat teavet või teavet süstematiseerida. Veebisaidi väärtus kahaneb, kui sellel esitatud teave on tehnilistel põhjustel raskesti kasutatav.

Seotus olulise sündmusega -

Veebisait kajastab eesti rahvuskultuuri ja eesti ajaloo seisukohalt olulisi sündmusi.

  
Arvestades ülaltoodud hindamiskriteeriume arhiveeritakse:

  • kõik riigi- ja valitsusasutuste veebisaidid;
  • kõik ametis olevate Vabariigi Valitsuse liikmete ja Riigikogu liikmete veebisaidid;
  • kõik kohalike omavalitsuste veebisaidid;
  • kõik avalik-õiguslike ülikoolide veebisaidid;
  • valik asutuste, organisatsioonide ja eraisikute veebisaitidest;
  • valik ajalehtede ja ajakirjade veebisaitidest;
  • valik erialateabe- ja uudisportaale;
  • valik blogisid;
  • valik avalikke sotsiaalmeedia kontosid;
  • valik foorumeid;
  • valik fotosaite.


 Veebisaitide siseselt ei kuulu reeglina arhiveerimisele:

  • nn välised lingid, st arhiveeritava veebisaidi domeenilt teistele domeenidele viitavad lingid;
  • sündmuste kalendrid (kujutavad sageli lõksu arhiveerimisrobotile);
  • sisevõrgud (arhiveerimisrobot ei pääse ligi parooliga kaitstud alale);
  • veebikaamerad.
     

3.3 Veebisaidid, mis ei kuulu arhiveerimisele

Reeglina ei kuulu arhiveerimisele järgmised vastavat liiki teavet sisaldavad või teatud tüüpi veebisaidid:

  • piiratud juurdepääsuga veebisaidid, mis nõuavad registreerimist või salasõna;
  • interaktiivsed veebisaidid, mis eeldavad kasutajapoolset päringut või dialoogi (otsingumootorid, õpikeskkonnad, online sõnaraamatud);
  • veebisaidid, mille säilitamiseks kulub ebaproportsionaalselt palju ressurssi;
  • eraettevõtete veebisaidid;
  • infokataloogid, kuulutusportaalid, e-poed;
  • seadusevastaseid tegevusi propageerivad veebilehed (nt pommivalmistamine);
  • pornograafilise sisuga veebilehed;
  • jututoad;
  • suhtlusportaalid;
  • meelelahutusportaalid;
  • mänguportaalid;
  • digitaalarhiivid;
  • riiklikud registrid.

 Arhiveerimiseks valitud veebisaitide nimekirja täiendatakse käesolevate valikupõhimõtete alusel jooksvalt.
 

4. Erikogude loomise põhimõtted

Erikogud luuakse seoses olulisemate Eesti ühiskonda puudutavate sündmuste või oluliste teemadega. Erikogu ülesanne on koondada säilitamiseks antud sündmuse või teemaga seotud olulisemad veebisaidid, mis võivad olla kättesaadavad ainult sündmuse kestel.

Täpsemad valikukriteeriumid töötatakse välja iga erikogu jaoks eraldi. Eelistatud on originaalset sisu pakkuvad saidid, millel puudub trüki-, tele- või raadioväljund.

Aasta jooksul loodavate erikogude nimekirja kinnitab Eesti veebiarhiivi nõukoda eelneva aasta lõpus. Lisaks võib Eesti veebiarhiiv vajadusel luua ühiskonnale olulise ettenägematu sündmusega seonduvate veebikajastuste erikogu.



Kinnitatud 19. novembril 2015. a järgnevate Eesti veebiarhiivi nõukoja liikmete poolt:

  • Eesti Kirjandusmuuseum
  • Eesti Rahva Muuseum
  • Eesti Rahvusraamatukogu
  • Eesti Rahvusringhääling
  • Eesti Vabaõhumuuseumi konserveerimis- ja digiteerimiskeskus Kanut
  • Kultuuriministeerium
  • Rahvusarhiiv
  • Tallinna Linnaarhiiv
  • Tartu Ülikool
  • Tartu Ülikooli Raamatukogu

 

 

| Soovitan saiti | Otsing | Valikupõhimõtted | Soovitused veebimeistritele |
| Üldsusele kättesaadavaks tegemise luba | Lingid | About web archive |

Eesti veebiarhiiv, Eesti Rahvusraamatukogu, Tõnismägi 2, 15189 Tallinn
E-post: veebiarhiiv at nlib dot ee


RRi näitused digitaalarhiiv digar