DIGITALNA ARHIVA ŠUMARSKOG LISTA
prilagođeno pretraživanje po punom tekstu
ŠUMARSKI LIST 11-12/2008 str. 53     <-- 53 -->        PDF

STRUČNI ČLANCI – PROFESSIONAL PAPERSŠumarski list br. 11–12, CXXXII (2008), 551-554
UDK 630* 945


DIGITALIZACIJAŠUMARSKOG LISTA


DIGITIZATION OF JOURNAL OF FORESTRY


Branko MEŠTRIĆ*


SAŽETAK: Potpunom digitalizacijom cjelokupnog izdanja Šumarskog lista
uz korištenje suvremene informacijske i računalne tehnologije, omo gu ćuje se
pristup vrijednoj građi i omogućuje njena bolja logička i fizička dos tup nost.
Time je Hrvatsko šumarsko društvo napravilo velik iskorak u nove tehnologije,
osiguravši tako svojem članstvu, ali i cjelokupnoj šumarskoj struci pristup
ogrom nom fondu znanstvenih, stručnih i povijesnih informacija koje su kroz
više od 130 godina prezentirane na stranicama ovog uglednog ča sopisa.


Digitalizirani materijal, koji uključuje preko 75000 stranica (trenutno preko
1020 PDF dokumenata, veličine skoro 13 GB), pokazuje cjelokupni sa dr žaj u
isto vjetnom obliku kako je objavljen (odnosno u stanju kako je sačuvan), a
istodobno je računalnim prepoznavanjem teksta omogućen i računalni pristup
sadržaju, što podrazumijeva pretraživanje po punom tekstu, odnosno mo guć no sti
kopiranja dijelova teksta i njegovo korištenje pri citiranju, reizda nju i sl.


Sva građa može se slobodno koristiti, naravno uz navođenje njena izvora.
Ko rištenje u komercijalne svrhe nije dozvoljeno bez dozvole izdavača.


Ključne riječi:Šumarski list, digitalizacija, biblioteka, povijest HŠD-a


UVOD– Introduction
Šumarski list kao znanstveno, stručno i staleško gla -No, suvremeni pri s tup zahtijeva, a suvremene in for ma silo
Hrvatskog šumarskog društva, odnosno hr vat skogcij ske i računalne teh nologije omogućuju, da se pristup
šumarstva u cjelini, izlazi u kontinuitetu već 132. go -tako vrijednoj gra đi modernizira, što u osnovi znači da se
dinu. Za to vrijeme na njegovim je stranicama objavljenaomogući bolja logička ifizička dostupnost.Šumarski list
impresivna znanstvena i stručna građa, a i cje lokupna ije ovim iskorakom postao predvodnikom takvih pristuvrlo
detaljna povijest Hrvatskog šu mar skog društva. Svapa i digitali za ci jom cjelokupnog sadržaja i nje govim in ta
građa dostupna je u biblioteci Hr vat skog šu mar skogdek si ranjem, potom i prezentacijom na in ter netu, pos tao
društva u cjelosti, djelomično i u dvije nepotpune zbirketre nut no pre tra živ i globalno dostupan u svoj svojoj
na Šumarskom fakultetu, a dijelom i u Na cio nal noj iobimnostiicje lo kupnomdosadašnjemtrajanju.
sveučilišnoj biblioteci. Na ravno, u “papirnatom” obli ku.


DOSADAŠNJA NASTOJANJAI POSTIGNUĆA– Past efforts and achievements
Potreba za učinkovitijim pristupom objavljenoj gra -1976). Ovdje je na jedan popularniji na čin, više ili ma đi
uočena je odavno. Jedno od prvih i poznatijih rješe njanje bibliografski (ovisno o autoru po je di nog područja),
dao je dr.AlfonsKauders,koji je u svoje dvije šu mar -pri kazana i bibliografija Šumarskog lista.
ske bibliografije (Kauders1946, Kauders 1958) de


Sljedeći korak učinjen je izradom prve cjelovite ra talj
no obradio i Šumarski list. Daljnju razradu materije


čunalno podržane i internetski prezentirane biblio gra dala
je grupa autora u ediciji Povijest šumar stva Hr vat


fije (Meštrić,2005). Ona je donijela naslove svih
ske 1846–1976. kroz stranice Šumarskog lista (Zagreb,


ra do va objavljenih u cijelom dotadašnjem životnom
vi je ku Šumarskog lista, ali po prvi puta i mehanizme


*
koji su bibliografiju učinili “živom”, tj. osigurali da se
Branko Meštrić, dipl. ing. šum., branko.mestric@sumari.hr
HŠ Consult d.o.o.Vukotinovićeva 2, Zagreb


ona na dopunjuje sa svakim izlaskom novog broja
ŠUMARSKI LIST 11-12/2008 str. 54     <-- 54 -->        PDF

B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554
časopisa. Ova bibliografija dostupna je na internetskimsadržaja svih brojeva odnosno godišta Šumarskog
stranicama Hrvatskog šumarskog društva i to krozlista. Na ovaj je način riješena globalna logička dostuppristup
pre ko naslova i autora, pretraživanje po ključn-nost cje lo kup nog sadržaja. Svatko može na internetu
im riječima i imenima osoba, a posredno i kroz pregledlako saznati tko je kada i što pisao.


KAKO RIJEŠITI FIZIČKU DOSTUPNOST?– How to solve the physical presence?
Kada zainteresirani sazna u kom broju je objavljenmje reniji vremenu, odnosno stupnju razvoja teh no logija
odre đeni članak, a što mu je omogućeno i olakšano in -u okružju. Moguće je i izvodivo napraviti slje deći velik
ter netskom biliografijom, ostaje da nekako dođe dokorak u modernizaciji i informatizaciji kako Šumarskog
samog članka. Klasično rješenje razmjerno je jedno -lista kao izdanja, tako i načina rada u Hr vatskom
stav no. Kako se zna da je u HŠD cjelokupna zbirka svihšumarskom društvu. Početkom 2007. na bav ljena je po izdanja,
dovoljno je nazvati HŠD, da bi netko od služ -treb na oprema, razrađen tehnološki po s tu pak i pristupibenika
pronašao konkretan broj, napravio foto ko piju ilo se skeniranju, a potom i digitalizaciji cjelokupne
poštom ga poslao zainteresiranoj osobi.Takav sce narijgra đe objavljene na stranicama časopisa.
je realan, pa se i redovito događa, no baš i nije najpri


TEHNOLOGIJAPRIMJENJENAU RADU– Technology applied in the work
Skeniranje– Scaningto matskog obostranog skeniranja pojedinačnih stranica
za one brojeve koji postoje neuvezani u arhivi, pa ih


Sam posao bio je obiman i fizički zahtjevan. Bilo je


je bilo moguće i fizički razdvojiti – to je bitno olakšalo


jasno da valja skenirati preko 60000 stranica (poslije


i ubr zalo postupak. Manji pak dio brojeva, koji ne


se pokazalo 75000) građe, često već u dosta lošem sta


posto je u duplikatu, već samo u uvezu, skeniran je iz


nju zbog starosti. Najprije je korištena mogućnost au


uveza pojedinačnim snimanjem digitalnom re proka


me rom. Svi skenovi su grafički obrađeni i pripremljeni
za daljnji postupak.


Prepoznavanje tekstova–Text recognition
Obrada skenova koja uključuje prepoznavanje
teks tova, njihovo pohranjivanje, a potom i generiranje
digitalne forme časopisa obavljen je programomAbby
Finereader, za koji je procijenjeno da ostvaruje do volj no
velik stupanj prepoznavanja tekstova na hrvatskom
jeziku, ali i sažetaka i ostale opreme članaka, koji su
često na francuskom, njemačkom odnosno engleskom
jeziku. Svjesno su tolerirana vjerojatno i veća odstupa nja
prepoznavanja tekstova na slovenskom, odnosno
srp skom jeziku – posebice na ćirilici, kojih je u neka
vre mena bilo dosta, jer bi ručna dorada zahtijevala izu zetno
velik radni angažman, koji u ovoj fazi nije bio
pri hvatljiv. Ukratko: cjelokupni sadržaj je okularno
čitljiv“as is” jer je čitatelju dostupan izgled svake stra nice
kakva stvarno jest, a “u pozadini” je isti tekst au to
mat ski računalno prepoznat, bez dodatne korekcije,
što znači s izvjesnim pogreškama. Računalno ko riš te nje
– pre traživanje, kopiranje dijelova teksta – nosi sa
so bom izvjesnu pogrešku zbog te nedorađenosti. Mo gu
će je naknadno, u svakom trenutku, ukoliko bi to za
neki tekst bilo potrebno (reizdanje i sl.) napraviti do dat
no ručnu kontrolu i popraviti ta odstupanja.


Priprema digitalnih materijala–Preparation of
digital materials


Sav materijal pripremljen je u formatu Portable Di -


Slika 1.Web stranica za pristup digitaliziranom materijalu –


stanje studeni 2008.


gital Format (PDF) jer se on u zadnje vrijeme etablirao


Figure 1Web site to access to digitalized material –


kao de facto svjetski standard za digitalne dokumente.


the situation in November 2008.
ŠUMARSKI LIST 11-12/2008 str. 55     <-- 55 -->        PDF

B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554
Slika 2.Analiza stanja – stanje studeni 2008.


Figure 2Analysis of the situation – the situation in
November 2008.


Iako su materijali skenirani u razlučivosti od 300 to čaka
po inču (tpi) kako bi si osta vi li prostor za daljnja una pre
đenja, dokumenti su generirani sa sma nje nom raz lu či
vosti od 150 tpi i još dodatno grafički sažeti. Čak i na
taj način dobiveni generirani dokumenti
možda su pre ve liki za lagodno
korištenje na in ter netu u ovom
tre nutku, ali za pretpostaviti je da će
dalj njim na pret kom ko munikacij skihteh
no lo gijatajprob lemnestati.


Svaki broj (svezak) časopisa fi zički
je jedan PDF, koji se sastoji
od realne kopije stranice (sa svim
ev. po greškama, mrljama, žuće njem),
ispod koje je i digitalni tekst
koji se ne vidi, ali se koristi pri pretraživanju,
odnosno može se kopirati
i ko ristiti računalnim putem.


Objava na internetu– Pu bli sh
ing on the Internet


Digitalni dokumenti objavljeni
su na internetu na adresi http:// sumlist.
sumari.hr i dostupni su ka ko
pre ko na toj adresi postav lje nih
pregleda po brojevima, au to rima,
tako i preko pretraživača.Također
se do odre đenih radova može i pre -


Dodatno, više kao model, napravljen je i ključ pris


tupa preko imena osoba – šumara o kojima je pisano u


Šu marskom listu. Vjerojatno je da će se u budućnosti


pri premiti pregledi i po drugim entitetima koji se mogu
pre poznati u sadržaju ovog časopisa.


Nije isključeno ni da netko drugi napravi preglede
na svojim stranicama i po svojim kriterijima. Doz vo lje
no je ugrađivanje linkova i na druge stranice drugih
subjekata, za što se specifikacije mogu dobiti u HŠD.


Naime, svi dokumenti nezaštićeni su i mogu se ko ris
titi u skladu sa Creative commonslicencom, koja
uvje tuje imenovanje vlasnika i nekomercijalno ko riš te
nje, a obvezuje na daljnje djeljenje pod istim uvjetima
(Imenovanje – Nekomercijalno – Dijeli pod istim
uvje tima 3.0 neloklizirana licenca – detalje vidjeti na
http://sumlist.sumari.hr)


Indeksiranje i pretraživanje–Indexing and search
Pretraživanje sadržaja preko brojeva, autora, naslova
i ključnih riječi moguće je još od izrade i postavlja nja
Bibliografije Šumarskog lista na internet (Meš trić,
2005). Ovaj sustav se i dalje dorađuje i može se koristiti.
Međutim, digitalizacijom cjelokupnog sadržaja otva ra
se mogućnost pretraživanja po cjelokupnom tekstu,
što daje pristupu sadržaja novu dimenziju.
Budući su digitalni dokumenti objavljeni na internetu,
već se do dobrog dijela njih može doći i preko
jav nih pretraživača (Google i sl.). No kako njihov sa dr
žaj i rad ne možemo kontrolirati generiran je vlastiti


ko bibliografije časopisa, ali i pre -


Slika 3.Pretraživanje po punom tekstu
ko web stranica autora.Figure 3Full text searching
ŠUMARSKI LIST 11-12/2008 str. 56     <-- 56 -->        PDF

B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554
indeks cjelokupnog materijala i odgovarajući pretraži-Jasno je da i veličina samog digitaliziranog broja
vač koji je postavljen na adresihttp://sumlist.sumari.hr.pred stavlja određeno ograničenje u korištenju. Kako je
in tencija bila zadržati vjerni izgled originalnog izda -


Skidanje i korištenje dokumenata– Download


nja, mo ralo se svjesno ući u izradu dokumenata koju su


and use documents


po ve ličini na granici upotrebljivosti, ali u sadašnjim


Pristup dokumentima je slobodan i neograničen.


ko mu nikacijskimuvjetima.


Iako je pristup moguć cjelokupnom broju ili izravno na


Ukoliko neki korisnik ima veće potrebe za digital


konkretnu stranicu, fizički se u oba slučaja učitava


nim dokumentima a nema tehničke uvjete, može se javi


cijeli broj. U izvjesnoj mjeri postupak učitavanja može


ti u HŠD i koristiti iste dokumente u lokalnoj mreži.


ovisiti o vrsti i stanju lokalno instaliranog čitača PDF
dokumenata kod korisnika.


ZAKLJUČAK– Conclusion
Akcijom digitalizacije cjelokupne građe Šu mar -obliku kako je objavljen (odnosno u stanju kako je sa skog
lista Hrvatsko šumarsko društvo je napravilo ve -ču van), a istodobno je računalnim prepoznavanjem
lik iskorak u nove tehnologije, osiguravši tako svojemtek sta omogućen i računalni pristup sadržaju, što pod članstvu,
ali i cjelokupnoj šumarskoj struci pristupra zumijeva pretraživanje po punom tekstu, odnosno
ogrom nom fondu znanstvenih, stručnih i povjesnih in -mo gućnosti kopiranja dijelova teksta i njegovo ko riš te for
macija koje su kroz više od 130 godina prezentiranenje pri citiranju, reizdanju i sl.
na stranicama ovog uglednog časopisa.


Sva građa može se slobodno koristiti, naravno uz
Digitalizirani materijal, koji uključuje preko 75000na vođenje njena izvora. Korištenje u komercijalne svr stra
nica, pokazuje cjelokupni sadržaj u istovjetnomhe nije dozvoljeno bez dozvole izdavača.


LITERATURA– Literature
Kauders,A., 1947: Šumarska bibliografija (1846– -Meštrić,B., 2005: Šumarski list – bibliografska baza
1946), (Bi bliographia forestalis), Šum. sek cijapo da taka i njena prezentacija, ŠL5–6/2005., s.
DITN. R. Hrvatske, s. 1–266., Zagreb279–286., Zagreb.
Kauders,A., 1958: Šumarska bibliografija (1946– -Meštrić,B., 2005: www.sumari.hr, ŠL 11–12/2005,
1955), Šum. društvo N.R. Hrvatske, s. 1–440.,s. 636–638., Zagreb.
Zagreb.


SUMMARY: Journal of Forestry, a scientific, technical and professional
periodical of the Croatian Forestry Society and Croatian forestry as a whole,
has been coming out continuously for 132 years. During this time it has published
an impressive amount of scientific and technical material, as well as a
detailed history of the Croatian Forestry Society. The entire material is available
in the library of the Croatian Forestry Society, while part of the material
is also contained in two incomplete collections at the Faculty of Forestry and
in the National and University Library. Modern information and computer
technology allows improved access to valuable material and enables better
logical and physical availability of the items. By stepping into the field of new
technologies, the Croatian Forestry Society has made it possible for their
members and the entire forestry profession to access the extensive fund of scientific,
technical and historical information, which have for over 130 years
been presented on the pages if this renowned periodical.


Digitized material, which includes over 75,000 pages (currently over 1020PDF documents of almost 13 GB), shows the overall content in the form identical
to that published in the Journal (or in the state in which it has been preserved).
At the same time, computer-recognized text allows computer accessto the content. This includes search by full text, the possibility of copyingparts of the text and their use in citations, etc.


All materials can be used free of charge, but their sources must be cited.
Commercial use is not allowed without permission from the publisher.


Key words:Journal of Forestry, digitization, library, history of HŠD