48. évfolyam, 2002. 3. szám
Archívum

Az időszaki kiadványok cikkeinek feldolgozása a magyar és a lett nemzeti bibliográfiai adatbázisokban

Murányi Péter

 

A Lett Nemzeti Könyvtár által 2002. szeptember 12-13-án a lett nemzeti bibliográfia indulásának 75 éves évfordulója alkalmából rendezett, The national bibliography from print to the digital age konferencián elhangzott elõadás cikkesített változata.

 

Először is szeretném megmagyarázni a témaválasztásom: tanárként és kutatóként gyakran használom a magyar adatbázisokat, s többet alaposabban is elemeztem közülük. Egy évvel ezelőtt volt szerencsém megismerkedni a lett adatbázisokkal is. Sokat tudok a magyar adatbázisokról, de el kell ismernem, hogy a lett rendszer sokkal világosabb számomra. Hogy lehet ez?

Évek óta kutatom, hogy a magyar folyóiratcikkek hogyan szerepelnek magyar és külföldi adatbázisokban. Az elemzésükhöz nagy segítséget jelent, ha össze tudom hasonlítani a helyzetet más országokéval. A külföldi adatbázisokban való szereplést könnyű ugyanazokban a forrásokban (például a Dialog Corporation adatbázisaiban) vizsgálni. A magyar adatbázisokat más országok saját adatbázisaival, például a nemzeti bibliográfiai adatbázisokkal lehet összevetni, így ilyenekre szerettem volna példákat találni.

Voltak országok, ahol azt mondták nekem (például 2001 januárjában Belgiumban), hogy a cikkek feldolgozása nem része nemzeti bibliográfiai rendszerüknek, csak a könyveké és a periodikumoké. Azok a cikkek, amelyek fontosak, megtalálhatóak a nemzetközi adatbázisokban. Úgy tűnt, nem értették meg, vagy nem akarták megérteni a kérdésemet.

Csaknem feladtam a reményt, amikor néhány nappal később, 2001 februárjának elején Rigába utaztam, és az Orvosi Akadémia Könyvtárában alkalmam volt látni a nyomtatott lett nemzeti bibliográfiát (Latvijas Preses Hronika, The Latvian Press Chronicle), s ezen belül a bibliográfia terjedelmének többségét kitevő részt, amelyben a folyóiratok és újságok cikkei találhatók. Azt gondoltam, végre megtaláltam azt, amit már olyan régen kerestem. Majd ezután abban a szerencsében volt részem, hogy ellátogathattam a Lett Nemzeti Könyvtár Bibliográfiai Intézetébe, ahol találkoztam Anita Goldbergával, az intézet vezetőjével, a könyvtár igazgató-helyettesével, s kaptam tőle két füzetet (inkább kötetet) a nemzeti bibliográfiából.

Miután hazatértem, összehasonlítottam a Magyar Nemzeti Bibliográfia megfelelő részeivel (és részben más szakbibliográfiákkal), az észrevételeimről cikket írtam, s mivel az egyik bibliográfiában megtaláltam Anita Goldberga két konferencia-előadását, amelyekből többet lehet megtudni a lett nemzeti bibliográfia helyzetéről és a vele kapcsolatos jövőbeni tervekről, lefordítottam őket egy cikké olvasztva össze, s mindkét írás megjelent a Könyvtári Figyelő 2001. 1. számában. (Szövegük elolvasható a hálózaton is az alábbi címen: http://www.oszk.hu/kiadvany/kf/2001/1/goldberga.html

Anita Goldberga: Nemzeti bibliográfia Lettországban: hagyomány és változás. Szemle.

http://www.oszk.hu/kiadvany/kf/2001/1/muranyi.html

Murányi Péter: Kis lett-magyar komparatisztika. A nemzeti bibliográfiák (főleg a cikkanyag feltárásának) összehasonlítása. A lett hallgatóságnak természetesen megmutattam a cikkek angol nyelvű referátumainak elérhetőségét is.)

Később volt alkalmam arra is, hogy a lett adatbázisokkal is megismerkedjem. Most szeretném bemutatni megfigyeléseim eredményeinek egy részét. A lett adatbázissal kezdem, majd összehasonlítom a hazaiakkal.

A lett adatbázisok a http://fikuss.lanet.lv:4505/ ALEPH0/con-lng/eng címen érhetőek el. Az adatbázisok közül a két legfontosabb a könyveket és a periodikumokat tartalmazó Data Base of National Bibliography Monographies and Serials és a Data Base of National Bibliography Analytic, amelyből az időszaki kiadványok cikkei kereshetők vissza. (Az adatbázisok mind lettül, mind angol nyelven kereshetők, de az egyszerűség kedvéért itt az angol nyelvű címekre fogok utalni). Ez az utóbbi adatbázis nemcsak a nyomtatott Lett Nemzeti Bibliográfia említett részét tartalmazza, hanem a külföldi időszaki kiadványokban Lettországgal kapcsolatos anyagot is (lettül Letika), de ez természetesen kisebb részét teszi ki.

A Magyar Nemzeti Bibliográfia esetében a dokumentumok három típusa (monografikus művek, periodikumok és cikkek) három külön adatbázisban található:

A három adatbázis együtt jelenik meg az Országos Széchényi Könyvtár által készített Magyar Nemzeti Bibliográfia CD-ROM-on, évente két alkalommal.

 

A cikkek számának évenkénti megoszlása az adatbázisokban

Ha megnézzük a lett Data Base of National Bibliography Analytic és a magyar IKER adatbázisba 1991 és 2002 között évenként bekerült tételek számát, akkor már azt gondolhatjuk, hogy feladatom nem egyszerűen csak a két adatbázis összehasonlítása lesz (ld. 1. táblázat).

1. táblázat
A rekordok száma a két adatbázisban (ezrekben, kerekítve)

  1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
National Bibliography Analytic (lett) 20 23 23 34 37 25 91 108 112 107 107 59
IKER adatbázis (magyar) 3 12 17 15 12 11 10 11 11 11 3 -

 

A 2002-es adatokhoz a Data Base of National Bibliography Analytic használatával jutottam, a korábbi adatok Anita Goldberga információinak köszönhetők.

A helyzet nem olyan rossz (magyar szempontból), mint ahogy az első pillantásra látszik. Az IKER adatbázist 1993 óta építik, ez magyarázza az 1991-es év alacsony adatait. Az 1992-es, viszonylag magas számok a feldolgozás és a megjelenés éve közötti különbségből adódnak.

Másrészt a nyomtatott bibliográfia nem tartalmaz minden szakterületet. 1946 óta jelent meg, az 1980-as évek elejétől nem tartalmazza az alkalmazott tudományok (az ETO 6-os főosztálya) anyagát, ezeknek a szakterületeknek (műszaki tudományok, orvostudomány, mezőgazdaság) saját szakbibliográfiái (most már adatbázisai is) vannak. Az Időszaki Kiadványok Repertóriuma alcíme ekkortól Társadalomtudományok, természettudományok, az említett 6-os kivételével az ETO minden főosztályát tartalmazva.

Az alkalmazott tudományok adatbázisai

http://sunny.medinfo.hu:8082/cgi-bin/w1.sh

http://www.omgk.hu/

- telnet://193.224.162.57 - telnet://atlas.omgk.hu

A legfontosabb különbség az, hogy a korábbi adatbázis tartalmazott külföldi cikkeket is (és kisebb részben más dokumentumtípusokat), az új adatbázisban csak magyar anyag van, a cikkek mellett konferenciaköteteket is analizálnak, s a korábbinál több időszaki kiadvány feldolgozását tervezik.

Ez már négy adatbázis, s ez még nem minden!

1994-ben Vajda Erik publikált egy érdekes tanulmányt Időszaki kiadványok válogatott cikkeinek online adatbázisa kooperációs partnerek együttműködésével (megvalósíthatósági tanulmány) (Bp. OSzK - KMK, 1994.57.p.) címmel.

A könyv referátuma szerint "az időszaki kiadványok válogatott cikkeinek kooperációs partnerek együttműködésével létrehozott adatbázisa valós használói igényeken alapszik, s mind szervezetileg, mind technikailag megvalósíthatónak látszik."

A tanulmány 34 általános és szakbibliográfiát sorolt fel, amelyek elsősorban cikkeket tartalmaztak. Abban az időben ezek közül csak egy volt géppel olvasható adatbázis (a PRESSDOK, akkor floppy-újságként). Az összes többi nyomtatott bibliográfia volt, ezekből 9 készült már adatbázisból. A 4 korábban említett adatbázis (IKER és a három alkalmazott tudományi) nyomtatott változata mellett további 8 mai adatbázisé található meg a listán a társadalom- és humán tudományok köréből. Így már 12 (a műszakiakat külön számítva 13) önálló adatbázisunk van.

Van azonban egy Jogi adatbázis, amelynek anyagát szintén az Országgyűlési Könyvtár munkatársai állítják össze, de amelynek válogatott anyaga szélesebb körben egy másik CD-ROM-on, a Complex CD Jogtáron férhető hozzá.

Ez így összesen 12 (13) magyar adatbázis, amelyet össze kell és lehet hasonlítani az egyetlen lettel, a Data Base of National Bibliography Analytickel.

2. táblázat
A rekordok száma a magyar adatbázisban 1991- 2002

 

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

IKER (internet változat)

2628

12302

16863

15328

12391

10678

9968

10539

11228

10798

2886

-

MOB (orvostudomány)

3755

3993

3961

3929

4244

5357

7643

5915

5692

5758

6249

?

MAB (mezőgazdaság)

9677

8496

6899

8077

9521

10224

9262

7604

6975

3720

2750

7

CIKK (műszaki)

1

216

2285

10768

11238

12689

13160

13872

13973

13673

6801

-

MMR (műszaki)

 

 

 

 

 

 

 

5

19

34

843

1735

MANCI (könyvtártudományi)

1256

1301

1459

1514

1359

1419

1384

1522

1666

1820

1543

-

Nemzetiségi

32

4537

8077

7950

5146

4617

4952

5016

4853

5455

4441

977

Műfordítás

1205

1383

1293

1214

1106

1382

1447

1477

1676

1254

1006

76

PAD (pedagógia)
(Internet változat)

?

?

?

39 ?

168 ?

2603

3389

3250

3534

3376

901

-

Irodalmi

566

679

4072

2890

2630

2232

1878

1172

1525

625

-

-

Szociológiai

3075

3570

3002

4075

3838

2414

3012

2198

1135

544

-

-

PRESSDOK

37951

44751

62258

67159

68626

77994

78606

73274

68743

57640

56897

28613

Jogi

 

 

 

9248

1473

2351

2130

2300

2224

2373

2339

1262

Összesen

60146

80929

110169

132191

120980

138960

134851

127084

122243

106070

86456

32670

A PRESSDOK nélkül

22195

36178

47911

65032

52354

60966

56245

53810

63500

48430

29589

4087

Megjegyzések:

MOB: az adatok Szekeres Zsuzsa: A Magyar Orvosi Bibliográfia (MOB) helyzete és jelentősége a hazai szakirodalmi tájékoztatásban c. cikke alapján:

http://www.medinfo.hu/forum/szekeres_MOB.htm, mert az adatbázis nem kereshető a kiadás éve szerint.

CIKK adatbázis: az adatbázist 2001 végén lezárták, ezért nem lehetnek benne 2002-es rekordok.

PAD: 1991 és 1995 között is 2-3000 között lehet évente a magyar cikkeket tartalmazó rekordok száma, de ezek nem kereshetőek.

Irodalmi, szociológiai: A Fővárosi Szabó Ervin Könyvtár adatbázisait 2000-ben négy alkalommal jelentették meg, a 2001-es várhatólag hamarosan megjelenik. A szociológiai adatbázisnak angol nyelvű változata is van.

Jogi adatbázis: Minden 1994-ben és azelőtt megjelent dokumentum úgy kereshető, mintha 1994-ben publikálták volna.

CIKK, MANCI, PAD: az adatbázisokban több rekord található, a táblázatban csak a magyar cikkek rekordjainak száma található.

1. ábra
A rekordok száma a magyar bibliográfiai adatbázisokban 1991-2002

2. ábra
A rekordok száma a PRESSDOK-ban és a többi magyar bibliográfiai adatbázisokban 1991-2002

3. ábra
A rekordok száma a lett adatbázisban (DataBase of National)
Bibliographic Analytic) és a 13 magyar adatbázisban 1991-2002 augusztus

 

Néhány szempont, amelyet érdemes megfontolni, amikor adatbázisokat akarunk értékelni

A világ leghíresebb on-line szolgáltatója, a Dialog létrejöttének 30. évfordulóján Roger K. Summit összegezte, hogyan határozták meg a rendszer megtervezésének prioritásait 1966-ban. Nagy szerencsémre ezt a részt Roboz Péter is fontosnak tartotta kiemelni a TMT Hírek rovatában a 2002. 11-12. számban, így saját fordításom helyett az ő értő tolmácsolásában idézhetem:

(Eredeti forrása: The birth of online information access, dr. Roger K. Summit remembers how it all began. = Dialog Magazine, June 2002, p. 7., Idézi: Harmincéves a Dialog. = TMT, 2002/10-11. sz. 455.p.)

Bár ezek a követelmények 36 évvel korábbról származnak, nem lehetünk biztosak abban, hogy valamennyi mai adatbázisunk eleget tesz mindegyiknek.

A magyar Jacsó Péternek (a Hawaii Egyetem professzorának, akit ebben az évben választottak be az Internet könyvtárosok hírességek csarnokába (Internet LIBRARIAN Hall of Fame http://www.rlc. dcccd.edu/lrc/jacso.htm) több rovata közül az egyik Savvy searching címmmel az Online Information Review (korábban Online & CD-ROM Review) című folyóiratban jelent meg. Ennek cikkei közül kiválasztottam néhányat, amelyek legszorosabban kapcsolódnak témánkhoz, s megpróbáltam a cikkek referátumából kiválasztott, általam fontosnak tartott mondattal érzékeltetni tartalmukat.

(Már az előadás után sikerült hozzájutnom Jacsó Péter Content evaluation of textual CD-ROM and Web databases című, 2001-ben megjelent könyvéhez. Ha már korábban találkoztam volna vele, ezt idézem Rigában. A magyar adatbázisok készítőinek és használóinak is sokat jelenthetne, ha eredetiben vagy magyarul megismerkedhetnének vele. Addig a http://www.hawaii.edu/~jacso/ cím alatt többek között a könyvre alapozott tantárgy (LIS 694 Evaluating Digital Information Resources) anyagát érdemes tanulmányozni.

Mindaz, amit a hosszú évek kutatómunkájára alapozott, az elemzési szempontokat rendkívül sok gyakorlati példával illusztráló könyv alapján neves nemzetközi adatbázisokról megtudhatunk, némileg megértőbbé teszi az embert a magyar adatbázisok esetleges hibái iránt.)

 

A Data Base of National Bibliography Analytic és a PRESSDOK összehasonlítása

Az adatbázisok indexlistájában gyakran megtalálhatjuk a feldolgozott források, időszaki kiadványok hosszú listáját. De a rekordok száma nem egyenletesen oszlik meg, gyakran sok olyan periodikumot láthatunk, amelyből csak kevés tétel származik, míg néhány olyan cím van, amelyekhez nagyon sok rekord kapcsolódik. Megpróbáltam ellenőrizni, mennyire igaz ez a lett cikk adatbázisra (Data Base of National Bibliography Analytic) és a legnagyobb magyar adatbázisra, a PRESSDOKra. Az eredmények a 4-7. ábrákról olvashatók le.

4. ábra
A rekordok megoszlása a Data Base of National Bibliography Analytic adatbázisban
(latin betűs periodikumok, 2002 augusztus)

5. ábra
A rekordok megoszlása a Data Base of National Bibliography Analytic adatbázisban
(cirill betűs peridikumok, 2002 augusztus)

6. ábra
A rekordok megoszlása a PRESSDOK adatbázisban 1988 - 2002 I. félév
(a maximum 1000 rekorddal szereplő periodikumok)

7. ábra
A rekordok megoszlása a PRESSDOK adatbázisban 1988 - 2002 I. félév
(az összes rekord)

Ahogy a számok mutatják, a PRESSDOK olyan adatbázis, amely méretében és kurrensségében összehasonlítható a lett adatbázissal. CD-ROM-on évente kétszer jelenik meg, de 2002-re az első lemez már megjelent, s egész 2002. június 30-ig tartalmaz rekordokat. Ez a formátum férhető hozzá a legtöbb könyvtárban, de azok, akiknek arra van szükségük, havi aktualizálást is kérhetnek.

A lett adatbázisban elkülönítettem két csoportot, a latin és a cirill betűkkel írt periodikumokat. (Ha meg akarjuk tekinteni a feldolgozott időszaki kiadványok listáját, választanunk kell a két lehetőség közül.) Mindkét esetben néhány időszaki kiadvány adta a rekordoknak több mint felét, míg nagyon sok olyan időszaki kiadvány volt, amelyből csak kevés tétel származott. Feltételezésem szerint ez főleg amiatt van, mert az adatbázisban megtalálható a patriotika anyag is, így sok olyan külföldi időszaki kiadvány, amelyből csak egy vagy néhány, Lettországgal kapcsolatos tétel származott. Meglepő módon hasonló volt azonban a helyzet a PRESSDOK adatbázis esetében. Természetesen az időszaki kiadványok teljes listájával rendelkezem, de most a lett periodikumok közül csak azokat emelem ki, amelyekből több mint 1000 tétel került, a magyar periodikumok esetében ez a szám 10.000. (Ennek a különbségtételnek az az oka, hogy a lett adatbázis esetében csak a kurrens év anyagának ilyen szempontú vizsgálatára volt lehetőségem, míg a PRESSDOK egészét, több mint 10 évet vizsgálhattam.)

A 3. táblázaton a lett közönség számára jól ismert időszaki kiadványok, napilapok szerepeltek, a 4. táblázatban található magyarokról rövid magyarázatot kellett adni számukra.

3. táblázat
8 lett időszaki kiadvány, amelyből 1000-nél több rekord szerepel a Data Base of National Bibliography Analytic
adatbázisban, 2002 augusztus

 

4. táblázat
14 olyan periodikum, amelyből több mint 10.000 rekord került be a PRESSDOK adatbázisba 2002 I.

1. Népszabadság

108.866

2. Magyar Hírlap

105.967

3. Magyar Nemzet

104.077

4. Népszava

82.899

5. Világgazdaság

54.613

6. Napi Gazdaság

45.947

7. Új Magyarország

35.446

8. Esti Hírlap

18.559

9. Napi Magyarország

17.578

10. HVG

15.446

11. Pesti Hírlap

15.295

12. Reggeli Kurír

11.320

13. Figyelő

11.200

14.Vasárnapi Hírek

11.061

Megjegyzések:

1-4.: országos politikai napilap, 5-6.: gazdasági napila- pok, 7-9. és 11-12.: megszűnt napilapok , 10. és 13-14.: hetilapok.
Az 1-6. címhez 502.339 rekord kapcsolódik az adatbázis 772.754 rekordja közül, csaknem a rekordok kétharmad része, míg az 1-14., itt felsorolt címből 638.264 rekord származik, ami már több mint 80%.

Ezeket az eredményeket összehasonlíthatjuk más adatbázisokkal. A nemzeti bibliográfiai cikk-adatbázisban (IKER) ugyanaz a három napilap található a lista élén, mint a PRESSDOK-ban (Magyar Nemzet 4676, Népszabadság 4116, Magyar Hírlap 2472), a műszaki adatbázisokban (CIKK, MMR) azok a hetilapok, amelyekkel a PRESSDOK-nál is találkozhattunk: HVG (7866, 207), Figyelő (7550, 163). Ez arra utalhat, hogy átfedés van az adatbázi- sok forrásai között. A Szociológiai adatbázisban az a társadalomtudományi havi folyóirat van az élen (Valóság, 2386), amely egyedüliként található meg mind a 13 adatbázisban. Másik oldalról azonban azt láthatjuk, hogy a többi, adott szakterületre specializálódott adatbázisban az adott terület reprezentáns folyóiratát találhatjuk a lista élén: MAB: Magyar Mezőgazdaság 7490, Irodalmi adatbázis: Élet és Irodalom 2148, Műfordítás adatbázis: Nagyvilág 4024, Nemzetiségi adatbázis: az első a Magyar Hírlap, tehát egy országos politikai napilap 2542 rekorddal, de ezt a magyarországi nemzetiségek lapjai (Neue Zeitung, Ludové Noviny) a környező országok magyar nemzetiségeinek lapjai (Új Szó, Magyar Szó) követik. PAD: Köznevelés 5293, Iskolakultúra 1553, Tanító 1514, Új Pedagógiai Szemle 1266, Jogi adatbázis: Magyar Közigazgatás 1135, Magyar Jog 1058. Bár nincsenek pontos adataink a az orvosi adatbázisról (MOB) és a könyvtártudományi adatbázisról, biztosak lehetünk abban, hogy az Orvosi Hetilapból, illetve a Könyvtári Figyelőből és a Tudományos és Műszaki Tájékoztatásból származik a legtöbb rekord, éppúgy, mint a megfelelő nemzetközi adatbázisokban (MEDLINE, LISA).

Ha a lett adatbázist képesek lennénk az ETO főosztályai, osztályai szerint felosztani (a nyomtatott bibliográfiának ez a rendszere), biztosan meg lehetne találni az egyes szakterületek legfontosabb szakfolyóiratait, de számomra ez nem lenne könnyű feladat.

Míg a magyar adatbázisban átfedésekkel találkozhatunk (ez a jelenség sokkal részletesebb vizsgálatot igényel), ezért nem adhatjuk egyszerűen össze az egyes adatbázisokban található rekordokat, másrészt viszont nagyobb annak a veszélye is, hogy kimaradnak cikkek, egy egyesített adatbázis esetében ez könnyebben elkerülhető lenne. Feltételezhető az, hogy azok a szakterületek, amelyeknek van saját szakbibliográfiájuk, amely alapján még nem készült adatbázis, kisebb súllyal vannak reprezentálva a létező adatbázisokban. A korábbiakban szó volt már a Műfordítás adatbázisról, ennek segítségével tudhatjuk, milyen versek, elbeszélések stb. jelentek meg az időszaki kiadványokban magyarul a világirodalomból, ugyanakkor nincs arra lehetőség, hogy hasonló módon megtaláljuk a magyar verseket, elbeszéléseket. Hasonló módon problémák vannak a filmkritikákkal és a színházi előadások kritikáival is. Számomra csoda volt, hogy mindezeket együtt megtalálhattam egy bibliográfiában, a Latvijas Preses Hronika-ban. Az az anyag, ami a magyar adatbázisokban található (kivéve a napilapokat), sokkal tudományosabb, kevesebb tétel származik népszerű folyóiratokból, magazinokból. Így például a Cosmopolitannek van magyar változata is, de az ebből származó nem szerepelnek (s várhatólag nem is fognak szerepelni) egyetlen adatbázisban sem (a lett adatbázisban 40 tétel is megtalálható volt a lett változatból, azóta bizonyára már több is), vagy a lett Sievite-hez (magyarul: Nő) hasonló magyar lapokból sem sokat várhatunk.

 

Az adatbázisok néhány problémája

Emlékezzünk vissza Jacsó Péter szempontjaira: böngészés, kihagyás, aktualitás (kurrens közlés) pontosság.

A lett adatbázissal kezdem. Valamikor tavasszal vált lehetővé a böngészés (és a keresés) a forrás címe alapján. Feltehetőleg a használt szoftver korlátai miatt az a helyzet, hogy ha 50-nél több tétel származik egy lapból, a pontos szám helyett csak azt látjuk, hogy 50+, s ez a keresés elvégzését teszi szükségessé minden olyan esetben, ha tudni akarjuk a pontos számot. (Ugyanez érvényes az ugyancsak ALEPH alapú magyar mezőgazdasági adatbázisra, a MAB-ra is.) Ugyancsak ilyen korlát az, hogy a keresés során néha a Too many hits (túl sok találat) választ kapjuk. Megtudhatom, a Diena című napilapnak a 2001-ből származó tételeit (mivel a 2002-ben feldolgozott tételekre lehet keresni, ez kb. 2001 utolsó hetét jelenti), de nem a 2002-eseket, mert azok száma 5000-nél több lenne. (Ha nem csak az ezévi rekordok lennének elérhetőek, hanem a teljes adatbázis, gyakrabban kaphatnánk ezt a választ.) Másrészt ez nem feltétlenül lehet probléma egy valódi kereső számára, akinek mindenképpen le kellene szűkítenie keresését, csak azoknak, akik elemezni szeretnék az adatbázist.

Nem igazán sikerült kimaradt mezőket találnom az adatbázisban, néha inkább az lehet a probléma, hogy túlságosan sok adat kereshető. Például nemcsak arra kereshetünk, hogy az időszaki kiadványnak hányadik számáról van szó, hanem valamennyi számra, ami az adott mezőben szerepel. De az már a kurrensség kérdéséhez vezet át, hogy a 144. számként 2002. augusztus 28-án több rekord volt megtalálható a Dienas Bizness című napilap augusztus 27-i, tehát előző napi számából. Elképzelhető, hogy esetleg már a megjelenés napján megtalálható volt, de számomra az is csoda lett volna, ha a következő héten, Magyarországon a következő hónapban (egyes esetekben a következő évben) találhatnék meg valamit. Mivel a rekordok pontosságával kapcsolatban nem találtam semmilyen problémát, ha bármilyen további problémát akarok említeni, már a magyar adatbázisokkal kell foglalkoznom. (De nem fogok minden problémáról beszélni, részben az időkorlátok miatt, részben más okokból.)

Az egyik legnagyobb probléma az, hogy ezek az adatbázisok olyan sok különböző programot használnak. Először azonban essen szó egy pozitív példáról. A CD-ROM-on publikált adatbázisok közül az Országos Széchényi Könyvtár (MNB CD-ROM: cikkek, könyvek, periodikumok), az Országgyűlési Könyvtár (PRESSDOK, HUNDOK), a Fővárosi Szabó Ervin Könyvtár (irodalmi, szociológiai adatbázis) adatbázisai ugyanazt a szoftvert használja, az Arcanum Adatbázis (az egyik legfontosabb magyar CD-ROM kiadó) Arctis nevű programját. Ez azt jelenti, hogy a böngészés és a keresés módszerei azonosak mindezekben az adatbázisokban (de a böngészhető és kereshető mezők különbözőek). Bármely mező kombinálható bármelyikkel (és ismételhetőek is) bármely logikai és helyzeti operátort használva. Ha a böngészés során találunk valami érdekeset, azt könnyen beemelhetjük a keresőkérdésbe. A program nagyon gyors, még akkor is, ha több százezer rekord között keresünk. Így ez sokkal rugalmasabb program, mint amit pillanatnyilag a lett adatbázisok használnak.

Ugyanakkor azonban a Jogi adatbázis, amely egy jogszabályokat tartalmazó CD-ROM-on jelenik meg, olyan logikát kell követni használatakor, amely nagyon jó lehet azokra, de szokatlan egy bibliográfiai adatbázis esetében. A Pedagógiai adatbázis (PAD) CD-ROM változata olyan DOS-os szoftvert alkalmaz, amely elég nehezen használható (a képernyő kis részén látható, nagyon kis betűkkel, nem található meg rajta az összes mező, amely az internetes változaton kereshető). Az OPKM-mel ellentétben a OIK csak egyszer jelentette meg Műfordítás és Nemzetiségi adatbázisát CD-ROM-on egy másik DOS-os szoftverrel, de ennek már a telepítése is olyan nehézségekbe ütközik, hogy azóta ebben a formában nem publikálták. A CIKK adatbázist 1995-től éveken évente kétszer kiadták CD-ROM-on MicroIsisre alapozott változatban, de a teljes (már lezárt) adatbázis most az interneten érhető el.

Az internetes változatok közül elsőként az Országos Széchényi Könyvtár adatbázisait érdemes megemlíteni. A periodikumok és cikkek adatbázisa nagyon jól összekapcsolódik, ha csak egy cikket is feldolgoztak az adott időszaki kiadványból, a periodikumok adatbázisából egy kattintással átmehetünk a másik adatbázisba és megtalálhatjuk a cikkek adatait. Ugyanakkor azonban a böngészés és a keresés funkciója nem kapcsolódik össze olyan jól, mint a CD-ROM változat esetében, be kell gépelnünk a keresőkérdésbe, amit a böngészés során találtunk. A könyvtártudományi adatbázis, a MANCI csaknem ugyanazt a szoftvert használja, de az összes kereshető mező együtt, egy indexben böngészhető, a feldolgozott források szerinti böngészés és keresés pillanatnyilag még nem lehetséges.

Az alkalmazott tudományi adatbázisok mind különböző szoftvert használnak, a műszaki adatbázisok (a CIKK adatbázis, és utódja, az MMR) lehetővé teszik a böngészést és az (egyszerű és összetett) keresést, a mezőgazdasági adatbázis, a MAB, ahogy korábban említettem, ALEPH alapú, Telnet segítségével hozzáférhető, sok lehetőség van benne, de nagyon komplikált, gyakoriak technikai hibák. Az orvosi adatbázis, a MOB az OLIB-ot használja, egy sajátos logikát kell követni (amivel más OLIB-os adatbázisokban is találkozhatunk), a mezők nem kombinálhatóak szabadon, számos mező egyáltalán nem kereshető.

A pedagógiai adatbázis internetes változata egyáltalán nem teszi lehetővé a böngészést, ezért ajánlatos a CD-ROM változattal párhuzamosan használni, mivel mindkettőnek vannak előnyei és hátrányai. A Műfordítás és a Nemzetiségi adatbázis az Országos Idegennyelvű Könyvtár Webopacjának része, egy kisebb magyar cég által kifejlesztett szoftver használva. Néha jól működik, máskor viszont több alkalmunk van a hibaüzenetekkel ismerkedni, mint az adatbázis tartalmával.

Ha az adatbázisok ugyanazt a szoftvert használnák (CD-ROM-on a három említett könyvtár adatbázisai által is használt Arctis lehetne jó megoldás, az interneten az OSZK vagy a műszaki adatbázisok által alkalmazott), másik probléma lehetne, hogy az egyes adatbázisok tárgyszavazási gyakorlata annyira különbözik, hogy nehéz elképzelni, hogy az adatbázisok összeolvaszthatóak lennének.

 

A jövő?

Sajnos, valószínű, hogy az a gondolat, amit Vajda Erik említett tanulmányának címében szerepel - Időszaki kiadványok cikkeinek online adatbázisa kooperációs partnerek együttműködésével (megvalósíthatósági tanulmány) -, most kevésbé tűnik megvalósíthatónak, mint 8 évvel ezelőtt.

De a lett példa mutatja számunkra, hogy nem lehetetlen. Gratulálunk nekik, és köszönjük, hogy némi reményt adnak nekünk. Nagyon szeretném, ha valamikor lehetőségem lenne arra, hogy a lett adatbázist az annak megfelelő, egy magyar adatbázissal hasonlítsam össze. Akkor talán az előadásom is sokkal rövidebb lehetne. Addig jobb lenne, ha önök jönnének el hozzánk megmutatni példájukat.

 

A jövő után a jelenről, amely rövidesen múlttá válik

Az előző bekezdéssel zárult a rigai előadás. A legtöbb adatbázisról (szerencsére) csak egy pillanatnyi helyzetképet lehetett felvázolni, amely a 2002 augusztus végi állapotokat tükrözi. Ezeket az adatokat nem változtattam meg, mert akkor az előadást hamisítottam volna meg. Két hónap alatt, október végéig azonban sok változás történt a magyar adatbázisokkal kapcsolatban, amelyeket érdemes megemlíteni. Az össztételszám növekedése természetesen egyes lapok feldolgozottságát is növelte, de ennek részleteibe most nem megyünk bele.

Az IKER adatbázis újabb frissítése után jelentősen nőtt a 2001-es tételek száma, 2816-ról 4051-re, s megjelentek az első 2002-es tételek is (245). Végre megjelent a Fővárosi Szabó Ervin Könyvtár adatbázisainak újabb lemeze, mind az irodalmi, mind a szociológia adatbázis tételszáma jelentősen nőtt, az irodalmi a 2000-es anyag jelentős növelése mellett jelentős számban 2001-es és 2002-es cikkeket is felvett, a szociológiai a 2000-es és azt közvetlenül megelőző évek anyag mellett az 1970-1976 közötti időszakot egészítette ki jelentős mértékben. A nemzetiségi és műfordítás adatbázisban is folyamatosan nő a tételek száma, legjelentősebb mértékben a 2002-eseké (977-ről 2368-ra, 76-ról 362-re), a PAD adatbázisban esetében pedig azt lehet meglepetéssel tapasztalni, hogy a CD-ROM-on szereplő anyag sokkal frissebb, a sokkal több 2001-es mellett (901 az interneten, 3746 a CD-ROM-on) 877 2002 is található rajta (ezek többsége magyar cikk lehet). A jogi adatbázisban természetesen csak a 2002-es tételek száma nőtt.

Az alkalmazott tudományi adatbázisok közül a mezőgazdasági sajnos régóta nem érhető el, az orvosiban nem tudunk évre keresni, de azt tapasztalhatjuk, hogy egyes folyóiratok anyagát nagyon frissen feldolgozzák. Az MMR-ben a 2002-es tételek száma megduplázódott, a 4045 tételből 3553 folyóiratcikk. Ugyanakkor az 1028 2001-esből csak 326 az , így a CIKK adatbázissal együtt az erre az évre jutó cikkek száma alig haladja meg a 7000-et, s már nem is várható nagy növekedés, míg a megelőző években mindig 13000 fölött volt, kérdés, mitől volt rosszabb év ebből a szempontból 2001.

Közben persze a lettek sem tétlenkednek, de ezt nem könnyű nyomon követni, mert (szinte) naponta aktualizálják az adatbázist, a Diena tételeinek száma 6686-ról 9140-re nőtt, s hasonlóak az arányok a többi lap esetében is. S mire ezek az adatok megjelennek, már mindez múlttá válik. Reméljük, közben napról napra minden egyre jobbá válik.

Országos Széchényi Könyvtár
Észrevételek