2003/12.

Tanulmányok

A GARFIELD-TÉNYEZŐ

Vinkler Péter

az MTA doktora, tudományos titkár,
MTA Kémiai Kutatóközpont
pvinkler@chemres.hu

A természettudományok kommunikációs csatornái között a folyóiratoknak kitüntetett szerepük van. Az elektronikus közlési formák terjedésének ellenére még ma is a nyomtatott (illetve az ezekkel azonos értékű elektronikus) folyóiratok tartalmazzák az összes új természettudományos eredményeknek mintegy 80 %-át. A különböző szakterületeken dolgozó kutatók általában jól ismerik területük folyóiratait és azok nemzetközi rangját. Nyilvánvaló, hogy egy folyóiratnak az illető szakterületen játszott nemzetközi szerepét (s így értékét, valamint használati értékét is) elsősorban a következő, egymással összefüggő tényezők határozzák meg:

• a közölt információk szakmai relevanciája (fontossága, érdekessége, gyakorlati felhasználhatósága),

• az információk újdonsága, korszerűsége,

• a közöltek szakmai színvonala.

Az 1960-as évektől kezdve a tudomány-metriával foglalkozó kutatók, a tudomány-politikusok, de elsősorban is a könyvtárosok és az informatikai szakemberek körében mind gyakrabban merült fel, szükség lenne olyan módszerekre, amelyek a folyóiratok nemzetközi hatását, szerepét objektív módon értékelik. Ennek okául itt csak egyetlen gyakorlati szempontot említek. A relatíve (de helyenként abszolút mértékben is) zsugorodó könyvtári költségvetés a nagy gyűjtemények rendeléseinek összeállításakor, az olvasók igényeinek felmérésén túl, szükségessé tette a folyóiratok valamilyen objektív mértékkel (mutatóval) történő jellemzését, hogy ennek segítségével a nemzetközileg jelentős információhordozók megvételére tudjanak koncentrálni.

Egy természettudományi folyóirat hatásának jellemzésére a benne közölt folyóiratcikkekre kapott idézetek számának alkalmazását Gross és Gross (1927) javasolta először. A nevezett szerzőpáros a Journal of the American Chemical Society című folyóiratban megjelent cikkeknek az 1871-1925 közötti időszakra vonatkozó hivatkozásait dolgozta fel, és a hivatkozott folyóiratokat gyakorisági sorba állította. Az említett szerzők tudománymetriai mutatószámként a "kapott idézetek (vagy adott hivatkozások) összes számát" használták. Nyilvánvaló, hogy annál értékesebb egy folyóirat, minél több információt tud nyújtani a kutatók számára. A különböző folyóiratok azonban eltérő számú cikket hoznak nyilvánosságra. Raisig (1960) olyan fajlagos hatásmutatók bevezetését javasolta, amelyek lehetővé teszik a különböző számú cikket publikáló folyóiratok hatásának összemérését. Ez a mutatószám az Index of Research Potential Realized (RPR) volt. Az RPR-mutató a vizsgált folyóirat egy cikkének átlagos idézettségét (idézetszám/cikkszám) adja meg. Garfield (1963) a gyakorlati tudománymetriai vizsgálatok számára is alkalmazható, szabványosított hivatkozási és publikálási időablakok segítségével számolt, egymással összemérhető folyóiratjellemzőket dolgozott ki. Az általa "hatástényezőnek" (impact factor) elnevezett mutatószámokat 1972-óta rendszeresen közzéteszik a Science Citation Index Journal Citation Reports köteteiben, illetve ma már CD-n és az interneten is. Korábban javasoltam, hogy a Garfield által kidolgozott mutatószámot, a szerző tiszteletére - tekintettel a mutató széles körű és eredményes használatára - Garfield-tényezőnek (GF-adat, GF-tényező vagy GF) nevezzék el (Vinkler, 2000).

Ismeretes, hogy a Garfield-tényezőknek számos hátrányuk van. Így például a következők:

• erős szakterületi (tematikai) függés,

• csak a folyóiratoknak egy kiválasztott körére terjed ki az adatok közlése,

• az illető folyóiratban megjelent bármely közleményre vonatkozó idézetet figyelembe vesznek, ugyanakkor a mutató kiszámításához használt tört nevezőjében csak a következő típusú írások száma szerepel: cikk, rövid közlemény, összefoglaló, levél, megjegyzés,

• egy-egy folyóiraton belül a cikkek idézettség-gyakorisági eloszlása erősen torzult,

• az idézetek közé a folyóirat, illetve a szerzők "önidézeteit" is beszámítják,

• a GF-adatok időben változnak (lásd később),

• a több szakterületű folyóiratok GF-adatai nehezen bonthatók szét szakterületek szerint.

A Garfield-tényezők fontosságát mutatja, hogy az azokkal kapcsolatos tudománymetriai kérdésekkel 2001-ben egy külön konferencia foglalkozott (Glänzel - Moed, 2002).

A különböző szakterületek és a tudománymetria kutatói a tudománymetriai mutatók közül a leggyakrabban talán a Garfield-tényezővel találkoznak. Ma már alig akad olyan pályázati kiírás, amelyben ne szerepelne a közlő folyóiratok hatástényezőinek (impact factorainak) feltüntetésére vonatkozó felszólítás. A folyóiratok szerkesztői pedig az előfizetők számának növelését vélik segíteni azzal, ha hirdetéseikben folyóiratuk viszonylagosan nagy GF-tényezőjére hivatkoznak. Éppen ezért célszerű, ha a nevezett mutató pontos leírását itt is megadjuk.

ahol GFy : az y évre számított GF-adat, Cy: az y-1 és az y-2 években megjelent cikkekre az y-évben kapott idézetek száma; Py-1 és Py-2, a megfelelő években az illető folyóiratban megjelent cikkek száma. Tehát például a Journal of Chemical Physics folyóirat 1998. évi 3,147-es GF-értéke a folyóiratban 1997-ben és 1996-ban megjelent cikkekre 1998-ban kapott 14 073 idézetnek és az említett két évben megjelent 4472 cikk számának hányadosaként adható meg.

Bár a GF-tényezővel nagyon sok cikk foglalkozik a tudománymetriai irodalomban, a mutató elvi hátterével eddig keveset törődtek. A következőkben megkísérlem, hogy az e mutatót meghatározó tényezőket felvázoljam, illetve bemutassam, hogy e sokszor pártolt és gyakran kifogásolt mutató mit is mutat valójában.

A Garfield-tényező mint idézettségi esély

A hivatkozások a tudományos cikkek fontos részét képezik. A cikkekben lévő információk csak a hivatkozásokkal együtt teljesítik azt a követelményt, hogy a leírtaknak olyan mélységű és terjedelmű ismereteket kell szolgáltatniuk, amelyeknek alapján a közöltek érthetővé és reprodukálhatóvá válnak.

A hivatkozás valószínűségi gyakoriságként is tárgyalható. Az y évben hivatkozható, egy korábbi t időszakban megjelent összes cikk számát: a

összeggel fejezhetjük ki, amelyben a pi az i-edik évben, Pt az i = 1-től (y-1) - évig megjelent összes cikk száma. Az y évben ténylegesen bekövetkező hivatkozási események száma, Ry(t) megadható az adott évi (y) hivatkozó közleményekben lévő, a kiválasztott időszakra (t) vonatkozó hivatkozások átlagos számának, ry(t) és az adott évi közlemények számának (Py) szorzataként (ry(t) · Py). Az előzőeknek megfelelően y évben az ezt közvetlenül megelőző t időszakban megjelent cikkekre vonatkozó idézettségi esély, CCy(t) a következő egyenlettel számolható:

Mivel azonban egy kiválasztott folyóirathalmazra vonatkozóan a kapott idézetek száma, Cy(t) megegyezik az adott hivatkozások számával, vagyis

és ha a t időszak az y évet megelőző két évre vonatkozik: Pt=Py-1+Py-2, akkor a 3. egyenletet az 1-be helyettesítve a 4-et kapjuk, ami megegyezik a 2. egyenlettel:

A fentiek szerint tehát bizonyítottuk, hogy egy adott szakterület folyóirataiban lévő cikkek átlagos idézettsége (azaz Garfield-tényezője) a cikkek átlagos idézettségi esélyével azonos.

A Garfield-tényező és a relatív publikációs növekedés

A tudományos ismeretek gyarapodását a tudománymetria - közelítésként - a folyóirat-cikkek számának növekedésével írja le. A növekedést lineáris, exponenciális és logisztikus függvények segítségével adják meg. A leggyakrabban az egy adott időpontig megjelent cikkek számának megkétszerezéséhez szükséges évek számával jellemzik a növekedés ütemét (kétszerezési idő). E leíráshoz általában a cikkeknek az adott időpontig halmozott (összegzett) számát veszik figyelembe, s nincsenek tekintettel arra, hogy a korábbi évek cikkeinek egyre jelentősebb hányada már nem releváns, mert a bennük lévő információk elavultak. A tudomány fejlődése nem írható le kizárólag a publikációk számának növekedésével. Az új tudományos ismereteknek számos értékelési és módosulási folyamaton kell keresztüljutniuk ahhoz, hogy elérhessék az illető szakterület mértékadó szerzőinek kognitív konszenzusát, és ezáltal beépülhessenek egy-egy szakterület alapvető tudományos ismeretei közé. A tudománymetria azonban elsősorban a cikkek számának növekedésével, illetve az információk avulásának figyelembevételével képes az információk relatív gyarapodását jellemezni.

A folyóiratcikkek relatív gyarapodásának jellemzésére a következő egyenlet ajánlható (Vinkler, 2000):

ahol RPGy(t) az y évben a t megelőző időszakra vonatkoztatott relatív publikációs növekedés (RPG), Py az y évben, pi az i-edik évben megjelent cikkek száma, a t időszak i = 1-től (y-1)-ig tart.

Az RPG-mutatókat előnyösen 2, 5, 10, 17 és 25 évnyi korábbi időszakokat figyelembe véve számíthatjuk ki. Az említett időszakokban megjelent cikkeket tekinthetjük ugyanis azoknak a korszerű, (különböző, itt nem tárgyalható szempontok szerint) releváns ismereteket hordozó információs halmazoknak, amelyek az új tudományos információk előállításához szükséges ismereteket tartalmazzák. A korszerű, releváns ismereteket felölelő időszakok hossza szakterületenként és témánként erősen változik. Tekintsük azt az esetet, amikor ennek az időszaknak a hossza: t = 2 év. A 4. egyenletből fejezzük ki Py-t:

így az 5. egyenletből a következőképpen kaphatjuk Py-t:

A 6. és 7. egyenlet összevetéséből adódik:

azaz

Tehát a Garfield-tényező (amit itt egy szakterület összes folyóiratának átlagaként, mintegy erre a "metafolyóiratra" vonatkoztatott jellemzőt értelmezünk) a relatív publikációs növekedésnek (5. egyenlet) és a folyóiratcikkekben lévő hivatkozások átlagos számának szorzataként adható meg. A 8. egyenletből következik, ha a cikkek relatív száma időben növekszik (nő az RPG-adat) és a hivatkozások száma időben konstans vagy szintén nő, akkor a Garfield-tényező, s így a cikkek idézettségének esélye is növekedik (Vinkler, 2002).

Huszonhét kémiai folyóirat esetében vizsgáltam a cikkenkénti hivatkozások számának (r) időbeni gyarapodását. Megállapítottam, hogy 1983-ban r = 23,55 (szórás = 7,08), 1995-ben r = 29,76 (szórás = 8,34) volt.

Tíz kémiai törzsfolyóirat esetében 1980-1998 között a cikkenkénti hivatkozások évenkénti száma és az eltelt évek közötti Pearson-féle korrelációs együttható: r = 0,94; p < 0,05. A relatív publikációs növekedést, RPG(2), több adattár összefoglalóinak esetében vizsgáltam. Megállapítottam, hogy például a Chemical Abstracts (1962-1993 között): 0,53 (szórás: 0,03), az Inspec Section A (1980-1998 között): 0,52 (szórás: 0,02), a Biological Abstracts (1964-1993 között): 0,53 (szórás: 0,05) értékű növekedést mutat. Megemlítendő, hogy kisebb tematikai egységek szintjén más a helyzet. Egyes gyorsan fejlődő témák, szakterületek lényegesen nagyobb RPG(2) adatokat mutatnak. Így például az "enantioselective", az "antisense" és a "nanocomposite(s)", kulcsszavak segítségével körülhatárolt témák RPG(2)-mutatója 1987-1996 között rendre 0,603; 0,804; 1,257 volt. Az említett adatokból arra lehet következtetni, bár az információk relatív gyarapodása (RPG) viszonylag csekély mértékű (így van ez, ha akár öt, akár tíz év hosszúsági relevanciaidővel számolunk), de a hivatkozások átlagos számának nagy mértékű növekedése miatt a Garfield-tényezőknek időben növekedniük kell. S valóban, ötvenöt kémiai folyóirat átlagos hatástényezője 1982-1996 között az évek függvényében vizsgálva szignifikáns korrelációt mutatott (r = 0,76; p < 0,05) (Vinkler, 1999). Hasonló eredményre jutott Klaic (1999) a Science Citation Indexben referált összes folyóirat GF-adatainak elemzésekor.

Természetesen az egyedi folyóiratok esetében számos körülmény befolyásolja a GF-tényező mértékét, illetve változását a közölt információk értékén és használati értékén túlmenően is (így például szekciókra való bontás, az összefoglalók, cikkek, rövid közlemények arányának vagy a folyóirat profiljának megváltozása stb.).

A Garfield-tényező jelentése

A tudománymetria a folyóiratok nemzetközi hatásának értékelése céljából viszonylag kevés jellemző tudománymetriai elemet választhat. Azt a közelítést bizonyítás nélkül, tapasztalati alapon is elfogadhatjuk, hogy a folyóiratok használati értékével az illető folyóiratok cikkeire vonatkozó hivatkozások arányban állnak, s általában igaznak tarthatjuk, hogy a folyóiratok információinak mennyiségét a közölt cikkek számával jellemezhetjük. A bizonyítás érdekében kénytelenek vagyunk elfogadni azt az egyszerűsítést is, hogy a "cikk" - összefoglaló, rövid közlemény, "standard" cikk (article), megjegyzés (note), levél (letter) is lehet, s ebben a megközelítésben az idézet is független a megjelenés helyétől, az idéző személytől stb. Tehát mindkét esetben a cikk, illetve az idézet a mérés tudománymetriai egységének tekintendő.

Ha folyóiratoknak egy tetszőleges halmazát tekintjük, a halmazt alkotó összes folyóirat által kapott összes idézetet az adott információs halmaz összesített hatásaként értelmezhetjük. Az egyes folyóiratoknak (cj a j-edik folyóirat által kapott idézetek száma) az összesített hatáshoz (CJ a J számú folyóirat által kapott összes idézet) való százalékos hozzájárulását (cj%) a következőképpen fejezhetjük ki:

Egy-egy folyóiratnak (pj: a j-edik folyóiratban megjelent cikkek száma) a halmaz egészéhez (Py) való százalékos hozzájárulása (pj %) a következőképpen adható meg:

A 10. és 11. egyenlettel kifejezett részesedési mutatók hányadosaként egy új, a folyóiratok fajlagos hatáshozzájárulásának (FH) elnevezett mutatóhoz juthatunk:

Tekintsük át a mellékelt táblázatot, ami néhány jellemző fizikai-kémiai folyóirat megfelelő tudománymetriai adatait mutatja. A táblázatból világossá válik a Journal of Physical Chemistry-US   és a Journal of Chemical Physics   kitüntetett szerepe az illető szakterületen. Normáljuk a GF- és az FH-adatokat a táblázat folyóiratainak megfelelő átlagértékre (GF-átlag: 2,451, szórás: 0,836; FH-átlag: 0,843, szórás: 0,287). A táblázat utolsó két oszlopa mutatja, hogy a két adatsor (az átlagokkal való osztás eredményeként, a kerekítéséből adódó eltéréseket nem tekintve) azonos.

A GF- és az FH-adatok arányainak a táblázat szerinti azonossága matematikailag könnyen bebizonyítható.

Következtetések

A tárgyalt eredmények megerősítik Garfield (1963, 1979) feltételezését, amely szerint a folyóiratok Garfield-tényezőjének (impact factorának) meghatározásában, a tudományos szempontokon kívül, az illető szakterület folyóirataiban lévő hivatkozások cikkenkénti átlagos száma játszik döntő szerepet. A dinamikusan fejlődő kisebb szakterületek, témák szintjén viszont jelentős hatású a relatív publikációs növekedés (RPG) befolyása is (lásd a korábbi megjegyzést egyes témák RPG(2)-adatának mértékéről). A vizsgálatokból kiderült, hogy a folyóiratok GF-adata rövid időtartamokon belül (< 7 év) viszonylag állandó, de hosszabb idő alatt általában fokozatosan növekszik. Ez a tény arra mutat, jóllehet a cikkenkénti idézetek száma egy-egy folyóiraton belül heterogén eloszlású, mégis az egyes folyóiratok, illetve a folyóiratok egymáshoz viszonyított nemzetközi súlya viszonylag állandó. Ha ugyanis az egyes cikkek eltérő idézettségének jelentős szerepe lenne, akkor az egyes folyóiratok GF-adata évről évre extrém módon ingadozna.

A közölt eredmények lényeges következménye, hogy a GF-értékeket nem foghatjuk fel többé úgy, mint a folyóiratok cikkeire vonatkozó "átlagos idézettség" mérőszámait, mint olyan adatokat tehát, amelyek a folyóiratok "átlagos cikkeinek" hatására utalnak. Ezzel szemben, mivel a Garfield-tényezőknek és a fajlagos hatáshozzájárulásoknak (FH) az arányai azonosnak bizonyultak, állíthatjuk, hogy a GF-adatok magukra a folyóiratokra, mint a tudományos ismereteket tartalmazó cikkek információs csatornáira, azok egészére jellemzőek.

1. táblázat • A fizikai kémia reprezentatív folyóiratainak néhány tudománymetriai adata. A Garfield-tényezők és a fajlagos hatáshozzájárulások azonossága

Ha az idézeteket, mint a hatás tudománymetriai jellemzőjét elfogadjuk, és feltételezzük, hogy bizonyos határok között a hatás az idézetek számának lineáris függvénye, akkor megállapíthatjuk, hogy egy jól körülhatárolt tematikai területhez tartozó folyóiratok Garfield-tényezői tudománymetriai értelemben megfelelően jellemzik az illető közlési csatornák nemzetközi hatásának mértékét. Természetesen alapvetően fontos, hogy sikerüljön megfelelő módszerekkel az egyes témák, szakterületek kijelölése (a többi témától, szakterülettől való elkülönítése) és ehhez a megfelelő folyóirathalmazok hozzárendelése.

Több egyszerű és bonyolultabb módszertani kérdést kell még megoldani ahhoz, hogy azok az impact factor   jegyzékek, amelyek a Journal Citation Reports -ban olvashatók, valóban mind elméleti, mind gyakorlati szempontból a szaktudományok kutatói és a tudománymetriai szakemberek számára egyaránt megfelelően tükrözzék a folyóiratok nemzetközi hatásának mértékét. A tudománymetria az információs források hatásának jellemzésére az idézeteken és a cikkeken kívül aligha tudhatna más tudománymetriai elemet felajánlani. Ezért nagy valószínűséggel állíthatjuk, hogy az adatokon és a számítási módszereken javíthatnak a jövőben, de alapvetően a Garfield-tényező vagy ehhez hasonló mutatószám marad még hosszú ideig az, amit a folyóiratok nemzetközi hatásának mutatójaként használhatunk.

Megjegyzendő az igen gyakori nézetekkel szemben, hogy a kutatási eredmények nemzetközi hatásának mérésére a GF-adatok önmagukban nem alkalmasak. A cikkeket közlő folyóiratok GF-értékeinek (a megjelentetett cikkek számával súlyozott) átlaga az illető szerzők publikációs stratégiáját, de nem a közölteknek a kutatásokra gyakorolt hatását méri. A Garfield-tényező ugyanakkor az egyes folyóiratok számára közvetlen hatásjellemzőként (hiszen az idézeteket veszi figyelembe) értékelendő.

Kulcsszavak: hatástényező, tudománymetria, idézettség, tudományos folyóiratok

IRODALOM

Garfield, Eugene - Sher, Irving H. (1963): New Factors in the Evaluation of Scientific Literature Through Citation Indexing. American Documentation. 14. 195-201.

Garfield, Eugene (1979): Citation Indexing. Its Theory and Application in Science, Technology and Humanities. Wiley, New York

Gross, P. L. K. - Gross, E. M. (1927): College Libraries and Chemical Education. Science. 66. 385-389

Glänzel, Wolfgang - Moed, Henk F. (eds.) (2002): Journal Impact Measures, Selected Papers of the Special Day Session at the 8th International Conference on Scientometrics and Informetrics. Scientometrics. 53, 2. 171-193

Klaic, Branimir (1999): The Use of Scientometric Parameters for the Evaluation of Scientific Contributions. Collegium Antropologicum. 23. 751-770

Raisig, M. L. (1960): Mathematical Evaluation of the Scientific Serial. Science. 131, 1417-1419

Vinkler Péter (1999): Ratio of Short Term and Long Term Impact Factors and Similarities of Chemistry Journals Represented By References. Scientometrics. 46. 621-633

Vinkler Péter (2000): Publication Velocity, Publication Growth and Impact Factor. An Empirical Model. In: Cronin B., Atkins H. B. (eds.): The Web of Knowledge. ASIS Monograph Series, Information Today Inc. Medford, New Jersey 163-176

Vinkler Péter (2002): Dynamic Changes in the Chance for Citedness. Scientometrics. 54. 421-434


<-- Vissza az 2003/12. szám tartalomjegyzékére