Nyomtatóbarát változat: Országos Közoktatási Intézet > Új Pedagógiai Szemle 2002 február > Hazai és nemzetközi törekvések az iskolai értékelés rendszerében

Halász Gábor

Hazai és nemzetközi törekvések az iskolai értékelés rendszerében

A szerző áttekintést ad azokról a vitákról, dilemmákról, amelyek ma a fejlett országokban érzékelhetőek a standardizált tesztekkel történő értékeléssel kapcsolatban. Kísérletet tesz magának a fogalomnak a meghatározására, továbbá elemzi az értékelés társadalmi-politikai környezetét. Feltárja, hogyan hat vissza az értékelés a tanulásra és a tanulási környezet alakítására.

Előadásom célja betekintést adni azokba a vitákba, dilemmákba és fejlődési trendekbe, amelyek ma a tanulmányi teljesítmények standardizált tesztekkel történő értékelését kísérik a fejlett országokban. Szólnék arról, hogy mi jellemzi ma a közoktatási értékelési rendszereket és az ezekben zajló folyamatokat, majd az értékelés társadalmi-politikai környezetéről, amely a szakmai meghatározottságokon túl e folyamatra hatást gyakorol. Ezt követően az értékelés és a tanulás reformjáról beszélnék, arról, hogy milyen módon befolyásolhatja az értékelés adott rendszere a tanulás és a tanulási környezet átalakítását. Végül pedig néhány következtetést szeretnék levonni.

Természetesen egy rövid előadás keretében legfeljebb néhány szilánkot tudok felvillantani az értékelés, az értékelési rendszerek hallatlanul gazdag világából. Ezekről azonban azt gondolom, hogy érdekesek, fontosak lehetnek a Magyarországon elindult mérési kezdeményezés alaposabb végiggondolása szempontjából. Végignézve azokat a fejlődési folyamatokat, amelyek e területet ma jellemzik, az a határozott benyomás alakult ki bennem, hogy csak a deklarált célokról és azokról az eseményekről tudok beszélni, amelyek már lezajlottak, hiszen még nem tudhatjuk, hogy mindez milyen irányba fog továbbfejlődni: egyértelműen a progresszív nemzetközi trendekhez illeszkedik-e, tükrözve a magyar mérési-értékelési szakértők és szakértelem nemzetközi tekintetben is magas színvonalát.

Az értékelési-mérési rendszerek jellemzői

Ha meg akarjuk érteni a kialakulóban lévő magyarországi mérési rendszer sajátosságait és fel akarunk készülni mindazokra a jövőbeni kihívásokra, amelyek egy ilyen rendszerrel szükségképpen együtt járnak, érdemes pillantást vetni arra, hogy milyen kezdeményezések jelentek meg másutt, és hogy ezek milyen problémákat vetettek fel. A fejlett világ oktatási rendszereiben ma megtalálható értékelési rendszereket többféle dimenzió mentén jellemezhetjük. Most – csupán a témáról való gondolkodásunk segítésére – három olyan dimenziót emelek ki, amelyek a ma zajló viták fényében jelentősnek tűnnek. Az első dimenzió az értékelésbe bevontak körére vonatkozik. Itt az a kérdés, vajon a standardizált tesztekkel történő értékelés teljes körű-e, vagyis egy-egy populáció, egy-egy életkori csoport vagy évfolyam teljes köre kötelezően vesz részt ezekben, vagy részleges, önkéntes részvételen vagy mintavételen alapuló értékelésről van szó. A második dimenzió arra vonatkozik, hogy az értékelés fejlesztő, támogató céllal folyik-e, vagy pedig elszámoltató, minősítő funkciója van. A harmadik dimenzió, amely mentén jellemezni lehet e rendszereket, hogy az értékelés eredményei az egyes intézményekre, azaz mikroszintre irányulnak-e, vagy az oktatási rendszer egészére, esetleg nagyobb regionális egységekre. Természetesen egyéb dimenziókat is el lehet képzelni, de talán ma ez a három a legfontosabb abból a szempontból, hogy egy-egy ország értékelési rendszerét megítéljük.

Öt ország (Hollandia, az Egyesült Királyság, Új-Zéland, Svédország és Franciaország) kialakulóban lévő vagy már működő értékelési-mérési rendszerét néztem át ebből a szempontból, és vetettem össze a most elinduló magyarországi kezdeményezéssel (1. táblázat).

1. táblázat  A standardizált tesztekkel történő értékelés jellegzetes típusai néhány országban

Ország A részvétel köre A mérés célja Az értékelés szintje
  teljes részleges fejlesztés ellenőrzés egyes iskolák is csak régiók, a rendszer egésze
Hollandia
X
X
X
X
Egyesült Királyság
X
X
X
X
Új-Zéland
X
X
X
X
Svédország
X
X
X
X
Franciaország
X
X
X
Magyarország
X
X
X

Ha a részvétel körét nézzük, akkor azt látjuk, hogy az itt felsorolt országok közül Magyarországgal együtt négyben a tanulók teljes körére kiterjed a kötelező tesztelés. Hozzáteszem, nagyon kevés olyan ország van ma a világban, ahol a tanulók teljes körére kiterjedő tesztelés folyik. Ebben a csoportban két olyan ország van, ahol vagy mintavételen, vagy önkéntes részvételen alapul a tesztelés: ezek Hollandia és Új-Zéland. Bár Új-Zélandban létezik egy nagyon erős kormányzati elkötelezettség arra, hogy a tesztelésben való részvételt teljessé és kötelezővé tegyék, de erről hosszú, elhúzódó társadalmi-szakmai vita folyik, amelynek még nem jutottak el arra a pontjára, hogy ezt a kormányzati szándékot érvényesíteni tudnák (Hattie 2001).

A mérés célját tekintve, tehát azt, hogy fejlesztő-támogató vagy ellenőrző-minősítő rendszerről van-e szó, azt tapasztaljuk, nincs olyan ország, ahol a fejlesztés, a támogatás ne jelenne meg célként. Az itt felsoroltak közül az Egyesült Királyság az egyetlen, ahol a minősítés, a külső ellenőrzés a fő cél, és emellett alárendelt, másodlagos célnak tekinthető a fejlesztés. A vizsgált intézmények ellenőrzése vagy minősítése az itt bemutatott országok közül egyedül Franciaország esetében nem jelenik meg, illetve a magyarországi mérések deklarált céljait tekintve nálunk sem.

Végül, ami az értékelés szintjét illeti, az itt felsorolt országok között egyetlenegy olyan van – és ez nem független az előző dimenziótól –, ahol a tesztekkel történő értékelést egyes konkrét iskolák minősítésére használják. A többi itt felsorolt országban ilyen nem történik, csupán egyes régiókra vagy a rendszer egészére vonatkozó értékelés zajlik. Ez egyébként eleve következik abból, ha a központi szintre csak mintavételes úton jutnak el teszteredmények.

Eltérő paradigmák, vitatott kérdések

Az angol mérési rendszer sok szempontból egyedülálló, amely számos országra talán a legnagyobb hatást gyakorolta, és egyúttal az elmúlt években a legtöbb vitát is kiváltotta a nemzetközi szakmai közösségen belül. Ez volt az egyik első, általános – azaz egy-egy évjárat valamennyi tanulójára kiterjedő és kötelező – tesztelésen alapuló mérési modell, amely egyébként az 1988-ban elfogadott angol nemzeti alaptantervhez kapcsolódva jött létre. Nem beszélnék róla részletesen, de egyetlenegy olyan mozzanatát szeretném megmutatni, amely jól jellemzi azt a jellegzetes mérési paradigmát, amelyet ma tulajdonképpen egyedül ez a modell képvisel.

A 2. táblázat olyan adatokat tartalmaz, amelyeket az internetről ma bárki letölthet. Azt mutatja, hogyan teszik közzé az angolok az egyes iskolák teljesítményadatait. A legfontosabb, hogy az iskolák szintjén aggregálják, azaz összesítik a tanulói teljesítményeket mutató pontszámokat, így iskolaszintű mutatókat kapnak. Az itt látható táblázat első sora az adott régiónak vagy körzetnek az átlageredményeit mutatja, a második sor pedig az országos átlageredményeket. Az ezek alatt látható három sor három általam kiválasztott alapfokú iskola eredményeit mutatja.

2. táblázat  Az iskolai teszteredmények közzététele Angliában: egy helyi hatóság néhány kiválasztott iskolájának 2000. évi adatai

  Vizsgálatban részt vevő tanulók száma Angol nyelv és irodalom Matematika Természet-tudomány
  Teljes A speciális ellátásban részesülő tanulók száma A speciális ellátásban részesülő tanulók aránya (%) A 11 évesek körében átlagosan elvárható szintet meghaladók aránya (%) A hiányzók aránya (%) A 11 évesek körében átlagosan elvárható szintet meghaladók aránya (%) A hiányzók aránya (%) A 11 évesek körében átlagosan elvárható szintet meghaladók aránya (%) A hiányzók aránya (%)
Regionális átlag
74,2
74,7
84,3
Országos átlag
75
72
85
Abbey Junior School
90
87
2
91
1
94
4
Bishopton Redmarshall CofE Primary School
5
1
20
<
<
<
<
<
<
Cockerton Church of England Primary School
23
9
39,1
91
4
96
0
96
4

A bal oldali három oszlop azt mutatja, hány tanuló vett részt a vizsgálatokban. Külön föltüntetik azt, hogy ezek közül hányan, illetve milyen arányban kapnak speciális oktatást. Láthatjuk például, hogy a „Cockerton” nevű iskolában a tanulóknak csaknem negyven százaléka igényel speciális ellátást. A jobb oldali három kettős oszlop azt mutatja, hogy három tantárgyból (angolból, matematikából és természettudományból) milyen eredmények születtek az egyes iskolákban. Minden tantárgyhoz két oszlop tartozik: a bal oldali azt jelzi, hogy a „négyes szintet” tekintik olyannak, amelyről azt gondolják, hogy az adott életkorban, vagyis ebben az esetben a tizenegy évesek körében elvárható a teljesítése, és a vizsgált tanulók hány százaléka érte el ezt. A mellette lévő oszlop azt mutatja, hogy a tanulók mekkora hányada nem vett részt a vizsgálatban (ennek közlése azért szükséges, mert erősen torzíthatja az adatokat). Ezek az adatok kivétel nélkül minden angol iskoláról rendelkezésre állnak: bárki bármikor megnézheti őket, csak oda kell ülnie a komputerhez és rá kell kapcsolódnia az internetre. Az egyes iskolák nevére is rá lehet kattintani, és akkor további információkat kapunk róluk.

Arról, hogy az angolok milyen módon használják ezeket az adatokat, illetve hogyan képzeli el az ottani kormányzat ezek használatát, azt hiszem, jó képet ad, ha megnézzük, milyen üzenetet küld ezzel kapcsolatban a kormány a szülőknek. Ugyanazon a helyen, ahol a bemutatott táblázathoz hasonlóakat megtaláljuk, elolvashatjuk azt a szöveget is, amely a szülőket segíti az adatok értelmezésében (lásd az alábbi részletet). Az angol oktatásirányítás itt arra bátorítja a szülőket, hogy hasonlítsák össze gyermekük iskolájának eredményeit más iskolákéval, és ennek alapján alakítsanak ki véleményt. Sőt, a szülők arra is biztatást kapnak, hogy az eredményeket vitassák meg az iskola pedagógusaival, és ha nem elégedettek, együtt keressék a jobbítás lehetőségét.

Az iskolai teszteredmények közzététele Angliában (részlet a közzétett iskolai adatok kísérőszövegéből)

„Amennyiben az ön gyermeke a táblázatokban szereplő iskolák valamelyikébe jár, önt érdekelheti az, hogy összehasonlítsa ennek az iskolának az eredményeit a körzetben működő más iskolákéival vagy a körzet és az ország egésze átlageredményeivel. Azt is megnézheti, hogy az egyes iskolák eredményei az elmúlt négy év során hogyan változtak. Esetleg szándékában állhat, hogy az eredményeket megvitassa gyermeke iskolájának tanáraival: vajon mit gondolnak ők az iskola teljesítményéről és milyen terveik vannak a tanulók eredményeinek a javítására? Hogyan tudja ön segíteni az iskola munkáját? Mit tehet ön azért, hogy saját gyermeke jobb eredményeket érjen el?” (Forrás: www.dfee.gov.uk/performance/primary_00/psec101.htm)

Ebben a szövegben nagyon jól kifejeződik az angol mérési rendszer mögött húzódó filozófia. Korábban láttuk, hogy azon országok közül, ahol ilyen rendszer működik, Anglia az egyetlen, amely egyes iskolák minősítésére használja fel a teszteredményeket. Hozzá kell tennem: talán nincs egyetlenegy olyan mérési modell, amelyet keményebb kritikák érnének, mint ezt (lásd pl. Standaert 2001). Talán nem túlzás azt állítani, hogy az oktatás nemzetközi szakértői vagy az értékelő közösség nagy többsége egyértelműen rossz dolognak tartja az iskolák szerint történő eredményközlést. Az angoloknál azonban ez mégis működik: immár négy éve folyamatosan nyilvánosságra hozzák ezeket az adatokat, és a kormányzat hisz abban, hogy ez javítja az oktatás eredményességét.

Egy másik, jellegzetesen eltérő paradigmát alkot a francia modell. Ők 1989-ben elsőként vezették be a teljes körű – néhány életkori csoportban minden tanulóra kiterjedő és kötelező – tesztelést, azaz hamarabb, mint az angolok (nem számítva persze korábbi, ma már történetinek tekinthető folyamatokat). A francia rendszer céljait világosan megfogalmazzák az erről szóló hivatalos dokumentumok. Ezekből jól látható, hogy egészen más filozófiáról, más gondolkodásról van szó, mint amit az angoloknál láttunk.

A francia átfogó mérési rendszer céljai

  1. „A tanulók egyéni megismerésének a segítése, ennek érdekében a pedagógusok ellátása olyan standard protokollokkal, amelyeket az osztályaikban ők maguk alkalmaznak. Ez lehetővé teszi a 3. évfolyam tanítói és a 6. évfolyam matematika- és franciatanárai számára, hogy az iskolai év elején azonosíthassák tanulóik erős és gyenge pontjait, és ennek megfelelő pedagógiai stratégiákat dolgozzanak ki.”
  2. „Másodsorban ez az értékelés lehetővé teszi a francia és a matematika tárgyakban országos szintű referenciák meghatározását a tanulók egy olyan reprezentatív mintája alapján, amely a fő társadalmi-demográfiai változókat – kor, nem, nemzetiség, szülők foglalkozása, korábbi iskolai pályafutás – tartalmazó anonim kérdőívek kitöltésére épül.” Forrás: Ministčre de l’Education Nationale, 2001 (saját kiemeléseim).

Az itt idézett dokumentumban két alapvető cél fogalmazódik meg. A franciák egyfelől azt mondják, hogy a mérés célja a tanulók egyéni megismerésének segítése. Ennek érdekében kívánják a pedagógusokat ellátni olyan standard eljárásrendszerrel, amelyet az osztályaikban – ezt nagyon erősen hangsúlyoznám – ők maguk alkalmazhatnak. Ez tehát lehetővé teszi az adott évfolyamokon és tantárgyakban (ez itt a matematika és a francia), hogy a tanárok az iskolai év elején (ezen is hangsúly van) azonosíthassák tanulóik erős és gyenge pontjait és ennek megfelelő pedagógiai stratégiákat dolgozzanak ki. A franciák nem is szólítják meg ilyen tekintetben a szülőket.

Másfelől erős hangsúlyt helyeznek arra, hogy itt nemcsak szakmai, pedagógiai, hanem társadalmi jellegű folyamatokról is szó van. A francia rendszer a tanulók reprezentatív mintája alapján lehetővé teszi olyan országos szintű viszonyítási pontok meghatározását, amelyek a főbb társadalmi, demográfiai változókhoz (pl. kor, nem, nemzetiség, szülők foglalkozása, a korábbi iskolai pályafutás) kapcsolódnak. Ezeket a változókat a tanulók által kitöltött anonim kérdőívekből nyerik. Tehát ezekből a háttér-információkat is tartalmazó adatokból mintát vesznek, és ennek alapján történik átfogó, az egyes régiókra vagy az ország egészére vonatkozó elemzések készítése. Ennek az egyes iskolák értékelése nem része: ettől a franciák tudatosan elzárkóznak.

Az angol és a francia modell tehát két, jellegzetesen eltérő, egymással szemben álló filozófiára épülő értékelési-mérési modellt képvisel. Az értékelési szakemberek körében és az értékeléssel foglalkozó tágabb nyilvánosságon belül is hallatlan intenzív vita folyik ezekről a modellekről, az ezekben rejlő ellentétes paradigmákról. Az elmúlt évek pedagógiai-oktatáskutatási irodalmában talán nem is találunk más témát, amely jobban előtérbe került volna, mint a tanulmányi eredmények mérése. A viták általában olyan jellegzetes témákhoz kapcsolódnak, amelyek közül néhányat már az eddigiekben is említettünk. Az ismertetett modellek fényében érdemes még egyszer sorra venni azokat a kérdéseket, amelyekre a szakértők ma választ keresnek, és amelyek megválaszolása nemegyszer meg is osztja őket.

A tanulmányi teljesítmények méréséről folyó viták jellegzetes témái

A vitákból az is jól látható, hogy a standardizált teszteket alkalmazó értékelési-mérési vállalkozások sikere néhány olyan meghatározó tényezőtől függ, amelyek elemzése az új hazai mérési kezdeményezés szempontjából is tanulságos lehet. E tényezők közül itt most kettőt emelnék ki. Az első az értékelés társadalmi-politikai háttere, azaz annak biztosítása, hogy az értékelés az alapvető társadalmi igényeknek megfelelően alakuljon, és hogy e folyamat fölött működjön valamilyen társadalmi ellenőrzés. A másik az értékelés szakmai-pedagógiai beágyazottsága, vagyis annak a biztosítása, hogy az értékelés a tanulás reformját szolgálja, azaz ne egyszerűen csak utólagos minősítés legyen, hanem járuljon hozzá magának a tanulásnak az átalakulásához.

Az értékelés-mérés társadalmi ellenőrzése

Úgy tűnik, egyre erőteljesebb az a felismerés, hogy a közoktatás értékelési rendszere, a kialakuló új mérési mechanizmusok nem tekinthetőek egyszerűen a szakmai-pedagógiai folyamat részének, hanem egy jóval tágabb, a társadalmi folyamatok egész rendszerét érintő szabályozási rendszerbe illeszkednek. Az európai oktatási rendszerekben zajló értékelési reformokról néhány éve készült egyik elemzés így mutatja be a modern nemzeti oktatási rendszerek irányítását és ebben az értékelés szerepét: „A nemzeti oktatási rendszereket óriási vállalkozásokhoz vagy mamut tankhajókhoz hasonlíthatjuk, amelyek haladását meghatározott irányban kell tartani vagy terelni. (…) Az értékelés azon sajátos szabályozási vagy kontrollintézkedések egyike, amelyekből az oktatási rendszerek szabályozási mechanizmusai felépülnek.” (Amelsvoort et als, 1998)

A francia oktatási minisztérium egy ugyancsak nemrég keletkezett stratégiai dokumentuma hasonló kiindulópontokat fogalmaz meg: „A dekoncentrációs, decentralizációs és szerződéselvű (contractualization) politikákat kiegészítő értékelésre feltétlenül szükség van azért, hogy az oktatási rendszer irányítását (pilotage) lehetővé tevő tudományos eszköz legyen a kezünkben. Arról van szó, hogy minden szinten megfelelő irányítási (pilotage), diagnosztikai és elemzési eszközöket kell létrehozni és a felelősök rendelkezésére bocsátani, továbbá az információnak a társadalom felé való átadását a lehető legátláthatóbb (transparente) és leghozzáférhetőbb módon kell megszervezni.” (Ministčre de l’Education Nationale, 2001)

Az itt idézett francia stratégiai dokumentum a decentralizáció mellett a szerződéselvű (kontraktualizációs) politikákra utal, azaz a modern közigazgatási reformoknak arra a fontos törekvésére, hogy a közhatalom szerződéses jellegű viszonyt építsen ki a tényleges szakmai tevékenységet folytató intézményekkel, és közvetlen utasítások helyett így irányítsa azokat. A dokumentum egyértelműen utal arra, hogy az értékelés az oktatási szektorban is tágabb szabályozási reformok eleme, ezek kiegészítője.

A franciák tulajdonképpen három elemet hangsúlyoznak. Az első, hogy az értékelési rendszer fejlesztése direkt módon hozzákapcsolódik az átfogó szabályozási, irányítási reformhoz, azaz lényegében kiegészíti a decentralizációs irányítási reformot. A második, hogy az új értékelő, diagnosztikus mechanizmusok a rendszer minden pontján alkalmazandók, és a rendszer minden szereplője számára hozzáférhetőnek kell lenniük. Végül a harmadik, hogy minderről a tágabb társadalommal is intenzív kommunikációt kell folytatni.

A mérési-értékelési rendszerről való társadalmi egyeztetésre és e rendszer nyitottságára többek között azért van szükség, mert a közoktatási értékelési rendszerek kiépülése és ezen belül különösen a standardizált tesztekre épülő mérések megerősödése átalakítja a közoktatási rendszerek társadalmi szabályozásának az erőterét. Ennek az átalakulásnak az egyik eleme éppen az, hogy a standardizált tesztek alkalmazása nyomán egy meghatározott szakmai kör jelentős súlyra tesz szert, és ez elkerülhetetlenül hatni kezd az oktatási rendszer fejlődésére.

Mi jellemzi ezt a szakmai kört? Mindenekelőtt a professzionalizáltság magas szintje, amelyet a mérési technikák megbízható alkalmazása megkövetel. Jellemzője a viselkedés- és társadalomtudományok iránti interdiszciplináris nyitottsága, amely abban is megjelenik, hogy az ebben a szakmában működők rekrutációja nemegyszer ezekről a területekről történik. E szakma sajátos szemléletmódját és problémalátását meghatározza az általa alkalmazott technológia, azaz a különböző pszichometriai technikák. Mindezzel – elsősorban a speciális technológia alkalmazásával – együtt jár a politikától való nagyobb mértékű függetlenedés. Végül nem kevésbé fontos az sem, hogy ez a szakma hallatlan mértékben nemzetköziesedett. Talán nincs más olyan oktatáson belüli szakterület, amely annyira nemzetközivé vált volna és nemzetköziesedése olyan magas szinten intézményesült volna, mint a mérés-értékelés. Nem véletlen, hogy gyakran beszélnek nemzetközi mérési közösségről (international assessment community).

Az értékelésnek és ezen belül a tanulmányi teljesítmények standard eszközökkel való mérésének az előtérbe kerülésével tehát sajátos eltolódás történik a szabályozás rendszerében. Ha az oktatási rendszer szabályozásának társadalmi-politikai erőterét nézzük, akkor két olyan dimenziót találunk, amelyek ebből a szempontból érdekesek számunkra (1. ábra). Az egyik azzal függ össze, hogy inkább technikai, szakértői jellegű vagy inkább laikus jellegű társadalmi kontroll működik az oktatási rendszerben. A másik pedig azzal, hogy inkább általános közigazgatási, pénzügyi, jogi jellegű vagy inkább pedagógiai jellegű kontroll érvényesül. Azokban a rendszerekben, ahol a standardizált tesztekre épülő értékelés meghatározóvá válik, a kontroll jellege az általános közigazgatási felől a pedagógiai felé, a laikus társadalmi felől pedig a technikai, szakértői felé tolódik el. Vagyis azok a szereplők és mechanizmusok erősödnek meg, amelyek az ábrán az 1-es sorszámmal jelölt mezőben találhatók.

1. ábra

Azt, hogy ez a folyamat egy-egy országban miként zajlik le, nagymértékben befolyásolja, hogy az adott országban hogyan intézményesül az értékelő, mérő szakértelem. Magyarországon ez az intézményesülési folyamat az elmúlt években indult el. Mindenképpen érdemes tehát megnéznünk, milyen jellegzetes fejlődési irányok léteznek, hogy ezek fényében reflektálhassunk a hazai fejleményekre. A következőkben az intézményesülés jellegzetes formáit ellentétpárokban mutatjuk be oly módon, hogy a Magyarországra ma jellemző formát dőlt betűvel szedjük.1

Az oktatásirányító közigazgatási hatóságon belül van. Az oktatásirányító közigazgatási hatóságon kívül van.
Az irányító hatóságon kívüli önálló ügynökség végzi. Az irányító hatóságnak alárendelt szakmai szervezet végzi.
A felelős hatóság vagy önálló ügynökség (szakmai szervezet) teljes körű ellenőrzése alatt folyik. A felelős hatóság vagy önálló ügynökség (szakmai szervezet) a tudományos-felsőoktatási szférának adja ki szerződésre a feladatot.
Az iskolákat és tanárokat értékelő felügyeletre bízzák (a felügyelet egyik része). Az iskolákat és tanárokat értékelő felügyelettől tudatosan különválasztják (a felügyelettől eltérő szakmai tevékenység).
A mérés feladata és szervezete nem különül el a program- és tantervfejlesztéstől. A mérést végző szervezet és feladat elkülönül a programfejlesztőtől.
A mérést végző szervezet egybeépül a vizsgákat bonyolító szervezettel. A tesztelés vagy monitorozás világosan elkülönül a vizsgáztatástól.
Az oktatási értékelés (ezen belül a tesztelés) a közigazgatási-kormányzati értékelési politika része. Az oktatási értékelés (ezen belül a tesztelés) olyan belső ágazati-szakmai tevékenység, amely nem kötődik a közigazgatási-kormányzati értékelési politikához.

Az első pont azt mutatja, hogy vannak országok, ahol a tesztelést végző egységet az oktatásirányító közigazgatási hatóságon belül szervezik meg. Franciaország, ahol ez az egység az oktatási minisztérium egyik főosztálya, jellegzetesen ebbe az egyébként ritka típusba tartozik, és vannak olyanok, amelyek a közigazgatáson kívül szerveződnek meg. A következő pont azt mutatja, hogy a tesztelő egység (amennyiben kívül van a közigazgatáson) lehet olyan önálló ügynökség, amely a közigazgatással szerződéses kapcsolatban végzi a tesztelést – ilyen az angol modell –, de lehet olyan szervezet is, amely az irányító hatóságon kívül van, de annak közvetlenül alárendelve dolgozik. A harmadik pont (ugyancsak a közigazgatáson kívül működő) tesztelő egységek két típusát mutatja: a bal oldali esetében a mérés a felelős hatóságnak alárendelt szervezet vagy önálló ügynökség teljes körű ellenőrzése alatt folyik, azaz minden funkciót e szervezetek látnak el; a jobb oldali esetben viszont e szervezetek a feladatot vagy annak egy részét „kiszerződik” a tudományos felsőoktatási szférának (ez jellemző például a skandináv országokra). Ez utóbbi megoldásra azért is szükség lehet, mert olyan szakmai tudás, amelyet a tesztelés igényel, a központi intézményekben esetleg nincs jelen, és ezért be kell vonni az egyetemeket vagy a tudományos kutatás szféráját.2

Vannak olyan országok, ahol a hagyományos felügyeletet próbálják megtanítani erre az új funkcióra, azaz a történetileg kialakult felügyelői testületre próbálják rábízni a tesztelési technikák alkalmazását. Ez nem egy esetben nehéz és konfliktusos tanulási folyamatot feltételez, hiszen olyan felügyelőknek kell megtanulniuk az új mérési technikákat, akik évtizedeken keresztül egészen más módszereket használtak. Éppen ezért e két feladatot – vállalva a többletköltségeket – több országban tudatosan különválasztják, és a tesztekkel történő mérési feladatokkal a hagyományos értékelési szervezetektől különálló új szervezeteket bíznak meg (amilyen például Hollandiában a CITO vagy Angliában az értékelésért való átfogó felelősséget viselő, de inkább a hagyományosabb felügyelői értékelést képviselő OFSTED mellett a mérésért felelős QCA).3

Az ötödik pont egy újabb meghatározó jelentőségű különbséget jelez. Létezik olyan eset, ahol a mérés feladata és szervezete nem különül el a program- és tantervfejlesztéstől, azaz ugyanazok a szakemberek – vagy ha nem is ugyanazok, de legalábbis egyazon szervezetben dolgozók – csinálják mindkettőt. Egyre gyakoribb azonban, hogy a mérést végző szervezet és feladat határozottan elkülönül a programfejlesztéstől. Ennek sokszor emlegetett példája a holland modell, ahol a már említett CITO nevű szervezet csak méréssel foglalkozik és egy másik központi intézmény foglalkozik program- és tantervfejlesztéssel. E két különböző intézmény teljesen eltérő szakmai filozófiát követhet, és a közöttük lévő kommunikáció általában nem mondható gazdagnak.

A hatodik pont ugyancsak fontos stratégiai szervezeti ellentétre utal. Vannak olyan országok, ahol a tesztelés ugyanabban a szervezetben történik, mint amelyik a vizsgákat bonyolítja, és vannak olyanok, amelyek világosan különválasztják e két funkciót (az angoloknál és a franciáknál is ez utóbbi a jellemző, ugyanakkor a holland CITO felelőssége nemcsak a tesztelésre terjed ki, hanem a vizsgákra is). Végül az utolsó pont egy olyan különbséget mutat, amelyre viszonylag ritkán figyelünk oda, pedig igen nagy a jelentősége. Az országok nagy részében a mérési-értékelési tevékenységet olyan belső ágazati tevékenységnek tekintik, amit még gondolatban sem kötnek össze a más ágazatokban hasonló logikák alapján zajló értékelésekkel. Léteznek azonban olyan országok is – amint láttuk, Franciaország jellegzetesen ilyen, de sok szempontból Angliát is ide lehet sorolni –, ahol a közoktatás vagy az oktatás területén végzett értékelést úgy tekintik, mint a közigazgatási-kormányzati értékelési politika vagy a közigazgatási reform részét, és ahol a különböző ágazatok által megvalósított értékelési politikák között egyfajta koordinációra is törekednek.

Annak igazolására, hogy az oktatási szektorban megjelenő mérési-értékelési funkció milyen társadalmi-politikai súlyra tehet szert, ismét a francia példát szeretném idézni. Volt már szó arról, hogy a franciák a tesztelési funkciót a minisztériumi apparátuson belül hozták létre, egy minisztériumi főosztályra bízták. Körülbelül egy évtizednyi működés után azonban az értékeléssel kapcsolatban olyan társadalmi viták generálódtak, amelyek rákényszerítették a franciákat arra, hogy e folyamatot társadalmasítsák, azaz az értékelési funkció felett kiépítsék a társadalmi kontroll új mechanizmusait. Erre a 2000. évben került sor, amikor miniszterelnöki rendelettel létrehozták a Legfelsőbb Iskolaértékelési Tanácsot (Haut Conseil de l’évaluation de l’école). Külön hangsúlyozni szeretném, hogy nem miniszteri, hanem miniszterelnöki szinten történt meg ennek a testületnek a létrehozása: ez egyebek mellett azt a célt is szolgálja, hogy az értékelési funkciónak az oktatási szektorban történő működtetését összekapcsolják más szektorok hasonló feladataival. A testületnek 35 tagja van, közöttük nemcsak szakemberek, hanem választott politikusok is. A létrehozásáról szóló rendeletben felsorolt feladatai4 jól mutatják, hogy itt valóban a közoktatási értékelési funkció magas szintű társadalmi-politikai ellenőrzésének a megteremtéséről van szó.

A francia Legfelsőbb Iskolaértékelési Tanács feladatai

Külön is hangsúlyozni szeretném e testületnek a nyilvános társadalmi vita elősegítését célzó funkcióját. A franciák valóban azt akarják, hogy erről a területről nyilvános társadalmi-szakmai vita folyjék, szükségességéről saját ágazati értékelési politikájuk egy évtizedes tapasztalata győzte meg őket. Ez ugyanis olyan vitákat indukált, amelyek alapvetően veszélyeztethetik az értékelési funkció működését, ha nincsenek megfelelő intézményes keretekbe terelve.

A mérés és a tanulás reformja

A mérési vállalkozások sikerét meghatározó tényezők közül másodikként ezeknek a tanulásra gyakorolt hatását emelem ki. E vállalkozásokkal kapcsolatban – beleértve ebbe az új hazai kezdeményezést is – többek között az a kérdés merül fel, hogy segítik vagy gátolják a tanulás eredményesebbé tételét, a tanulás reformját.

A nemzetközi szakmai közösségben erről hallatlanul intenzív és gyakran igen éles vita folyik. Kicsit kiélezve azt mondhatjuk, hogy két eltérő vélemény fogalmazódik meg. Az egyik azt mondja, hogy a mérés lehetővé teszi, hogy az iskolákat arra késztessék, hogy a tanulási környezetet és a tanítási módszereket a modern kognitív pszichológia és tanuláselméletek legújabb eredményeinek megfelelően alakítsák. Ezzel szemben áll a másik vélemény – a leggyakrabban ezzel találkozunk –, amely azt állítja, hogy a mérések egyedülálló veszélyt jelentenek a tekintetben, hogy végzetesen konzerválhatják a tanulás idejétmúlt, rossz hatékonyságú 19. századi modelljét. Ez a vita egy sor olyan pozitív, konstruktív elemet is produkált, amelyekből tulajdonképpen kirajzolódnak azok a garanciák, amelyek biztosíthatják, hogy végül is az új lehetőség és ne a régi veszély érvényesüljön. A következőkben ezekről a lehetséges garanciákról lesz szó.

Az első, talán leggyakrabban megjelenő gondolat az, hogy a tesztelést bele kell illeszteni egy átfogó, differenciált és minél nagyobb szakmai konszenzuson nyugvó értékelési vagy minőségpolitikába. Egy ilyen politika lehetséges elemei a következők.

Amennyiben az a cél, hogy a mérések a tanulás reformját szolgálják, akkor nemcsak ennek megfelelően kell meghatározni ezek céljait, hanem arra is kellenek biztosítékok, hogy a rendszer folyamatos működtetése során valóban ragaszkodjanak ezekhez a célokhoz. Ez utóbbit érdemes külön hangsúlyozni, mert a mérési rendszereknek lehet olyan önműködése, amely elviheti azokat az eredeti céloktól más irányba.

A tanulás megújulását szolgáló modern mérési-értékelési stratégiák egyik legfontosabb jellemzője, hogy a többdimenziójú értékelést támogatják. Azaz mindent megtesznek annak érdekében, hogy az értékelés ne redukálódhasson összevont pontszámokra és rangsorokra, illetve ilyenek közzétételére. Ennek a célnak az érvényesítése különösen azért nehéz, mert a társadalmi szereplők és a média az értékelési rendszereket nemegyszer éppen a nem kívánt irányba próbálják tolni.

Kiemelkedően fontos a mérhető és a nem (vagy nehezen) mérhető eredményekre való odafigyelés megfelelő aránya. A mérési kezdeményezések egyik legnagyobb kockázata éppen az, hogy ezek nyomán a könnyen mérhető elemek kerülhetnek túlsúlyba a nem kevésbé fontos, ám kevésbé mérhető elemekkel szemben. A bonyodalmakat többek között éppen az okozza, hogy nemegyszer éppen a modern gazdaság és társadalom által igényelt kulcskompetenciák mérhetők a legnehezebben (erről a későbbiekben még külön is szó lesz). Ezért egy sor olyan elemet kell a tesztfejlesztés és a tesztelés gyakorlatába beépíteni, amelyek garantálják, hogy a modern tanulásfelfogás érvényesüljön, például kellő hangsúlyt kapjon a tanulásnak a gyakorlati felhasználás és a problémamegoldó képesség felé való orientálása; a reproduktív, döntően az emlékezetre épülő tanulással szemben a „megértő” vagy „mély” – a kognitív struktúrákat jelentősen formáló – tanulásra helyeződjék a hangsúly. Olyan mérési technikák kifejlesztését és elterjesztését kell bátorítani, amelyek összeegyeztethetőek az egyéni tanulási stratégiák sokféleségével, és egy olyan pedagógusattitűddel, amely az egyéni tanulási stratégiákhoz való alkalmazkodásra épül. Emellett szükség van a tesztelők és a tanulás megújításán dolgozó pedagógusok és fejlesztők közötti bizalom építésére, e két szakmai kör ugyanis egymással könnyen szembefordítható.

A tanulás reformját szolgáló értékelési és minőségpolitikának meg kell határoznia továbbá a külső és a belső értékelés (önértékelés) kívánatos arányait. Emellett tisztáznia kell a külső standardokhoz és a saját induló pozíciókhoz való viszonyítás kívánatos arányát, vagyis a hozzáadott érték (angol kifejezéssel added value) szerepét. Nemcsak a minősítő/ellenőrző és a támogató/fejlesztő funkciók kívánatos arányát kell megfogalmaznia, hanem – az utóbbihoz kapcsolódva – meg kell határoznia azokat a konkrét megoldásokat is, amelyek a sikertelen tanulók vagy intézmények támogatását célozzák. Azaz választ kell adnia arra, hogy mi történik akkor, ha valakiről vagy valamely intézményről kiderül, hogy eredménytelen. Az egyszerű visszajelzés mellett történik-e ilyenkor valamilyen konkrét fejlesztő akció? E tekintetben érdemes visszautalni mind a francia, mind az angol modellre, mert mindkettőben vannak a sikertelenség konkrét kezelését szolgáló elemek.

A mérési vállalkozások eredményességének általában is meghatározó eleme az, hogy sikerül-e a tesztek és a feldolgozás szakmai színvonalának a biztosításához megfelelő technikai és személyi hátteret teremteni. Nem kevésbé fontos azonban ez a tanulás megújításának a szempontjából sem. A modern értékelési-mérési politikának ugyancsak kiemelkedően fontos eleme, hogy biztosítsa a rendszer önkorrekciójának a lehetőségét. A ma működő rendszereket tanulmányozva az egyik első dolog, amely a szemünkbe ötlik, hogy ezek mind tanuló rendszerek. Mind másmilyenek, mint amilyenek néhány éve voltak, mert mindegyik tanult a saját tapasztalataiból és valamilyen módon megpróbálta korrigálni önmagát. A magyar rendszer is nyilván így fog működni, hiszen egy sor olyan, ma még nem látott következménye lesz a méréseknek, amelyeket menet közben kell majd megfogalmazni, és ezek alapján kell majd magát a rendszert korrigálni.

Az elmondottakból logikusan következik, hogy egy modern értékelési-mérési politikából nem maradhat ki a specialisták és a civil vagy laikus szereplők közötti együttműködés és szerepmegosztás tisztázása (erre láttunk kísérletet Franciaországban az értékelési tanács megalkotásával). Végül egy ilyen politika elemei között itt is említeném a nemzeti modell és a domináns nemzetközi irányok közötti kapcsolódás biztosítását. Többek között éppen azért, mert – ahogy korábban említettem – ez az oktatásügy talán leginkább nemzetköziesedett területe, amelyen keresztül a nemzetközi hatások minden országba szükségképpen betüremkednek.

Az eddigiekből végül szeretnék külön is kiemelni egy elemet. Szó volt arról, hogy a tanulás reformjáért dolgozókat többek között az aggasztja, hogy a modern gazdaság és társadalom által igényelt kulcskompetenciák gyakran nehezen mérhetőek, és ezért a mérés előtérbe kerülése olyan veszéllyel fenyegethet, hogy e kompetenciák fejlesztése háttérbe szorul. A jelenlegi mérések ugyanis nagyon erősen kapcsolódnak a hagyományos tantárgyi struktúrákhoz, ugyanakkor a kulcskompetenciák általában tantárgyköziek.

Ez a probléma különösen élesen vetődött fel az elmúlt években annak az OECD által szervezett mérési programnak, a PISA-nak a keretei között, amelynek első eredményei 2000 decemberében láttak napvilágot. E programban talán minden korábbinál nagyobb figyelmet próbálnak fordítani arra, hogy olyan kulcskompetenciákat azonosítsanak és tegyenek mérhetővé, amelyek nem feltétlen köthetők konkrét tantárgyakhoz. Ezt már csak azért is teszik, mert van néhány olyan ország, ahol egészen radikális módon megfogalmazzák, hogy ha ezt nem sikerül elérni és a mérések túlságosan a hagyományos tantárgyi tudáshoz kapcsolódnak, akkor kiszállnak ebből a vállalkozásból. Attól tartanak ugyanis, hogy a mérés ily módon deformálhatja, rossz irányba tolhatja oktatási rendszereiket.

Az OECD ezért igen nagy energiákat fordít arra, hogy ezen a területen komoly eredményeket produkáljon. E munkának ma már van számos eredménye, túl a PISA keretében alkalmazott mérőeszközökön. Ebből szeretnék felvillantani valamit a releváns képességekről és az azok mérhetőségéről folyó gondolkodásunk segítése érdekében. A kulcskompetenciák meghatározását és mérhetővé tételét szolgáló, az OECD által támogatott kutatások több olyan kompetencialistát állítottak össze, amelyeket ma már egyetlen mérési szakember vagy mérésre megbízást adó oktatáspolitikus sem hagyhat figyelmen kívül. Az egyik újabb lista5 például öt olyan kompetenciát sorol fel, amelyek a közeljövő gazdasági és társadalmi környezetében várhatóan nélkülözhetetlenek lesznek, és amelyek általában nem köthetők konkrét tantárgyakhoz (Canto-Sperber – Dupuy 2001).

Kulcskompetenciák

A kulcskompetenciák meghatározását és mérhetővé tételét szolgáló kutatások során növekvő figyelem irányul a szociális és személyes kompetenciákra. Számos olyan gazdasági elemzés lát ugyanis napvilágot, amelyek arra a következtetésre jutnak, hogy bizonyos személyes és szociális kompetenciák megléte vagy hiánya nagymértékben befolyásolhatja egy-egy vállalkozás vagy akár egy-egy nemzetgazdaság versenyképességét. Egy olyan vizsgálat, amely kifejezetten ezek meghatározására irányult, nyolcféle alapvető személyes és szociális kompetenciát sorolt fel (Perrenoud 2001). Az igazán komoly kihívást véleményem szerint az jelenti számunkra, hogy ki tudunk-e dolgozni olyan mérési eszközöket, amelyek az ilyen és ehhez hasonló kompetenciák meglétét tudják vizsgálni és ezekről tudnak visszajelzést adni az iskoláknak.

Személyes és szociális kulcskompetenciák

Konklúziók

Végül néhány következtetést fogalmaznék meg azzal kapcsolatban, hogy mi következik számunkra az itt említett nemzetközi tapasztalatokból. Az első következtetés a mérést előtérbe helyező oktatáspolitika társadalmi elfogadottságával kapcsolatos. Szükség van egy átfogó értékelési koncepció kidolgozására, és – ami nem kevésbé fontos – társadalmi-szakmai vita folytatására a célokról és a várható hatásokról. Ennek a konferenciának egyik funkciója talán éppen az lehet, hogy elkezdje az ilyen jellegű vitát. Gondolkodnunk kell a mérés-értékelés feletti társadalmi ellenőrzés intézményeinek a kialakításáról is. Ma még kevéssé érzékeljük ennek szükségességét, de a nemzetközi tapasztalatok alapján meg lehet jósolni, hogy viszonylag kis idő múlva hallatlanul nagy társadalmi figyelem fog irányulni a mérési vállalkozásra, és kérdések sokasága fog nem szakmai, hanem politikai formában felvetődni. Ezért fontos, hogy miképpen lehet az ilyen típusú vitákat intézményesíteni. Franciaországban tizenegy év telt el a mérési kezdeményezés elindításától addig, hogy a vitát az intézményesülés előbb látott szintjére emelték. Valószínű, hogy más országokban rövidebb lesz ez az időszak. Különösen fontos, hogy a hazai mérési rendszert is olyan tanuló rendszerként képzeljük el, amelynek önkorrekcióját segíthetik a szakmai-társadalmi viták.

A másik következtetésem a tudásháttérrel függ össze. A mérési rendszer működéséhez szükséges tudásból sok minden megvan már Magyarországon, de ez messze nem elegendő. A legfontosabb valószínűleg annak elemzése, hogyan hat a mérés a tanulási folyamatra, mert erről hallatlanul hiányos a tudásunk. Ha a hazai mérési rendszer mögött valóban a tanulási folyamat megújításának a vágya található, akkor ezt a fajta tudást nagymértékben növelni kell. Az ilyen jellegű tudás egy része nemzetközi szinten rendelkezésre áll, ebből sok mindent kell és lehet importálni. A tudásháttér további gazdagítására van szükségünk a tesztelés szociológiai, politikai és szervezeti hatásai tekintetében is. Fontos a más ágazati politikákkal való kölcsönhatások elemzése. És természetesen szükségesek olyan pszichometriai kutatások is, amelyek a tesztelés technikai problémáival összefüggő kérdésekre keresik a választ.

A harmadik következtetésem a mérésekkel és a mérési eredmények pedagógiai felhasználásával kapcsolatos iskolai szintű kompetenciákkal és ezek fejlesztésével függ össze. Alapvető fontosságú azoknak a pedagógiai kompetenciáknak a meghatározása, amelyekre egy modern értékelési-mérési rendszer működése esetén iskolai szinten jelentkezik igény. Valójában nem annyira az iskolák és a pedagógusok értékelési kompetenciája érdekes a számunkra, mint inkább az, hogy képesek-e az értékelés eredményeképpen létrejövő információk pedagógiai felhasználására. Ez szakmailag talán még összetettebb, bonyolultabb dolgot jelent, és erről különösen keveset tudunk. Mindezeknek valamilyen módon meg kell jelenniük a pedagógusképzési és -továbbképzési programokban, illetve ha már megjelentek, a súlyuknak növekednie kell. Ezen a területen jelentős pedagógiai innovációk szükségesek, amelyek segítésében az iskolavezetésnek is kulcsszerepe van, hiszen nagymértékben ettől függ, hogy milyen módon történik az értékelési eredmények iskolai szintű pedagógiai felhasználása. Ha a vezetés nem tudja, miképpen kell ezeket felhasználni, akkor hiába vannak az iskolában olyan pedagógusok, akik tudják, ez mégsem fog az iskola egészének a szintjén működni.

Végül feltétlenül említést kell tenni magának a mérésnek a szervezeti-technikai feltételeiről is, azaz mind a szükséges erőforrásokról, mind a kívánatos szervezeti fejlesztésekről. Azzal zárnám a gondolatsort, hogy a célokban megfogalmazódott fejlesztő orientáció szervezeti garanciákat igényel. Ha ugyanis nincsenek meg a szervezeti garanciák, akkor nagy a valószínűsége annak, hogy akár belső folyamatok, akár külső társadalmi hatások – például a média hatása – következtében az egész rendszer deformálódni kezd, és végül csak egy leszűkült szerepet fog betölteni.

Referenciák

Amelsvoort, Gonnie van et als (1998): EEDS – Evaluation of Educational eStablishments (a comparative study of systems of school evaluation, both external and internal, in four EU countries: England and Wales, Italy, the Netherlands and Spain), manuscript.

Canto-Sperber, M. – Dupuy, J. (2001): Competencies for the Good Life and the Good Society. In Rychen, D. S – Salganik, L. H (2001): Defining and Selecting Key Competencies. Hogrefe & Huber Publishers. Seattle – Toronto – Bern – Göttingen. 67–92.

Hattie, John (2001): Assessment for success in Primary schools – A response to the New Zealand Green Paper on Assessment (www.arts.auckland.ac.nz/edu/staff/jhattie/Hattie_NZ_Green_paper.html).

Ministčre de l’Education Nationale (2000): Evaluations CE2 – sixičme. Repčres nationaux Septembere 2000.

Ministčre de l’Education Nationale (2001): Les moyens pour moderniser l’école: une exigence d’efficacité.

Perrenoud, P. (2001): The Key to Social Fields: Competencies of an Autonomous Actor. In Defining and Selecting Key Competencies. Hogrefe & Huber Publishers. Seattle – Toronto – Bern – Göttingen. 121–150.

Standaert, Roger (2001): The temptation of simplification. In Letschert, Jos (ed.): Turning the perspective – New outlooks for education. CIDREE – SLO, Enschede, 191–217.