51. évfolyam, 2005. 2. szám
Archívum

A Felsőoktatási Digitális Tankönyvtár és a DocBook XML leíró nyelv

A Kempelen Farkas Hallgatói Információs
Központ (HIK) digitalizálási projektje

MARKÓJA Szilárd

Ma már a felsőoktatásban résztvevők számára elengedhetetlen, hogy digitális formában - az interneten keresztül - elérhessenek tankönyveket, tananyagokat, melyek felépítése könnyűvé és egyszerűvé teheti a mentést, nyomtatást, ezzel segítve az aktív tanulási folyamatokat.

A Kempelen Farkas Felsőoktatási Digitális Tankönyvtár (KFFDT 1 ) létre hívása az eddigi hiányt hivatott betölteni, és a HIK kommunikált céljai között hangsúlyos szerepet játszó legkorszerűbb technológiákat hívja segítségül abban az esetben is, ha elektronikus tankönyvekről van szó.

1. Felsőoktatási digitális tankönyv?

1.1 A felsőoktatás jelenlegi irányvonalai

A felsőoktatásban - jellegénél fogva - nem lehetséges és nem is célszerű egységes tan- és szakkönyvellátottságról beszélni, hiszen az ország hetven egyetemének, főiskolájának száz feletti szakán vagy szakpárján oktatnak ma, és ez több ezer kurrens könyvet, tankönyvet, jegyzetet, e-learning tananyagot, szlájdot stb. jelent. Ezeknek összeírása, katalogizálása sziszifuszi feladat lenne; és a hatékonysága pedig erősen megkérdőjelezhető, hiszen a centralizáltságra törekvő elgondolások értelmezhetetlenek, tekintve az egyetemi (főiskolai) autonómiát. A campusok továbbá maguk is kutató-, publikáló műhelyek, a kiadványaik jelentős részét maguk állítják elő, és olykor be sem kerülnek az országos kereskedelmi hálózatba (és ezen keresztül pl. a köteles példányokat kapó nagyobb könyvtárakba sem). Az oktatói függetlenség - nagyon helyesen - lehetővé teszi azt, hogy az azonos karokra, de más egyetemekre járó hallgatók teljesen eltérő könyvekből tanuljanak, így pl. a jegyzetek zöme, melyek viszonylagosan nagy példányszámban jelennek meg, csak bizonyos egyetem adott karára vagy szakjára vonatkoznak. Ezen jegyzetek létjogosultsága megkérdőjelezhetetlen: részben evidens oktatói érdeket szolgálnak tanulmányi szempontból (olykor valóságosan is hiánypótló műveknek számítanak kisebb-, "egzotikusabb" szakoknál) részben pedig a kiadói/szerzői jogok közvetlen gyakorlása nagyobb bevételt jelent, mint esetlegesen az országos terjesztésű kiadóknál megjelentetett művek esetében (feltéve, hogy eléri azt a példányszámot, illetve azt az országos "eladhatósági ingerküszöböt", melynél megéri egy nagy kiadónak foglalkozni vele).

Másfelől megközelítve a felsőoktatási tankönyv problematikát: az új Felsőoktatási Törvény tervezete 2 preferálja az Európai Unióban elterjedt képzési formákat, tehát megkülönböztet a) alapképzést (BA, BSc), b) mesterképzést (MA, MSc), c) doktori képzést (PhD). Az Oktatási Minisztérium (továbbiakban: OM) javasolta a hagyományos főiskolai, egyetemi szintek átstrukturálását, az átfedések megszűntetését, a képzési szintek markánsabb elkülönítését. Ez értelemszerűen a tankönyvpiacon is változásokat hoz: a BSc szinten megjelenő oktatási segédanyagok például kiszoríthatnak kevésbé elterjedt tananyagokat, illetve szakmailag összehangoltabb jegyzetek, tankönyvek stb. elkészülését kényszeríthetik ki.

1.2 Az országos terítésű kiadók helyzete

A Magyar Könyvkiadók és Könyvterjesztők Országos Egyesülése által megfogalmazott helyzetértékelés, valamint a kiadók vezetői szerint a nyomtatott dokumentumok példányszáma rohamosan csökken 3 . Bár a kiadott címek száma 1989 óta hét és félezerről 2002-ig kb. tízezerre nőtt, addig az eladott átlagpéldányszám 14 300-ról 3 500-ra csökkent, és a tendencia folyamatosnak tekinthető. Az évi közel 60 milliárd Ft-os könyvpiacnak kb. az 50%-a a kimondottan tan- és szakkönyv (az átfedéseket nem vizsgálva), de az egy kötet előállítására számítható fajlagos költségek a kis példányszámok miatt magasabbak, mint az európai átlag, ami további kedvezőtlen hatással van a nyomtatott tankönyvpiacra.

További problémák: a kiadók mind a mai napig erősen rászorulnak a különböző módon kapott (főleg pályázatokon nyert) állami támogatásokra, holott az államnak - elméletileg - nem lenne feladata piaci szereplők ilyen volumenű támogatása. Ez fokozottan igaz a felsőoktatásban használható könyveket és tankönyveket értékesítőkre. A kiadók szempontjából egy új, minőségi tankönyv (tananyag) kifejlesztése a legnagyobb energiát felemésztő beruházás, egy cím első kiadású előállítása (a szerzői honoráriummal, kiadói háttérköltségekkel) kétmillió forinttól kezdődik. A könyvek és tankönyvek kifejlesztésében az egyik legnagyobb költségtényező a nyomda mely a beruházás összköltségének a háromnegyedét is kiteheti. Az ehhez társuló logisztika, a szállítás, és a raktározás szintén jelentős tétel. Jelen helyzetükben a közepes- és kisebb kiadók pl. szívesen kooperálnak nagykereskedőkkel a raktározás, ill. terjesztési problémáik megoldása érdekében.

A kimondottan "tankönyves" kiadók számára a megoldás az elektronikus tankönyvek (e-book-ok, e-learning tartalmak), vagy autentikált online tartalmak előállítása lenne a cél, de jelenleg erre csak mérsékelten képesek. Változásra van szükség:

a) az általános kiadói szemlélet módosulásában;

b) a technikai színvonal késedelem nélküli emelésében.

Általában megállapítható, hogy - kevés üdítő kivételtől eltekintve - a nagy kiadók vezetői mind a mai napig a papíralapú tankönyvben és kereskedelemben gondolkodnak a riasztó forgalmi adatok dacára, bár vannak már előrelépők is.

A technikai színvonalról - a tavalyi pályázat előkészítő megbeszéléseinek fényében - el lehet mondani, hogy napjainkban még előfordul, hogy a kiadók kézírással vagy gépelve (írógép!) kapják a szerzőktől az anyagot, bár már elterjedtnek tekinthetőek a doc, txt, rtf stb. formátumok. Az, hogy egy szerző SGML-ben, XML-ben készítsen tankönyvet, vagy egymaga állítson össze egy SCORM szabványos e-learning tananyagot, pillanatnyilag rendkívül ritka. Sajnos, a kiadók szakemberei sem rendelkeznek az online tartalmak (HTML, XSL, CSS) szerkesztési tudásával, ezért átképzésekre lenne szükség a Quarkkal vagy Venturaval dolgozó tördelőszerkesztők között.

A 2004-évi Felsőoktatási Tankönyvpályázat a digitális tananyag előállítását kísérleti programnak tekitette és figyelembe vette a kiadók segítségét is.

1.3 Olvasáslélektan, képernyőről tanulás

A különböző olvasásszociológia felmérések a hagyományos, nyomtatott könyvek olvasási szokásairól sötét képet festenek. Idevágó tanulmányaikat az OSZK Könyvtári Intézetének szakemberei (pl.: Nagy Attila, Gereben Ferenc stb.) több helyen is publikálták 4 . Általános vélemény szerint ma még a képernyőről történő tanulás elhanyagolható, hiszen a megjelenítés, a közvetítő eszköz milyensége, a monitorok gyakran nem megfelelően szemkímélő megoldásai nem teszik erre alkalmassá. Ezért az elektronikusan publikált tananyagokat általában kinyomtatják tanulási célból. Ettől eltérés abban az esetben tapasztalható, ha a tananyag nem memorizálandó, hanem valamilyen műveletet kell vele végezni, és a diák, hallgató által készített végtermék szintén elektronikus dokumentum, (vagy ennek nyomtatott változata).

Vélhetően a generációs változások (és itt az emberre, önmagára ugyanúgy gondolunk, mint az információs technológiák fejlődésére) ezt a határt is áttörik a közeljövőben, ezért a kiadóknak időben fel kell készülniük a változásokra (értelemszerűen az OM és háttérintézményeinek szakmai segítségével, támogatásával, továbbá útmutató projektjeivel pl: Sulinet Digitális Tudásbázis 5 , Felsőoktatási Digitális Tankönyvtár stb.), illetve reagálniuk kellene az egyre jobban elharapózó "legújabb kori funkcionális analfabétizmusra" 6 .

1.4 Szerzői jogi kérdések, reprodukció:

A kiadó természetesen a szerzővel közvetlen kapcsolatot tart. Bármilyen kiadáshoz - legyen az hagyományos vagy elektronikus - a szerző beleegyezése szükséges. A printelést és/vagy a teljes fénymásolást a - ha a szerző, illetve a kiadó ebbe nem egyezik bele - a hazai jogszabályok tiltják, illetve korlátozzák, de ezen szabályok megsértését nagyon nehéz érzékelni, így ma gyakorlatilag teljesen megoldatlan a sokszorosítás kérdése - szerzői jogi szempontból. A kiadói veszteségek felmérhetetlenek a fénymásolás tekintetében, ezért a kiadók félelmei jogosak az online, és letölthető és/vagy nyomtatható tananyagokkal kapcsolatban, de többféle megoldás létezik (pl.: egyszeri nyomtatás vízjeles papírra, vagy autentikációhoz kötött hozzáférés biztosítása.)

2. Digitális tartalmak előretörése

2.1 Miért digitalizálunk, miből, és hogyan?

Az előzőekben leírtak következményeként megállapíthatjuk azt, hogy az oktatási tárca hangsúlyosan kezeli a digitális tartalmak létrejöttét, továbbá a köz-, és felsőoktatásban elengedhetetlenül fontos ezek létrejötte, megjelenése. A digitalizált tankönyvek, továbbá az e-Learning-nek számító komplex tananyagok összevetése a nyomtatott verziókkal nem is hagy kétséget az előbbiek használhatóbb volta felől (mind az oktatók, mind a kutatók, diákok, hallgatók számára).

Az előnyök:

2.2 A digitális tankönyvek leíró nyelve: DocBook XML 7

Abban az esetben, amikor nagy mennyiségű dokumentum egységes formátumban való elkészítése, az egyes dokumentumoknak ugyanazon hordozón, de eltérő megjelenésben történő publikálása (pl. navigációs elemekkel ellátott HTML formátum és nyomtatható HTML formátum), vagy a dokumentumok különböző médián vagy formátumban való publikálása a cél, a legkézenfekvőbb megoldás valamilyen újrahasznosítható dokumentumformátum használata.

Az elektronikus dokumentum felépítése két részre bontható szét:

Az XML-be kódolt gépi feldolgozás lehetővé teszi, hogy az egységesített tartalmat különböző megjelenítő eszközökre lehet publikálni, de fordítva is igaz: a dokumentum tartalmának változásakor nem szükséges a megjelenítő réteg változtatására.

A gyakorlatban legalkalmasabbnak erre az XML leíró nyelv bizonyult.

A Felsőoktatási Tankönyvpályázaton a HIK által javasolt formátum kialakításakor olyan, már létező megoldásokat vizsgáltunk meg, melyek a fentieknek megfelelnek, képesek az elektronikus dokumentumok metaadatainak megfelelő tárolására, kellően elterjedtek, a nagyobb szoftverfejlesztők támogatják és léteznek megfelelő minőségű transzformációs eszközök. További követelmény, hogy a formátum legyen szabadon módosítható és bővíthető, valamint nyílt szabvány legyen, azaz ne kötődjön egyetlen nagy gyártóhoz sem.

A DocBook XML formátum olyan általános dokumentumformátum, melyet a kilencvenes évek eleje óta használnak általános témájú dokumentumok és technikai leírások tárolására. A formátumot támogatják a Linuxos fejlesztői közösségek, valamint kereskedelmi és nyílt forrású szoftverek sora.

Jelenleg az OASIS nonprofit konzorcium kezeli. Nyílt, jól dokumentált szabvány, élénk fejlesztői közösséggel 8 . A leíró nyelv kiválasztását megelőzte egy általános összehasonlító felmérés is 9 .

2.3 Részletes jellemzők

Az XML, vagyis eXtensible Markup Language jelentése: bővíthető jelölőnyelv. A World Wide Web Consortium XML 1.0 ajánlása olyan szintaxist ad meg, melyet betartva különböző jelölő nyelvek (mint például az XHTML) hozhatóak létre. Ezeknek a nyelveknek a segítségével szabványos módon megoldható a különböző alkalmazások, platformok közötti adatcsere, felhasználva a már meglévő feldolgozó programokat, ami nagy mértékben lecsökkenti a fejlesztés időtartamát és költségét. A meglévő adatok szolgáltatása pedig egyszerűbbé válik, egy közös adatforrásból, de több formátumban is.

Az XML - a HTML nyelvtől eltérően - a tag-ek elnevezésében a kis- és nagybetűk használatára érzékeny jelölőnyelv, tehát a <pelda> a <Pelda> és a <PELDA> tag-ek egymástól különbözőek. A DocBook XML verziójában a tag-eket mindig kisbetűs írásmóddal használjuk. A tag-ekhez rendelt tulajdonságokat mindig idézőjelek közé kell zárnunk. Erre használhatjuk az egyszeres (') és dupla (") idézőjelet, azonban a nyomdai idézőjelet (" és ") nem.

Az elektronikus dokumentumok tárolására olyan saját XML formátumot használunk, amely több szabványos és elterjedt formátumra épül. A dokumentum felépítését tekintve a DocBook XML szabványt követi, ezt ajánlásunkban egyrészt szűkítjük, illetve kiegészítjük olyan elemekkel, amelyeket a dokumentumra vonatkozó metainformációk tárolására használunk majd.

A DocBook dokumentumtípust több mint tíz évvel ezelőtt a HaL Computer Systems és az O'Reilly & Associates hozta létre, később fejlesztésében részt vett a Novell, a Digital, a Hewlett Packard, a Sun, az SCO, és mások. Nyílt szabvány, jelenleg egy nonprofit konzorcium, az OASIS (Organization for the Advancement of Structured Information Standards) kezeli.

Mivel a DocBook dokumentumok felépítése követi a könyvek szerkezetét és nagyszámú elemmel rendelkezik a tartalom elrendezéséhez, jelentős létszámú szerzői közösség használja, továbbá támogatja számos kereskedelmi forgalomban lévő és szabad szoftver. A DocBook formátumot széles körben használják a fent említett számítástechnikai cégeken kívül a szabad szoftvereket fejlesztő közösségek pl. a Linux Documentation Project, a FreeBSD Documentation Project, a GNOME Documentation Project, a KDE Documentation Project, a Caldera Systems, a Mandrakesoft, a Red Hat és a SuSE, több millió oldalnyi dokumentáció, elektronikus könyv és más kiadvány tárolására.

A DocBook formátum minden olyan előnnyel rendelkezik, amivel az XML dokumentumok általában: logikus szerkezeti felépítésű, gép által értelmezhető, feldolgozható, valamint platform- és nyelvfüggetlen, testre szabható, és bővíthető.

A DocBook formátumot létező eszközök, kereskedelmi és szabad szoftverek már támogatják és ismerik, például az OpenOffice.org irodai szoftvercsomag, az emacs, Quanta, Altova XMLSpy és más XML szerkesztő programok.

A formátum fejlesztése folyamatos, élénk fejlesztői közösség működik közre a kidolgozásában, további alakításában. A DocBook viszonylag hosszabb ideje szerepel a palettán - így kiforrott, kipróbált formátumnak tekinthető. 10

A már meglévő és testre szabható szoftvereszközökkel a DocBook forrásfájlból konvertálhatunk (X)HTML, HTMLhelp, MIF (Adobe FrameMaker), PDF, PostScript, RTF (Microsoft), TeX, TXT, XHTML formátumokba, azaz így egy fájlból tudjuk kiszolgálni a különböző formátumú, de azonos tartalmú dokumentumok iránti igényeket.

Az alábbiakban röviden bemutatjuk egy DocBook dokumentum felépítését, a benne használt legfontosabb elemeket. Az interneten angol nyelven természetesen elérhető a teljes dokumentáció:
(http://docbook.org/tdg/en/ ).

2.4 Digitalizálás, a megjelenítés menete

A digitalizálás menetét - egyszerűsített módon - az következő ábrák szemléltetik 11 :

Tehát a folyamatok a következők:

1. a nyomtatott szöveg kódolása (XML), illetve eleve XML publikáció készítése;

2. Dublin Core és MARC XML metaadat sorok feltöltése;

3. a validálás (érvényesítési, ellenőrzési folyamat) elvégzése a dtd-vel (document type definition) 12 ;

4. majd a stíluslapokkal (CSS, melyek a HTML kimenet dizájnját adják) ellátott XSL-lel lefordítja az XML-t HTML-lé.

1. ábra

2. ábra

A Felsőoktatási Tankönyvpályázat keretében a feladatok megoszlottak a kiadók és a HIK között, a következők szerint:

A kiadók feladatai:

A HIK feladatai:

dtd-vel ellenőrzés;

a DCXML és MARCXML-ek javítása, kiegészítése (tapasztalat: a kiadók nagyobb része számára a könyvtáros szabványok nem ismertek);

az XML dokumentum lefordítása HTML-re, és elhelyezése a Felsőoktatási Tankönyvtárban vagy saját kiadói/bérelt szerveren (ahol a kiadói szerződések értelmében 15 évig térítésmentesen közreadhatók a dokumentumok).

2.5 A Felsőoktatási Tankönyv-, és Szakkönyvpályázat és a Kempelen Farkas Felsőoktatási Digitális Tankönyvtár

A Kempelen Farkas Felsőoktatási Digitális Tankönyvtár (továbbiakban: KFFDT) létrejöttét - áttételesen - az 1997-óta kiírt Felsőoktatási Tankönyv-, és Szakkönyvpályázatnak köszönheti. Ezen a pályázaton az elmúlt évek alatt 200 és 450 millió közötti Ft támogatást nyerhettek a pályázók, és ez több, mint ezer címet jelent. A Felsőoktatási Pályázatok Irodája, majd az Oktatási Minisztérium Alapkezelő Igazgatósága által kiírt pályázathoz 2004-ben - aktív HIK közreműködéssel - sikerült egy digitális 'lábat' csatolni, mely eredményeként közel száz cím készül(t) el elektronikus formában. Ezen elektronikus dokumentumok a tudományágak széles spektrumát ölelik fel az irodalomtól a mezőgazdasági technológiákig. Olyan kiadók jelennek meg itt, és adják térítésmentesen közre a tankönyveiket mint az Osiris, a Panem, a Balassi, a Typotex, a Mundus, a Mezőgazda- vagy éppen az Enciklopédia Kiadó, és rajtuk kívül sokan mások is.

A rendszer elsődleges feladata olyan "könyvek" tárolása, megjelenítése, melyek XML alapúak, és nyitott-, élénk fejlesztői közösséggel rendelkező DocBook szabvány szerint épülnek fel. A dokumentumok azonosító metaadat fejléce a Dublin Core-, illetve MARC szabványokat követi. Megjelenítésük, nyomtatásuk HTML, pdf, és Word formátumokban is lehetséges.

A szoftver alatt a Webra3 nevű portálmotor található; az adatbázis SQL.

Ezen célok egy része még nem valósult meg (pl.: az angol nyelvű felület), de elkészítésük folyamatban van.

A használt szabványok leíró nyelve: DocBook XML;

Azonosító metaadat struktúrák: Dublin Core 13 , az elektronikus dokumentumok leírására szolgáló MARC;

A jövőben beépített lehetőség:

3. A jövőbeli lehetőségek

3.1 Nyitott, szabadon hozzáférhető- vs. autentikációhoz kötött vagy megvásárolható tartalmak

Mint az előzőekben is jeleztük, hívei vagyunk a digitális tartalmaknak a felsőoktatásban. Ezért várhatóan további digitális tartalmak születnek majd a jövőben vagy pályázati úton, vagy piaci alapon álló szerveződések saját üzleti érdekei miatt.

Céljaink közé tartozik tehát az útmutató inkubátorház-szerű projekt szervezés 2005-ben is:

Mivel a piaci alapon működő kiadók nem válhatnak az állam kiszolgáltatottjává legfontosabb lépés az lenne, ha Magyarországon megindulna az elektronikus tankönyvpiac. Ehhez szükség lesz egy korszerű (az állami büdzsét kímélő) koncepcióra: kérdés, lehetséges-e egy önfenntartó elektronikus tankönyvpiac rendszer szegmenseinek üzleti, önellátó modelljének kialakítása?

Az első lépések megtételére már sor került.

Jegyzetek

1. www.tankonyvtar.hu

2. T. 15267. törvényjavaslat a felsőoktatásról, 2005. március http://www.om.hu/letolt/felsoo/benyujtott_torvenyjavaslat_marc_18.pdf

3. MKKE statisztikák 2004-ig: http://www.mkke.hu/4.html

4. Nagy Attila: Háttal a jövőnek? Bp., Országos Széchényi Könyvtár, Gondolat Kiadó. 2003.
A témával bővebben foglalkozik a hvg.hu -n frissen megjelent cikk (2005/13.) "teleremény":
http://hvg.hu/hvgfriss/2005.13/200513HVGFriss176.aspx?s=2005330nl

5. http://sdt.sulinet.hu/default.aspx

6. A könyvtáros szakmai közbeszédben egyre gyakrabban feltűnik a "funkcionális analfabétizmus" hagyományostól eltérő értelmezése. Az ortodox verzió a következő: a funkcionális analfabétizmus: az, ha valaki tanult ugyan írni, olvasni, számolni, de nem tudja a megszerzett tudást a gyakorlatban használni. A jelenlegi értelmezést így egészíthetnénk ki: valaki tanult ugyan írni, olvasni, számolni, de nem tud: a) (olvashatóan) kézzel írni, viszont klaviatúra segítségével igen (esetleg magas színvonalon), b) a nyomtatott könyv olvasásának folyamatossága lankasztja a figyelmét, ezért az olvasott szöveget nem tudja olvasni, értelmezni, de a képernyőn változatosan megjelenített, tömörített információ blokkokat feldolgozza, és megfelelően értelmezi, használja.

7. http://www.w3.org/XML/
http://www.xmlinfo.hu/XML/xmlalapok.html
http://www.xmlinfo.hu/XML/miazazxml.html
http://www.w3c.hu/forditasok/XML_10_pontban.html
Részletek kiemelve a HIK számára készített követelmény struktúrából (készítette: Bartal Tamás)

8. http://www.docbook.org/
http://www.oasis-open.org/about/

9. http://www.hik.hu/upload/doc/200405/xmlsablon.pdf

10. DocBook XML 4.2: http://www.oasis-open.org/docbook/ xml/4.2/index.shtml
Az OASIS támogatói: http://www.oasis-open.org/about/.

11. Részletesebb leírás található: Bíró Szabolcs: A szövegfeldolgozás modern eszközei - az SGML és XML nyelvek c. publikációjában. In.: Tudományos és műszaki tájékoztatás. 51. évf. 2004.10. sz.

12. További részletek itt: http://www.hik.hu/tankonyvpalyazat/dtd3.zip

13. http://dublincore.org/

14. A közeljövőben a Nemzeti Digitális Adattár is szolgáltatni fogja a KFFDT metaadatait. http://www.nda.hu/Engine.aspx

15. Sulinet Digitális Tudásbázis, http://sdt.sulinet.hu/

16.http://www.aicc.org/
http://www.adlnet.org/

Országos Széchényi Könyvtár
Észrevételek