Magyar Tudomány, 2007/03 268. o.

Beszéd és beszédtudomány III.Lakossági gyógyszerinformációs

rendszer fejlesztése

beszédkutatási eredmények alapján


Olaszy Gábor

az MTA doktora, tudományos főmunkatárs, egyetemi tanár

MTA Nyelvtudományi Intézet és BME Távközlési és Médiainformatikai Tanszék

olaszy nytud.hu


Haraszti Csaba

főosztályvezető

Országos Gyógyszerészeti IntézetAz utóbbi két évtizedben a beszédkutatásnak kialakult egy speciális ága, a beszédtechnológia, amely a kutatási eredményeket interdiszciplináris formába öntve hoz létre új, komplex megoldásokat. Egy ilyen – a társadalom széles rétegeit szolgáló – beszédtechnológiai eredményen alapuló információs rendszert ismertetünk a jelen cikkben.

A Gyógyszervonal elnevezésű telefonos szolgáltatás biztosítja a lakosságnak, hogy a gyógyszerekkel kapcsolatos alapvető információkhoz hozzájusson helytől és időtől függetlenül, tehát a nap huszonnégy órájában. Ilyen adatelérési lehetőség mindeddig nem állt rendelkezésre (tudomásunk szerint külföldön sem). A rendszert a BME Távközlési és Médiainformatikai Tanszéke (TMIT) és az Országos Gyógyszerészeti Intézet (OGYI) fejlesztette ki 2005–2006-ban egy elnyert GVOP-pályázat keretében. Magyarországon jelenleg körülbelül ötezer, különböző kiszerelésű, OGYI által törzskönyvezett gyógyszer van. Évente mintegy négyszáz új gyógyszer jelenik meg, és hozzávetőlegesen ugyanenynyit vonnak ki a forgalomból. A Gyógyszervonal információs rendszer mind a szakembereknek, mind a lakosságnak segítség a betegtájékoztatók szövegéhez történő szabad hozzáférésben.

A rendszer tervezői célul tűzték ki a természetes beszédkommunikáció géppel támogatott formájának a megvalósítását, ez a fejlesztés fő újdonsága. Ez azt jelenti, hogy felhívunk egy telefonszámot, és emberi hangon „beszélgetést folytatunk” a géppel, bár erősen korlátozva a dialógust a gyógyszerekkel kapcsolatos kérdésekre. A „géppel” történő beszélgetés megvalósításához számos fonetikai, beszédtechnológiai és műszaki problémát kell megoldani. Beszédszintetizátor szükséges ahhoz, hogy a hívó fél részére az információs rendszer szövegét felolvassuk, az emberi beszéd feldolgozásához pedig beszédfelismerőt kell alkalmaznunk. Mindkettő egy-egy beszédtechnológiai modulként működik az információs rendszerben.

Az alapvető gondot ezeknek a gépi moduloknak az alkalmazásánál az jelenti, hogy a gép nem ismeri a nyelvet. A beszédszintetizátorral lényegében betűk sorozata szólaltatható meg; a beszédfelismerő szoftver pedig nem képes nyelvileg is feldolgozni az akusztikus jelet, csupán összehasonlítja azt a memóriájában tárolt mintákkal. A bejövő akusztikus jelet a leghasonlóbb tárolt mintához fogja hozzárendelni. A Gyógyszervonal információs rendszert az 1. ábra szemlélteti.

A rendszer 11 fő modult tartalmaz. 1. A hívó fél az adatmegadáshoz két forma közül választhat. Beszéddel megadja a gyógyszer nevét, ilyenkor a dialógusvezérlő a 9. beszédfelismerő bemenetére irányítja a jelet, avagy kéri a gyógyszer törzsszámát (négyjegyű szám, ez minden gyógyszerdobozon megtalálható). Ez utóbbi esetben a dialógusvezérlő a 3. blokkban keresi meg a gyógyszert. 2. A dialógusvezérlő végzi a párbeszédet a hívó fél és a gép között. A lehetőségeknek megfelelően, barátságos, egyszerű szervezésű dialógust alakítottunk ki. A bejelentkezéskor a gép üdvözli a hívót. Ha az ügyfél először hívja a rendszert, akkor részletes információt is kérhet. Ha a hívó gyakrabban használja a rendszert, akkor a bejelentkező szöveg átugorható. Ebben az esetben azonnal a gyógyszer nevét kéri a rendszer. A párbeszéd során a hívó fél a kiválasztott gyógyszerhez tartozó minden fontos adatot megtudhat. A dialógusvezérlő mondatait kellemes hangszínezetű női hang olvassa fel, nyugodt tempóban. 3. Ez a modul az adattár, amelyik a gyógyszerek törzskönyvi számát és a hozzájuk rendelt gyógyszerneveket tartalmazza. 4. Itt található a gyógyszerek nevéhez tartozó betegtájékoztatók szövege, az OGYI által jóváhagyott formában. Hatféle információt kérhet az ügyfél: általános tájékoztató, szedés előtti tudnivalók, alkalmazási javaslatok, mellékhatások, a készítmény tárolása, egyéb tudnivalók. 5. Ez az adattár a beszédszintetizátornak előkészített, kódolt formátumú szövegeket tartalmazza. 6. A beszédszintetizátor olvassa fel a 4. adattár szövegeit. A szintetizátor a BME TMIT Profivox beszédszintetizátorából (Olaszy et al., 2000) kialakított, speciálisan gyógyszerinformációs szövegek felolvasására fejlesztett szoftver. A betegtájékoztatók szövegének fogalmazási stílusa, néha a központozása is, eltér az általános szövegekétől. Ezért az itt megkívánt felolvasási stratégiához sajátos szabályokat kellett kialakítani (8. blokk), meghatározva az idegen szavak kiejtési szabályait is (7. blokk). Több ezer, főként latin szó kiejtését kellett meghatározni és beépíteni a kivételszótárba, hogy a felolvasások elfogadhatóan hangozzanak. Ez a szótár nyitott, hiszen az előforduló újabb szavak kiejtését is meg kell határozni. 9. A beszédfelismerő modul egy beszélőtől független mintaillesztő egység (Fegyó et al. 2003). Az ügyfél beszédének akusztikai jeleiből kiszámított paramétermezőt hasonlítja össze az adattárában eltárolt sok ezer minta paramétereivel (11. blokk), és kiválasztja a leghasonlóbbat. A felismerő modul tehát csak akkor működik jól, ha az ügyfél olyan gyógyszernevet mond be, amelyik szerepel a rendszer ötezres adattárában. 10. A beszédfelismerő különlegessége, hogy új felismerendő elem esetén nem kell ún. „tanítást” végezni. Speciális adatábrázolási forma teszi lehetővé, hogy fonetikai azonosítók segítségével megadható az új felismerendő elem paraméterrendszere. A beszédfelismerő szótára éppúgy nyitott, mint a beszédszintetizátoré.

A Gyógyszervonal lakossági információs rendszerrel sok esetben megelőzhető a téves gyógyszerhasználat. Lehetőséget teremt társadalmilag hátrányos helyzetű csoportok (például idősek, sérült emberek, kórházban fekvők) számára is a betegtájékoztatókban rögzített, fontos információk megszerzésére. A közegészségügyi információs ellátottság egyik fontos eleme lehet az ilyen szolgáltatás, amely interdiszciplináris együttműködés következménye, és alapvetően a beszédkutatás eredményeit használja fel.


Kulcsszavak: beszédszintézis, gépi beszédfelismerés, információs rendszer, dialógusvezérlő, gyógyszertájékoztató


Irodalom

Olaszy Gábor – Németh G. – Olaszi P. – Kiss G. – Zainkó Cs. – Gordos G. (2000): Profivox – a Hungarian TTS System for Telecommunications Applications. International Journal of Speech Technology. 3–4. 201–215.

Fegyó Tibor – Mihajlik P. – Szarvas M. – Tatai P. – Tatai G. (2003): Voxenter – Intelligent Voice Enabled Call Center for Hungarian. Proceedings of 8th European Conference on Speech Communication and Technology, Geneva. 1905–1908.1. ábra • A Gyógyszervonal információs rendszer felépítése<-- Vissza a 2007/03 szám tartalomjegyzékére


<-- Vissza a Magyar Tudomány honlapra