Chatbot alapozó - Öntsünk tiszta vizet a pohárba

Ha el akarunk igazodni a hirtelen nagyon divatossá vált és felkapott Chatbot témában, ejtenünk kell pár szót a chat-szoftverek képességeiről és típusairól. Annál is inkább szükség van erre, mert néhány aktuális sajtómegjelenésben egymástól alapjaiban eltérő chatbot szoftvereket hoznak közös nevezőre, ami a témában kevéssé elmélyült felhasználókat megtévesztheti.

A jelenlegi chatbotok három kategóriába sorolhatók:

  1. Determinisztikus chatbotok
  2. Mesterséges intelligencián alapuló, domain specifikus chatbotok (ide tartozik az MKIK Modern Vállalkozások Programja keretében létrejött eMI chatbot is)
  3. Generatív chatbotok (pl. ChatGPT)

A determinisztikus vagy szabály-alapú chatbotok egyoldalú, zárt utasítás-készletű kommunikációra képesek. A chatbot működése a klasszikus szoftverek folyamatmodelljét követi: többszintű menürendszer, ami előre definiált elágazásokon és válaszlehetőségeken keresztül vezeti el a felhasználót a megcélzott műveletig.

A determinisztikus chatbotok egyes részterületek kezelésére viszonylag hatékonyak lehetnek, de rendkívül komoly programozói és lektorálási erőforrást igényelnek, és ezzel együtt is kevés közük van a természetes nyelvi párbeszédekhez (nem értik meg a szabad szöveges interakciókat). Két szélsőséges példaként ide sorolhatóak a messenger chatbotok (a facebook fiókjához bárki illeszthet ilyen chatbotot), másrészt az ezeknél nagyságrendekkel nagyobb tudásbázissal rendelkező szakterületi chatbotok. Az utóbbira magyar nyelvű  példaként a Telekom Vanda asszisztensét vagy a MÁV Elvira chatbotját említhetjük. Divatos lett azt mondani, hogy egy messenger chatbotot bárki összerakhat, ezért teljesen felesleges fejlesztési pénzeket költeni egyedi chatbot fejlesztésekre. Magunk is szívesen bíztatunk erre bárkit, de árulkodó jel, hogy a facebook-on valóban jól működő chatbotot nem nagyon találunk (különösen magyar nyelven nem). Azok, akik próbálkoztak már chatbot fejlesztéssel, pontosan tudják, hogy az egyszerűséget és közvetlenséget sugalló chatbot műfaj rendkívül erőforrásigényes, és determinisztikus módszerekkel lényegében reménytelen feladat akár csak megközelíteni is az emberi párbeszéd finom árnyalatait.

Az utóbbi igény szülöttei a 2018 körül megjelenő, mesterséges intelligencián alapuló chatbotok. Ezek a  túlnyomórészt angol nyelven kommunikáló szoftverek a gépi tanulás eszköztárát alkalmazzák (deep learning, neurális hálózatok). Képesek szabad szöveges üzenetek megértésére, a beszélgetés kontextuális információnak feldolgozására is és többlépéses, előre nem definiált párbeszédfordulatokra. Ezeknél a szoftvereknél nem a beszélgetések szabályrendszerének kidolgozása az elsődleges feladat, hanem a tanító környezet minél hatékonyabb és testre szabottabb megvalósítása (erre utal a "domain specifikus" jelző). Bár a deep learning algoritmusok nagyságrendekkel csökkentik a tanításhoz szükséges erőforrásokat, és számos humanoid vonást is képesek felmutatni, az asszisztált tanítás erőforrásigénye így is viszonylag magas.

Magyar nyelven eddig két-három ilyen szoftverről tudunk, és ezek közül az egyik az MKIK Modern Vállalkozások Programja keretében, uniós támogatással fejlesztett eMI chatbot. Egészen a múlt év végéig nem volt olyan "dobozos" keretrendszer, vagy olyan általános jellegű tudástár, ami (fél)kész megoldásként tudott biztosítani egy magyar nyelven kommunikáló, MI alapú chatbotot, ezért a fejlesztési feladat újszerű és előremutató volt. Ilyen keretrendszer valójában ma sincs, de a ChatGPT megjelenése, és a folyamatosan fejlesztett csatlakozási felülete újabb lökést adhat a magyar nyelvű chatbot fejlesztéseknek.

Az MI alapú chatbotok következő generációját a generatív chatbotok képviselik. Az első kísérletek alig két évvel ezelőtt, 2021-ben indultak, és a folyamat záróakkordja a ChatGPT tavaly decemberi megjelenése volt. A tanítása szinte felfoghatatlan léptékű adattömegre támaszkodott – ilyen terjedelmű tanításra szigetszerű projekteknek esélye sem lehet. A ChatGPT-ben olyan általános tudástömeg halmozódott fel, ami támaszul szolgálhat minden szakterületi chatbot számára.

A ChatGPT az első olyan, nem Magyarországon készült szoftver, ami virtuózan alkalmazza a magyar nyelvi fordulatokat, és korábban soha nem látott szintű kontextualitást produkál. Jól ismertek azonban az árnyoldalai is:  a ChatGPT által adott válaszok és információk gyakran nem relevánsak sőt néha kifejezetten félrevezetőek vagy akár megtévesztőek is lehetnek. Ezek a kisebb-nagyobb pontatlanságok elfogadhatóak, akár inspirálóak is lehetnek – hiszen soha nem teljesen alaptalanok –, de egy "hivatalos" információkat közvetítő chatbot a saját tárgyterületén belül nem engedhet meg ilyen bizonytalanságokat.

A további fejlesztések iránya várhatóan az MI alapú, domain specifikus chatbotok, illetve az általános karakterű, generatív chatbotok képességeinek egyesítése lesz. A domain specifikus funkcionalitás biztosíthatja az információk relevanciáját, megbízhatóságát és ellenőrzöttségét, a generatív modelleknek pedig az általános tanítási folyamatok részleges automatizálásában, kiszélesítésében, továbbá a kontextualitás magasabb szintre emelésében lesz nélkülözhetetlen szerepük.