Sveiki

DVITAS – tai Vytauto Didžiojo ir Mykolo Romerio universitetų mokslininkų projektas „Dvikalbis automatinis terminų atpažinimas“, finansuojamas Lietuvos mokslo tarybos.

Projekto tikslas

Projektu siekiama sukurti metodiką, kuri leistų automatiniu būdu lygiagrečiajame ir palyginamajame tekstynuose atpažinti angliškus ir lietuviškus specialios srities terminus, bei sudaryti empiriniais duomenimis paremtą dvikalbę tos srities terminų bazę, viešai prieinamą internete. Šiam tyrimui pasirinkta specialioji sritis – kibernetinio saugumo terminija.

Sprendžiama mokslinė problema

Projekto metu sprendžiama mokslinė problema – tai automatinis terminografinės medžiagos rinkimas iš dvikalbių duomenų, t. y. iš lygiagrečiųjų ir palyginamųjų tekstynų, kai viena iš kalbų yra neturinti daug kalbinių išteklių ir yra morfologiškai turtinga. Įgyvendinant projekto tikslą, bus sukurta inovatyvi metodika, kuri, mūsų žiniomis, Lietuvoje dar nebuvo taikyta. Kuriant ją, planuojama ištirti galimybes naudoti naujausius besimokančių sistemų algoritmus ir neuroninius tinklus dvikalbių terminų atpažinimui.

Kibernetinio saugumo (KS) sritis

KS sritis pasirinkta dėl jos ypatingo aktualumo šiandieninėje informacinėje visuomenėje. Ši sritis ypač dinamiška - nuolat atsiranda nauji KS srities dokumentai, juose formuojamos naujos sąvokos, kurių pavadinimai lietuvių kalba dar nenusistovėję, vartojami keliais variantais, dažnai originalo (anglų) kalba arba kaip hibridai (anglų ir lietuvių kalbų leksinių vienetų junginiai). Todėl KS terminų bazė šiuo metu itin reikalinga tiek teisės bei administracinių aktų rengėjams ir jų vertėjams, tiek informacinių technologijų specialistams, tiek plačiajai visuomenei.

Kuriami ištekliai

Projekto metu bus sukurti ir atverti visuomenei (paskelbti CLARIN saugykloje) dvikalbiai (anglų-lietuvių kalbų) kibernetinio saugumo srities tekstynai – lygiagretusis ir palyginamasis. Jie atspindės kibernetinio saugumo terminų vartoseną įvairių žanrų ir tipų tekstuose nacionalinėje ir tarptautinėje aplinkoje. Iš tekstynų surinkta terminografinė medžiaga bus skelbiama atviroje anglų ir lietuvių kalbų kibernetinio saugumo terminų duomenų bazėje. Ši bazė galėtų tapti modeliu ir kitų sričių terminų bazių kūrimui, pasitelkus moderniausias technologijas, įgalinančias automatizuoti terminografinės medžiagos rinkimo procesus.