DVITAS – tai Vytauto Didžiojo ir Mykolo Romerio universitetų mokslininkų projektas „Dvikalbis automatinis terminų atpažinimas“, finansuojamas Lietuvos mokslo tarybos.
Projekto metu buvo sukurta metodika, kuri leidžia automatiniu būdu lygiagrečiajame ir palyginamajame tekstynuose atpažinti angliškus ir lietuviškus specialios srities terminus, kai viena iš kalbų yra neturinti daug kalbinių išteklių ir yra morfologiškai turtinga. Projekto pasirinkta specialioji sritis – kibernetinio saugumo (KS) terminija. Taip pat sudaryta empiriniais duomenimis paremta dvikalbė KS terminų duomenų bazė, kuri atspindi KS terminų vartoseną įvairių žanrų ir tipų tekstuose nacionalinėje ir tarptautinėje aplinkoje.
KS sritis pasirinkta dėl jos ypatingo aktualumo šiandieninėje informacinėje visuomenėje. Ši sritis ypač dinamiška - nuolat atsiranda nauji KS srities dokumentai, juose formuojamos naujos sąvokos, kurių pavadinimai lietuvių kalba dar nenusistovėję, vartojami keliais variantais, dažnai originalo (anglų) kalba arba kaip hibridai (anglų ir lietuvių kalbų leksinių vienetų junginiai). Todėl KS terminų bazė šiuo metu itin reikalinga tiek teisės bei administracinių aktų rengėjams ir jų vertėjams, tiek informacinių technologijų specialistams, tiek plačiajai visuomenei.
Kuriant inovatyvią automatinio terminologinų duomenų ištraukimo iš dvikalbių išteklių metodiką, buvo ištirti ir išbandyti įvairūs naujausi besimokančių sistemų algoritmai ir neuroniniai tinklai. Mūsų žiniomis, ši metodika Lietuvoje dar nebuvo taikyta. Tikimės, kad sukurta duomenų bazė ir metodika galėtų padėti kurti ir kitų sričių terminų bazes.