SITTI Kalbos vartosenos tyrimų, išteklių ir technologijų mokslininkų grupė, kuri vykdo empirinius kalbos mokslinius tyrimus ir eksperimentinę plėtrą, ypač daug dėmesio skiriant įrankių kūrimui ir duomenų rengimui.
I. Pagrindinės tyrimų kryptys
Šios mokslininkų grupės tyrimų tematika apima tris pagrindines kryptis, bet jomis neapsiriboja:
Moksliškai susistemintų duomenų rengimą, validaciją ir tyrimus. Ši kryptis apima vienakalbių ir daugiakalbių, bendrųjų ir specializuotų tekstynų kaupimą, tekstynų pagrindu paremtų dabartinės lietuvių kalbos leksikografinių išteklių rengimą, terminografinių išteklių rengimą; išteklių, reikalingų gimtosios ir užsienio kalbos mokymui(si), rengimą; duomenų pritaikymą vartotojams; savo ir kitų institucijų parengtų kalbinių išteklių saugojimą CLARIN-LT duomenų saugykloje užtikrinant FAIR standartus; patogios prieigos prie kalbinių išteklių sukūrimą vartotojams.
Kalbos analizės metodų ir įrankių kūrimą bei tobulinimą. Ši kryptis apima morfologinį ir sintaksinį anotavimą bei analizę; semantinę analizę; medijų ir socialinių tinklų išteklių kaupimą bei analizę; automatinį pastoviųjų žodžių junginių identifikavimą ir analizę; leksinių gramatinių modelių identifikavimą ir analizę; taip pat natūraliosios kalbos apdorojimą bei sukurtų įrankių pritaikymą vartotojams. Ši kryptis yra glaudžiai susijusi su M2K tematika, nes šiuo metu dauguma natūraliosios kalbos apdorojimo uždavinių yra sprendžiami naudojant gilųjį mokymąsi ir neuroninius tinklus.
Lietuvių kalbos ir kitų kalbų vartosenos tyrimus. Ši kryptis apima empirinius lietuvių kalbos ir kitų kalbų kiekybinius ir kokybinius tyrimus, kurie skirti kalbos vartosenos reiškiniams analizuoti leksikos, gramatikos, semantikos lygmeniu, ir taip pat apima terminijos, pastoviųjų žodžių junginių, vertimo kalbos ar kt. tyrimus. Šios krypties tyrimai remiasi sukauptais ištekliais, metodais ir įrankiais.
II. Mokslinių tyrimų ir eksperimentinės plėtros taikymų sritys
Lietuvių kalbos ir kitų kalbų vartosenos tyrimai atliekami šiose srityse: kalbotyros, vertimo, švietimo ir pedagogikos, teisės, medicinos, žiniasklaidos ir socialinių tinklų, ekonomikos ir kitose.