Žodyne pateikiama 73 tūkstančiai bendrinių žodžių ir jų formų. Tikrinių žodžių kirčiavimo ir tarties normos taip pat aktualios, tačiau kol kas jie čia nededami. Tai bus padaryta vėliau, gerai išstudijavus ir parengus turimą medžiagą.
Rengiant žodyną, atmestos svetimybės, netaisyklingos darybos, pasenę ir labai reti tarptautiniai žodžiai.
Į žodyną pateko tos formos, kurios buvo pavartotos pasirinktuose tekstuose. Todėl kai kurių žodžių čia galima rasti net kelias formas, o kitų – vieną kitą. Ateityje ketinama žodyną išplėsti ir pateikti daugiau tarties ir kirčiavimo požiūriu pavojingų formų, net jei jų nerasta tekstuose.
Bendrinėje kalboje paprastai rekomenduojamos ilgosios formos (pvz.: einame, eiti, medyje). Tačiau vartosenoje gana dažnos ir trumposios formos (pvz.: einam, eit, medy), nemažai jų ir šiame žodyne. Sudarytojų nuomone, tokie variantai nėra tarties ar kirčiavimo sritis, todėl žodyne pateikiamos tik tų žodžių trumposios formos, kurios pasitaikė pirminėje medžiagoje. Skirtingai nei tarties ar kirčiavimo variantai, vartotojai čia neras visų trumpųjų formų.
Žodyno medžiagą sudaro ištraukos iš Dabartinės lietuvių kalbos tekstyne sukauptų mokslinio stiliaus leidinių, publicistinių tekstų, lietuvių autorių romanų, administracinių dokumentų. Tai medžiaga iš „Morfotaktikos ir fonotaktikos duomenų bazės“, kurią VDU mokslininkai rengė ne vienerius metus. Šios bazės pagrindu yra publikuoti morfemikos žodynai (žr. Rimkutė, Kazlauskienė, Raškinis 2011) ir parengta internetinė morfemikos bazė.
Medžiagos proporcijos tokios: beveik po ketvirtadalį mokslinių (26 proc.), publicistinių (28 proc.) ir grožinių (25 proc.) tekstų, mažiau nei dešimtadalis (7 proc.) administracinių tekstų ir daugiau nei dešimtadalis (14 proc.) įvairių spontaninės kalbos fragmentų.
Mokslinio stiliaus tekstų atkarpos lygiomis dalimis parinktos iš socialinių, humanitarinių ir fizinių mokslų darbų: D. Crystalo „Kalbos mirtis“ (2005), A. Ivaškevičienės „Pramonės įmonių vadyba“ (1996), A. Kanapicko „Molekulinė fizika“ (2004), B. Masionienės „Baltijos tautos“ (1996), R. Miliūnaitės „Lietuvių kalbos gramatikos norminimo pagrindai“ (2003), A. Paškaus „Dievai, dvasios ir žmonės Naujajame amžiuje“ (1993), J. D. Peterso „Kalbėjimas vėjams: komunikacijos idėjos istorija“ (2004), L. Simanausko „Informacinių sistemų analizė“ (1997), A. Skirkevičiaus „STATISTICA. Pirmieji žingsniai“ (2005), A. Suslavičiaus „Socialinė psichologija“ (1999), R. Tarvydo „Gravitacinio šlaito uolienų slinkimo gamtinės sąlygos ir dinamika“ (1995). Mokslinio stiliaus tekstuose gausu įvairių sutrumpinimų, datų, skaitmenų. Jie, jei tik buvo įmanoma (t. y. pavartoti ne formulėse), perrašyti žodžiais.
Publicistinio stiliaus tekstų atkarpos parinktos iš periodinių leidinių: „Kauno diena“, „Lietuvos rytas“, „Mažylis“, „Mokslas ir technika“, „Mūsų gamta“, „Sveikata“, „Tėviškės žinios“, „Žemės ūkis“. Ir mokslo darbai, ir periodiniai leidiniai pasirinkti tokie, kad būtų kuo didesnė teminė įvairovė (moksliniai straipsniai iš periodinių leidinių nebuvo įtraukti).
Grožinio stiliaus tekstų panašios apimties atkarpos parinktos iš lietuvių autorių kūrinių: Alės Rūtos „Vargingos Tėvynės vaikai“ (2000), A. Andriuškevičiaus, G. Beresnevičiaus, S. Gedos, S. Parulskio, G. Radvilavičiūtės „Siužetą siūlau nušauti“ (2002), J. Apučio „Skruzdėlynas Prūsijoje“ (1989), S. Babono „Trys sugrįžimai namo“ (1995), V. Dautarto „Senojo gluosnio pasaka“ (1987), J. Erlicko „History of Lithuania“ (2000), V. Girdzijausko „Palūkėk, mirtie“ (2000), L. Gutausko „Laiškai iš Viešvilės “ (2001), J. Kralikausko „Titnago ugnis“ (1993), R. Lankausko „Nė vienas nebuvo pagailėtas“ (1990), R. Marčėno „Išdraskytų lizdų gandrai“ (1991), V. Mykolaičio-Putino „Altorių šešėly“ (1983), B. Pečiokaitės-Adomėnienės „Penktas: nežudyk“ (1994), V. Zaikausko „Pėdsakai baigiasi rojuje“ (2000), J. Žilinsko „Genomas 3000“ (2004).
Administracinio stiliaus tekstų atkarpos parinktos iš Lietuvos Respublikos darbo kodekso patvirtinimo, įsigaliojimo ir įgyvendinimo įstatymo (2002 m. birželio 4 d. Nr. IX-926); Lietuvos profesinių sąjungų konfederacijos įstatų (2005-02-12); Lietuvos Respublikos darbuotojų saugos ir sveikatos įstatymo (2003 m. liepos 1 d. Nr. IX-1672); Lietuvos Respublikos trišalės tarybos nuostatų (2005 m. sausio 25 d.); Lietuvos Respublikos aplinkos ministro įsakymo dėl valstybinės saugomų teritorijų apsaugos kontrolės nuostatų patvirtinimo (2004 m. sausio 27 d. Nr. D1-43); įvairių VDU padalinių nuostatų (2003 m.); VDU Senato posėdžio protokolų (2002 m.). Daugelis sutrumpinimų, jei tik buvo galima, perrašyti žodžiais. Neperrašyta ir, savaime suprantama, į žodyną neįtraukta: skyrių, poskyrių, dokumentų numeriai, datos, dokumentų rekvizitai.
Žodyne panaudoti ir Sakytinės kalbos įrašų bazės fragmentai. Šiuos tekstus reikėjo šiek tiek patikslinti: kai ką ignoruoti, kai ką įrašyti, pvz.: nebuo nie-nieko ge perrašytas nebuvo nieko gero. Daugelis šios bazės įrašų fiksuoja ne bendrinės, o šnekamosios kalbos pavyzdžius. Kadangi žodyno tikslas – bendrinės kalbos tartis, dėl to ne visi žodžiai, kurie buvo pavartoti bazėje, įtraukti į tarties žodyną (atsisakyta akivaizdžių svetimybių, žargonybių). Žodyne neatsispindi ir tarimo įvairovė (tą galima rasti pačiame garsyne) – visi žodžiai transkribuoti pagal bendrinės tarties normas.
Visa tiriamoji medžiaga buvo automatiškai sukirčiuota ir transkribuota. Tam buvo naudojamos mūsų parengtos kompiuterinės priemonės (automatinės skiemenavimo, kirčiavimo ir transkribavimo programos, apie jas plačiau žr. Kazlauskienė, Raškinis, Vaičiūnas, 2010, kur išsamiai aprašytos ir skiemenavimo, kirčiavimo bei transkribavimo metodikos). Automatinio kirčiavimo ir transkribavimo programos padarė nemažai klaidų, jos buvo ištaisytos rankomis.
Dalis medžiagos buvo rengiama pagal garsinius įrašus. Šiuose tekstuose sužymėtas ir žodžių šlijimas. Tačiau į prozodinį žodžių savarankiškumą tik iš dalies atsižvelgta. Jis buvo svarbiausias kriterijus analizuojant morfologinių samplaikų kirčio vietą (pvz.: kieno nόrs), bet gramatiškai savarankiški žodžiai (net jei jie vienskiemeniai ir konkrečiu atveju neteko kirčio) žodyne pateikiami neatsižvelgiant į šlijimą. Pavyzdžiui, prozodinis vienetas jis neĩs išskaidytas ir pateikiamas prie pavyzdžių jìs ir neĩs.
Atskirai reikia paminėti kiek kitokį, nei įprasta lietuvių kalbos gramatikose, kalbos dalių skirstymą. Sudarytojų nuomone, tarties žodyne nėra būtinybės nurodyti konkrečios nekaitomos kalbos dalies (o tą padaryti netgi ne visada paprasta), todėl visi šie žodžiai pateikiami su viena nuoroda nkt (nekaitomas).
Žodyne atsirado žyma morfologinė samplaika (morf. s.). Morfologinė samplaika – dažnai vartojami dvižodžiai ar ilgesni iš kaitomų ir nekaitomų kalbos dalių sudaryti sustabarėję junginiai, sudarantys semantiškai bei sintaksiškai nedalomą vienetą (Rimkutė 2006). Šie vienetai neretai tariami kaip vienas fonologinis žodis.
Elektroninis leidinio formatas lėmė ir žodyno struktūrą. Paieškos lange reikia įrašyti ieškomą žodį ar jo formą. Kompiuterio ekrane bus pateikta:
Paieškos lange galima įrašyti tik dalį žodžio ir žvaigždutę, pvz., nam*. Kompiuterio ekrane matysite visus žodžius, prasidedančius nam-, pvz.: namą, namai, naminis, namiegai, naminis, namučius ir kt. Šiuo atveju visi žodžiai bus pateikti lentelėje. Tam, kad žodynu galėtų naudotis ir netobulai lietuvių kalbos rašybą išmanantys negimtakalbiai, žodžiai filtruojami ir lentelėje pateikiami ne tik pagal konkrečias lietuviškos abėcėlės raides, pvz., įrašius lis*, bus pateikti žodžiai, prasidedantys lis*, lįs*, lys*. Toks būdas gali būti parankus ir tiems, kurie žodyne ieškos kuo panašesnių žodžių su skirtingos trukmės balsiais.
Rezultatus galima išsispausdinti (paspausti spausdintuvo paveikslėlį) arba išsisaugoti (paspausti rodyklės paveikslėlį).