Kuriama Lietuvių kalbos sintaksinės-semantinės analizės informacinė sistema

Globalizacija, informacinių ir ryšių technologijų pažanga, augantis tekstinės informacijos kiekis pasauliniame saityne, nauji bendravimo būdai (pavyzdžiui, socialiniai tinklai) ir verslo modeliai lemia didėjantį poreikį kurti naujus, su lietuvių rašytine kalba susijusius sprendimus ir elektronines paslaugas, sugebėsiančias apdoroti kalbą. Reikalingos kokybiškos, naujos kalbinės ir semantinės technologijos, kurios mokėtų analizuoti ir apibendrinti informaciją pagal jos prasmę ir leistų piliečiams naudotis virtualios erdvės paslaugomis jų gimtąja kalba. Tai ne tik padarytų virtualią erdvę prieinamą didesniam asmenų skaičiui, bet padėtų išsaugoti gimtąją kalbą ir tautinį tapatumą globalizacijos bei migracijos kontekste. Dėl šių priežasčių Vytauto Didžiojo universitetas (VDU) kartu su partneriu Kauno technologijos universitetu ėmėsi įgyvendinti projektą „Lietuvių kalbos sintaksinės-semantinės analizės sistema tekstynui, lietuviškam internetui ir viešojo sektoriaus taikymams“ (VP2-3.1-IVPK-12-K-01-007). Šis projektas finansuojamas Europos Sąjungos struktūrinių fondų lėšomis.

VDU Humanitarinių mokslų fakulteto Kompiuterinės lingvistikos centro ir Informatikos fakulteto mokslininkai jau seniai specializuojasi kalbos technologijose ir kalbos išteklių kūrime bei vystyme. Dėl riboto finansavimo iki šiol nebuvo galimybės sukurti kalbos technologijų ir išteklių infrastruktūros bei platformos, kuri atitiktų Europos Sąjungos standartus. Tai viena pagrindinių priežasčių, kodėl kalbos technologijos Lietuvoje nuo Europos Sąjungos lygio atsilieka 5–6 metais. Projekto metu kuriama informacinė sistema leidžia užpildyti susidariusią spragą, priartėti prie Europos Sąjungos bendro lygio, o kartu VDU ir partnerio KTU mokslininkams atveria naujas mokslinių tyrimų ir eksperimentinės plėtros galimybes, kurios sudarys naujas taikymo perspektyvas verslo pasauliui.

Įgyvendinamo projekto metu numatoma sukurti Lietuvių kalbos sintaksinės ir semantinės analizės informacinę sistemą (LKSSAIS), leisiančią integruotis į Europinę šios srities mokslinių tyrimų erdvę ir sukurti mokslinę bazę tolesniems kompiuterinės lingvistikos ir semantikos tyrimams. Kuriamos lietuvių kalbos sintaksinės ir semantinės analizės informacinės sistemos (LKSSAIS) paskirtis – užtikrinti lietuvių rašytinės kalbos sintaksinės ir semantinės analizės paslaugų teikimą, kaupti ir tvarkyti lietuvių kalbos lingvistinius ir semantinius išteklius.

Sistema teiks lietuvių rašytinės kalbos naujovių vartosenos, sintaksinės–semantinės analizės ir lietuviškų interneto svetainių turinio analizės paslaugas plačiam galutinių vartotojų ratui: nuo moksleivių ir studentų, norinčių pasitikrinti rašto darbus, iki interneto svetainių kūrėjų, mokslininkų – lietuvių kalbos tyrėjų ir paslaugų kūrimo specialistų. Pastarieji galės įtraukti LKSSAIS paslaugas į savo informacines sistemas arba naudoti jas naujoms paslaugoms kurti.

Visiems interneto vartotojams prieinamos lietuvių rašytinės kalbos sintaksinės–semantinės analizės ir elektroninės paieškos paslaugos suteiks galimybę atpažinti tam tikroje srityje atsirandančias kalbos vartosenos naujoves, surasti ir koreguoti gramatines klaidas (ne tik žodžių rašybos, bet ir žodžių derinimo, sintaksines klaidas, netinkamas formuluotes), atlikti semantinę paiešką tekstuose. Suteiktos naujos galimybės padidins taisyklingą lietuvių kalbos vartojimą elektroninėje erdvėje, palengvins reikiamos lietuvių kalba išreikštos informacijos paiešką. Kadangi dėl informacijos gausos ir pertekliaus jos paieškai darbuotojai praleidžia iki 40 proc. darbo laiko, mažėja jų darbo efektyvumas ir teikiamų paslaugų kokybė. Efektyvi informacijos paieška leis viešajam ir privačiam sektoriui taupyti darbo mokos lėšas, didins darbuotojų efektyvumą ir teikiamų paslaugų (ypač susijusių su informacijos paslaugomis ir produktais) kokybę. Tai labai svarbu kalbant apie viešojo sektoriaus teikiamas paslaugas gyventojams.

Šiuolaikinė lietuvių rašytinės kalbos išteklių ir priemonių infrastruktūra tiek paprastiems vartotojams, tiek mokslininkams, specialistams ir paslaugų kūrėjams teiks prieigą prie galutiniams vartotojams skirtų kalbos paslaugų, esamų rašytinės lietuvių kalbos išteklių ir bazinių sintaksinės-semantinės analizės priemonių, kurias bus galima naudoti kuriant naujas elektronines paslaugas ar verslo taikymus galutiniams vartotojams. Visa tai vienija aukštesnis tikslas – saugoti ir tausoti lietuvių kalbą. Laiku nesukūrus tinkamų rašytinės lietuvių kalbos saugojimo ir apdorojimo technologijų, jos vartojimas informacinėse technologijose stipriai sumažėtų, o laikui bėgant net ir išnyktų, kadangi ją nukonkuruotų kitoms kalboms pritaikytos technologijos.

Projektas, kurio biudžetas beveik 11 mln. Lt bus įgyvendinamas 30 mėnesių. Projektas finansuojamas ES struktūrinių fondų ir Lietuvos Respublikos biudžeto lėšomis, pagal Ekonomikos augimo veiksmų programos, patvirtintos 2007 m. liepos 30 d. Europos Komisijos sprendimu Nr. K(2007)3740, 3 prioriteto „Informacinė visuomenė visiems“ įgyvendinimo priemonę Nr. VP2-3.1-IVPK-12-K „Lietuvių kalba informacinėje visuomenėje“. Projekto partneris Kauno technologijos universitetas.

ERPF_logo

Palikti atsiliepimą

El. pašto adresas nebus skelbiamas.