Ar ištvers ledynmetį mažų tautų kalbos? (2)

Pabaiga, pradžia 2012 m. Nr. 22.

Tęsiame pašnekesį su kaimynu iš Latvijos UAB Tilde direktoriumi, META-NORD projekto vadovu Andrejumi VASILJEVU (Andrejs Vasiljevs). Svečias dalyvavo lapkričio 14 d. Lietuvos Respublikos Seime vykusioje tarptautinėje konferencijoje „Europos kalbos technologijų amžiuje: quo vadis?“ Konferencijos organizatorius – Lietuvių kalbos institutas, o dalyvavo tie, kuriems rūpi mažų tautų kalbų likimas sparčiai besikeičiančių skaitmeninių technologijų amžiuje. Pranešimus skaitė, diskusijose dalyvavo Europos šalių mokslo institucijų vadovai, politikai, kalbos technologijų ekspertai ir kiti suinteresuoti asmenys.
Pokalbyje su Andrejumi Vasiljevu aptariame daugiau baltiškąjį konferencijos akcentą, tačiau išsakytos mintys, ko gero, svarbios ir visoms Europos Sąjungos mažosioms šalims, kurių kalboms tenka spręsti panašius gyvenamojo meto iššūkius. Dar pridursime, kad bendrovė Tilde patenka tarp 20 svarbiausių Baltijos šalių informacinių technologijų įmonių, jos sukurta vertimo platforma „LetsMT!“ pelnė 2012 m. novatoriškiausio Latvijos produkto apdovanojimą.

Mokslo Lietuva. Gerbiamasis pone Andrejau, esate ne naujokas konferencijose, panašiose į vykusią Vilniuje. Gal galėtumėte ją palyginti su kiek anksčiau surengtąja Rygoje?

2013_01_11
UAB „Tilde“ direktorius, META-NORD projekto vadovas Andrejus Vasiljevas (Andrejs Vasiljevs)

Andrejus Vasiljevas. Pasakysiu, kuo ši Vilniuje vykusi konferencija buvo sėkminga. Labai svarbu, kad ne atskirų universitetų ar institucijų mokslininkai, informatikai ir kitų sričių specialistai kažką svarbaus dirbtų savo kabinetuose, bet kad būtų dirbama bendrai, sutelktai, jeigu norime pasiekti veiksmingų rezultatų. Ši esminė mintis skambėjo ir Vilniaus konferencijoje.

ML. Mintyje turite tarpinstitucinį bendradarbiavimą ar baltų sutelktas pastangas? O gal bendradarbiavimą Europos valstybių mastu?

A. Vasiljevas. Svarbu, tiesiog būtina bendradarbiauti visais šiais lygmenimis. Visko iškart ir vienu metu gal neaprėpsime, todėl labai gerai, jeigu bendras problemas imasi spręsti įvairių institucijų darbuotojai. Toliau reikia siekti užmegzti glaudesnius ryšius tarp kaimynų baltų, o paskui nusitaikyti ir į kitas Europos Sąjungos šalis, gal mažąsias, kurių kalboms iškyla panašių sunkumų. Būtina telkti jėgas, vienytis su kitų mažų kalbų problemas nagrinėjančių ir sprendžiančių šalių institucijomis, mokslininkais ir politikais.
Tarkime, mes, latviai, jau turime mašininio tekstų vertimo tam tikrą įdirbį ir patirtį. Su Edinburgo universiteto Škotijoje atitinkamų sričių mokslininkais gvildename ir tobuliname automatinio tekstų vertimo problematikos darbus, taip pat bendradarbiaujame šioje srityje su Upsalos universitetu Švedijoje ir Kopenhagos universitetu Danijoje.

ML. Škotams, danams ir švedams labai rūpi latvių kalba?

A. Vasiljevas. Rūpi ne pati latvių kalba, bet įdomios problemos, kurios iškyla kiekvieną kartą, susiduriant su automatiniu teksto vertimu iš bet kurios kalbos. Štai Edinburgo universiteto mokslininkai sako, kad jų taikomas metodas puikiausiai tinka versti iš prancūzų ir anglų kalbų, bet latvių ar lietuvių kalboms jis netinka. Bet būtent todėl tyrinėtojų kraują ir kaitina naujas iššūkis: kodėl nepamėginus išspręsti naujos problemos? Suprantama, kad škotai ar jų kolegos iš kitų šalių nesiims spręsti vienos latvių ar lietuvių kalbos mašininio vertimo problemos, bet susiejus jas į bendrą projektą realu gauti finansavimą iš Europos Sąjungos atitinkamų fondų, apie ką mes ir kalbėjome pirmoje mūsų pokalbio dalyje. Būtent toks tarptautinis bend-radarbiavimas ir galėtų padėti mums visiems bendromis jėgomis siekti gerų rezultatų. Apie visa tai ir buvo kalbama iki šiol vykusiose Rygos ir Vilniaus konferencijose. Neabejoju, kad bus kalbama ir kitose šalyse.

ML. Kaip vertinate Jūsų vadovaujamos bendrovės „Tilde“ Vilniuje veikiančio padalinio „Tilde IT“ veiklą?

A. Vasiljevas. Vilniuje susibūręs labai stiprus mūsų bendrovės padalinys Tilde IT. Jis dirba dviem kryptimis: kalbos technologijų ir programinės įrangos produktų lokalizavimo vietinei rinkai paslaugų teikimo kryptimi, kai tam tikri programiniai produktai (interneto svetainės, žinynai, reklaminiai tekstai ir pan.) pritaikomi konkrečiai kalbinei ir kultūrinei aplinkai. Šias paslaugas teikia tokioms kompanijoms kaip IBM, Microsoft, Oracle, Adobe, Hewlett-Packard, Motorolla, Nokia, Samsung, Sony Ericsson, Siemens, Volvo ir kitoms tarptautinėms bendrovėms. Minėtų bendrovių produktams Tilde IT padeda prabilti lietuviškai į vietinius vartotojus.
Vilniaus konferencijoje UAB Tilde IT direktorė Renata Špukienė skaitė pranešimą „Iššūkiai prisidedant prie lietuvių kalbos išsaugojimo elektroninėje erdvėje ir įveikiant kalbos barjerus“. Pranešėja išdėstė, kokias problemas bendrovė sprendžia lietuvių kalbos labui: taisyklingos rašybos patikros, gramatikos, mašininio vertimo ir kitų kalbos technologijų. Tai labai sudėtingos problemos. Mes siekiame ne tik jas tyrinėti, kurti naujas kalbos technologijas, versti į tokius taikymo produktus, kuriuos būtų galima naudoti visuose be išimties kompiuteriuose ir kad jie būtų patogūs, jaukūs naudotojui.

ML. Kai kalbame apie kalbos technologijas, tai jas suprantame kaip informacinių technologijų ar humanitarinę užduotį?

A. Vasiljevas. Tai sankirtos arba paribio problema, kur susiduria ling-vistika, informacinės technologijos ir dizainas.

ML. Kas šiuo atveju slypi po žodžiu „dizainas“? Turime suprasti anglų vartojimo prasme, kur „design“ reiškia konstravimą, projektavimą, o gal kaip plastinio meno šaką, aplinkos formavimą?

A. Vasiljevas. Šiuo atveju suprantame, kaip kuriama programa turės atrodyti, kaip patogu ja bus naudotis. Žodžiu, pradedant nuo jos estetinės ir vizualinės išvaizdos iki taikymo subtilybių. Labai įdomi sritis, kur susieina daug svarbių dalykų.
Jeigu sėkmingai kursime kalbos technologijas tokioms sudėtingoms kalboms kaip lietuvių, latvių ir estų, tai atsivers galimybė naujus metodus pritaikyti ir kitoms kalboms. Vadinasi, gali atsirasti paklausa ne tik vidaus, bet ir tarptautinei rinkai.

ML. Sunku patikėti, kad baltų ir kitoms indoeuropiečių kalboms tinkami metodai tiktų finougrų kalbų grupei.

A. Vasiljevas. Mašininis kalbų vertimas – tai ištisa ir pakankamai sudėtinga mokslo sritis. Priminsiu, kaip vystėsi šio mokslo technologija. Praėjusio amžiaus 7-ajame dešimtmetyje mašininiam vertimui buvo kuriami labai sudėtingi algoritmai, buvo aprašomos visos kalbinės konstrukcijos, atliekamos sakinių analizės ir aptinkami dėsningumai, kuriuos taikant būtų galima versti iš vienos kalbos į kitą. Naudotos sudėtingiausios sistemos, pritaikoma šimtai, tūkstančiai dėsningumų, kuriuos nustatyti, o vėliau taikyti buvo nepaprastai sudėtinga ir brangu. Ir taip kiekvienos atskiros algoritmizuojamos kalbos atveju.
Netenka stebėtis, kad tokioms mažų tautų kalboms, kaip baltų, nieko svarbesnio nebuvo padaryta, nes buvo taip brangu, o pastangos užimdavo tiek laiko, kad visiškai neapsimokėjo. Perversmas įvyko amžių sandūroje, kai teko dorotis su milžiniškais tekstų kiekiais. Buvo sukurti visiškai nauji tekstų analizavimo būdai. Kompiuteriais pradėta analizuoti, kaip verčiamas į kitas kalbas vienas ar kitas tekstas. Iš pačių verčiamų tekstų pradėta mokytis, naudojant statistinius metodus ieškota kalbos dėsningumų. Mašina padėjo atlikti milžinišką perversmą, o „Google“ vertėjas (Google translate) ir teikia šią nemokamą internetinę kalbos vertimo paslaugą. Čia šis metodas kaip tik ir pritaikytas.
Kaip „Google“ tapo ne tik paieškos, bet ir vertimo kompanija? Kompanijos serveriuose paleisti tie „protingi“ algoritmai, išmokyti versti tekstus. Anglų ar prancūzų kalboms, turinčioms daugybę tekstų, tos vertimo programos veikia pakankamai gerai. Mat pačios šios kalbos palyginus paprastos, nėra sudėtingų linksniuočių, asmenuočių ar sakinių konstrukcijų. Bet lietuvių, latvių ir estų kalboms „Google“ vertimo paslaugai toli iki tobulumo.

ML. Ką šiuo atveju siūlo „Tilde“ ir jos kiti padaliniai?

A. Vasiljevas. Kaip jau sakiau, „Tilde“ kartu su Edinburgo ir Upsalos universitetais mėgina susieti statistinį metodą ir kalbos dėsningumus. Ši kombinacija teikia didesnių privalumų. Pavyzdys, kaip bazines technologijas galima sujungti su specifinėmis.

ML. Su kokiais sunkumais susiduria „Tilde“? Sunku patikėti, kad sprendžiant kalbos ir informacinių technologijų problemas neiškiltų sunkumų.

A. Vasiljevas. Kai kurios problemos išties labai sudėtingos, bet ir labai įdomios, ypač kai tenka kurti naujas ar tobulinti esamas kalbos technologijas. Sudėtingumas kyla ir iš to, kad mažų tautų kalbų vartotojų nėra daug, todėl tų kalbų technologijas kurti ir tobulinti – brangus malonumas. Štai Lietuva turi valstybinę programą „Lietuvių kalba informacinėje visuomenėje“, kuri padeda tas technologijas kurti, diegti ir tobulinti, bet Latvijoje iki šiol tokios programos nėra. Štai ir problema, nes užsakovams tenka kliautis savo lėšomis. Tikimės, kad Lietuvai priėmus naują programą taps prieinami daugelis kalbos šaltinių taip pat Tilde tyrinėtojams ir specialistams. Jie galės toliau tobulinti naujas kalbos technologijas, kurti ir kitus informacinių technologijų produktus, tuo pačiu prisidės ir prie pačios kalbos tobulinimo dalykų.

ML. Ar šiems siekiams neįmanoma telktis ir mūsų išeivijos, kurios gausėja Europos Sąjungos šalyse, jau nekalbant apie JAV ir Kanados lietuvių diasporą.

A. Vasiljevas. Visai galimas dalykas, nes ir jiems juk reikia gerų vertimo programų, automatinio vertimo paslaugų. Šiandien konferencijoje buvo pabrėžta, kad lietuvių ir latvių kalboms stinga daugelio bazinių technologijų, kad ir leksikografinių duomenų bazės pasauliniuose tinkluose (World.net Database). Daugeliui Europos kalbų tokios duomenų bazės sukurtos ir prieinamos per paieškų sistemas. Neturint bazinių išteklių neįmanoma atlikti tokių darbų kaip tekstų analizė, vertimai ir kt.
ML. Kai kurių šalių kalbininkai (pvz., čekas Iržis Marvanas) teigia, kad norim mes to ar nenorim, lietuvių kalba pasauliui bus tiek įdomi, kiek turi ryšio su slavų kalbomis. Bet gal šis mūsų tautinio orumo neglostantis teiginys galėtų būti panaudotas baltų kalbų labui? Jeigu yra, kas palaiko baltų ir slavų kalbų vienybės idėją, o šių kalbų giminingumo niekas ir neneigia, tai gal mašininio vertimo reikalams pasitarnautų bendri algoritmai ir kiti dėsningumai? Sutaupytume finansų ir pasinaudotume didesnių tautų įdirbiu kalbinių technologijų srityje. Vargu ar kas giliau apie tai yra mąstęs.

A. Vasiljevas. Lietuvių ir latvių kalbos įvairiais požiūriais tarpusavyje daug artimesnės negu su slavų kalbomis. Dabar nauji kalbos technologijų metodai remiasi didelių kalbos bazių duomenų taikymu tekstams ir gyvai kalbai analizuoti. Malonu buvo išgirsti, kad Lietuvos programoje numatomi naujų kalbos technologijų kūrimo projektai. Numatomos kurti didelės talpos duomenų bazės, kuriose bus garso signalas ir transkripcija, o tame garso signale bus žymimas kiekvienas žodis. Tokią medžiagą taikant kompiuterį galima apmokyti atpažinti kalbą, ištarti žodį. Lietuvių ir latvių akustiniai modeliai gali būti gan panašūs, bet rusų kalba jau gerokai skiriasi nuo šių abiejų kalbų.

2013_01_10
Lietuvos Respublikos Seime vykusioje tarptautinėje konferencijoje „Europos kalbos technologijų amžiuje: quo vadis?“. Kalba
LR Seimo kancleris Jonas Milerius, už prezidiumo stalo – LR Seimo narys Valentinas Stundys, Europos Parlamento narys
Algirdas Saudargas, Lietuvių kalbos instituto direktorė dr. Jolanta Zabarskaitė ir Seimo Informacinės visuomenės plėtros komiteto biuro vedėjas Ramūnas Čepaitis

ML. Ko galėčiau Jums palinkėti kaip Vilniaus konferencijos pranešėjui ir mūsų svečiui?

A. Vasiljevas. Mums visiems reiktų palinkėti, kad ši konferencija taptų stipriu postūmiu veikti ir kad mes visi
bendradarbiaudami sėkmingai kurtume ir tobulintume naujas savo kalbų technologijas. Tai labai svarbu, jeigu norime savo kalba didžiuotis. Dažnai girdžiu: kam man ta sava kalba reikalinga, jeigu anglų kalba vis tiek ją išstums? Visiškai netikęs nusiteikimas, tinginio nuostata, iš anksto savo kalbą pasmerkiant ir nieko jos labui nepadaryti. Jeigu savo kalba didžiuosimės ir veiksmingai ja rūpinsimės, patys tobulinsime savo kalbą ir jos mokysime savo vaikus, nešiukšlinsime jos svetimžodžiais, tai mūsų gimtosios kalbos gyvuos. Gyvuos tol, kol jomis bus kalbama ir kol jos bus reikalingos. Manau, kad šito vieni kitiems ir palinkėkime: kad mūsų vaikai, vaikaičiai ir jų provaikaičiai visada kalbėtų savąja kalba ir ja didžiuotųsi.

ML. Mūsų baltiškoji tapatybė tegu ir bus ta varomoji jėga, padėsianti šių tikslų siekti ir sėkmingai įgyvendinti. Naujas ir modernias kalbos technologijas pasitelkiant. Dėkoju Jums už šį pokalbį.

Kalbėjosi Gediminas Zemlickas

Gedimino Zemlicko nuotraukos

 

Palikti atsiliepimą

El. pašto adresas nebus skelbiamas.