HipiLatLit

Ši lietuvių–latvių kalbų lygiagrečiojo tekstyno paieškos sistema yra Humanitarinių mokslų švietimo infrastruktūros plėtros Rytų Latvijoje ir Lietuvoje (Kaunas) (angl. Development of Research Infrastructure for Education in the Humanities in Eastern Latvia and Lithuania (Kaunas) HipiLatLit projekto rezultatas.

Paieška Apie LILA

Informacija apie lygiagretųjį tekstyną LILA

Lietuvių–latvių ir latvių–lietuvių kalbų lygiagretusis tekstynas LILA parengtas 2011–2012 m. vykdant ES tarpvalstybinės Lietuvos–Latvijos bendradarbiavimo programos projektą Humanitarinių mokslų švietimo infrastruktūra Rytų Latvijoje ir Lietuvoje (Kaunas). Šis tekstynas sudarytas pusiau automatiškai, naudojant VDU KLC sukurtą įrankį Aligner 2.0.6.7. Tekstai sulygiagretinti pastraipų ir sakinių lygmeniu. Tekstyną sudaro ne anksčiau kaip 1991 m. publikuoti tekstai.

Bendras tekstyno dydis yra 8 782 050 žodžių (žr. 1 pav.): didžiausia yra lietuvių–latvių kalbų tekstų dalis (3 448 745 žodžiai), dvigubai mažiau yra latvių–lietuvių kalbų tekstų (1 695 160 žodžių). Tokia nesimetriška duomenų situacija susidarė dėl to, kad pastaraisiais metais daugiau išversta iš lietuvių kalbos į latvių, o ne iš latvių į lietuvių. Į latvių kalbą išversta daug produktyvių šiuolaikinių lietuvių rašytojų, pvz., Jurgos Ivanauskaitės, Sigito Parulskio, Kristinos Sabaliauskaitės, kūrinių. Vertimų iš latvių į lietuvių kalbą gerokai mažiau, pvz., Ingos Ābeles, Laimos Muktupāvelos, Nuoros Ikstenos.

Siekiant sukurti didesnės apimties tekstyną nebuvo galima išsiversti be ES tekstyno tekstų (ES dokumentai sudaro 41 proc. (3 638 145 žodžiai). LILA tekstyno paieškoje ES dokumentai sudaro atskirą tekstyno dalį tam, kad tyrėjai, kuriems svarbi vertimo kryptis ir autentiškumas, galėtų atskirti tiesioginius ir netiesioginius vertimus.

LILA statistika 1

1 paveikslas. Viso LILA tekstyno proporcijos

Tekstyne norėta atspindėti įvairius žanrus, tekstų tipus, todėl tekstyne yra grožinės literatūros, populiariosios literatūros, publicistikos ir administracinės literatūros tekstų. Šios proporcijos pateiktos 2 pav.

LILA statistika 2

2 paveikslas. LILA tekstyno proporcijos be ES tekstų

Apie paiešką lygiagrečiajame tekstyne LILA

Internete prieinamoje lygiagrečiojo tekstyno LILA paieškos sistemoje galima atlikti paiešką tiek lietuvių, tiek latvių kalba. Galima atskirai analizuoti tik tuos tekstus, kurių aiški originalo ir vertimo kalba, o nesirinkti tų tekstų, kurie išversti per kalbą tarpininkę (Europos Sąjungos dokumentų).

Tekstyne galima ieškoti konkretaus žodžio arba žodžio dalies. Ieškant žodžio dalies reikia įrašyti žodžio dalį ir žvaigždutę, pvz., ieškant apsirik*, gaunami tokie rezultatai: apsiriko, apsirikti, apsirikę, apsirikdavo ir kt. Toliau galima ieškoti visų rastų žodžių arba pasirinkti vieną ar kelis iš jų. Prie rastų žodžių nurodomas ir jų dažnumas lygiagrečiajame tekstyne.

Išplėstinėje paieškoje galima pasirinkti konkordanso pateikimo formą (kad būtų pateiktas lygiagretus ar vertikalus konkordansas); radus daugiau nei vieną žodį, galima rinktis, ar iš karto pateikti tų visų žodžių konkordansą, ar pirma pateikti dažninį žodžių sąrašą. Žodžiai gali būti surūšiuoti pagal dažnumą arba pagal abėcėlę.

Rastuose rezultatuose ieškomas žodis yra pajuodintas (žr. 3 pav.). Spustelėjus kitą dominantį žodį (ar kelis žodžius), tas žodis visuose rastuose sakiniuose bus pažymėtas ta pačia spalva. Taip lygiagrečiojo tekstyno naudotojams lengviau analizuoti rezultatus, ypač pastoviuosius junginius, nes kol kas nėra galimybės paieškos langelyje nurodyti du ar daugiau žodžių. Gautus duomenis galima išsisaugoti atskiroje rinkmenoje ir susirūšiuoti pagal savo poreikius.

LILA statistika 1

3 paveikslas. Paieškos rezultatai ieškant konkretaus žodžio ar žodžio formos

Prie kiekvienos lygiagrečios eilutės nurodomi šaltiniai. Palaikius pelę ant eilučių numerių, parodoma, iš kokio teksto paimtas sakinys. Visų rezultatų pabaigoje pateikiama išsami informacija apie šaltinius: teksto identifikacinis pavadinimas, autorius, teksto pavadinimas, originalo metai (žr. 4 pav.).

LILA statistika 1

4 paveikslas. Metaduomenų pateikimo pavyzdys