Klausimai ir atsakymai
Ko čia galima ieškoti?
Tai yra rimų paieška. Sistema ieško lietuviškų žodžių su tokia pačia ar fonetiškai panašia pabaiga, kurie galėtų rimuotis su ieškomu žodžiu.
Kam tai skirta?
Visiems, kam nors kartais prisireikia rasti besirimuojančius žodžius - kuriant eilėraščius, eiliuotas sms, sprendžiant
įvairius galvosūkius ir pan.
Tarp kokių žodžių atliekama paieška?
Duomenų bazėje yra apie 150.000 žodžių. Tai yra:
- tradiciniai lietuvių kalbos žodžiai (šaltinis: "Dabartinės lietuvių kalbos žodynas")
- kai kurie naujadarai, tikriniai žodžiai (vardai, miestai, šalių pavadinimai ir kt.) - jie surinkti
indeksuojant kai kuriuos interneto puslapius (naujienų portalus, Vikipediją ir kt.) ir po to filtruojant
pagal tam tikrą metodiką
- kai kurios nepagrindinės žodžių formos (pvz., veiksmažodžiai - ne tik bendratis, bet ir kai kurie laikai bei asmenys,
kai kurie daiktavardžių linksniai ir kt.). Atrinktos tos žodžių formos, kurios gali rimuotis su kitų formų žodžiais
(o ne tik tarpusavyje) ir kurias buvo įmanoma sugeneruoti automatiniu būdu. Daug nepagrindinių formų kol kas dar nepavyko įtraukti
dėl automatizavimo sunkumų nustatant kirčio vietą.
Kokias žodžių formas galima naudoti paieškoje?
Nors paieška atliekama tarp įvairių formų žodžių, rekomenduojama ieškoti pagal tradicines žodynines formas, t.y.:
- daiktavardžių vienaskaitos vardininką
- veiksmažodžių bendratį, esamojo arba būtojo kartinio laiko trečiąjį asmenį
Kadangi paieška orientuota į lietuvių kalbą, būtina naudoti lietuviškas raides, t.y., ieškant "švepla" kalba, rezultatai gali
būti netinkami.
Kokiu principu vyksta paieška?
Yra kelios paieškos galimybės:
1. Pagal pilną žodį
Sistema ieško to žodžio duomenų bazėje. Jei randa, sužino jo kirčiavimą (visų žodžių kirčiavimas
yra žinomas, atsižvelgiama tik į kirčio vietą, priegaidės ignoruojamos). Tada apskaičiuojama, pagal kiek raidžių nuo galo reikia ieškoti, skaičiuojant nuo kirčiuotos vietos (pvz.,
dūmas - pagal 4 paskutines raides:
-ūmas,
Kaunas - pagal 5:
-aunas) ir ieškoma žodžių, turinčių tokią pačią
ar panašią pabaigą ir kirčiuojamų toje pačioje raidėje nuo galo.
Atliekamos įvairios pataisos. Pvz., dvibalsių/dvigarsių atveju visada ieškoma pagal pirmą raidę (net jei kirčiuojama
antra); yra išimčių (pvz., "
uo" ieškoma pagal antrą raidę, t.y., "o"). Naudojant
"panašumų" funkciją, ieškoma ne tik pagal lygiai tokią pačią žodžio pabaigą, bet ir įvairių fonetiškai artimų
variantų, pvz.: e=ia; ų=ū=u; i=į=y; ė=ie; g=k; d=t; b=p; š=ž; dž=č ir kt. Jei žodis baigiasi "s", ieškoma ir pagal
variantą be "s" - tai leidžia rasti galimus rimus nebūtinai pagrindinėje formoje (pvz., vardininke), bet ir kitose (pvz.,
galininke). Pvz., ieškant "
vienas": randami žodžiai, kurie baigiasi: -ienas, -ėnas, -enas, -iena, -ėna, -ena.
Jei ieškomo žodžio duomenų bazėje nėra, sistema bando atspėti jo kirčiavimą pagal žodžius su panašia pabaiga arba, jei nepavyksta,
pagal žodžio ilgį ir skiemenų skaičių. Tokiu atveju egzistuoja nemaža klaidos tikimybė, nes gali būti surasti
žodžiai su panašia pabaiga, bet nesirimuojantys dėl skirtingo kirčiavimo. Jei žodžio kirčiavimas nežinomas, apie tai pranešama ir, jei
kirčiavimas atspėtas neteisingai, galima ieškoti kitais būdais (žr. žemiau).
Jei žodis ne tik nerandamas, bet ir neįmanoma nustatyti jo kirčiavimo arba, ieškant pagal spėliojamą kirčiavimą, nieko nerasta,
bandoma ieškoti panašiausio žodžio, pasiūlant ieškoti pagal jį. Čia irgi tam tikrais atvejais galima nemaža klaidos tikimybė.
Jei paieška pagal pilną žodį nesėkminga, galima naudotis kitais paieškos variantais, sukonkretinant paiešką:
2. Pabaiga
Ieškoma pagal įvestą žodžio pabaigą, kuri yra kirčiuota. Bus surasti žodžiai su tokia pačia kirčiuota pabaiga.
Pvz.: gus (žmogus, dangus...); aukas (jaukas, laukas...)
3. Kiek raidžių nuo galo
Ieškoma pagal įvestą pilną žodį arba jo pabaigą, nurodant pagal kiek raidžių nuo galo turi būti ieškoma. Į kirčiavimą
irgi atsižvelgiama. Šis variantas naudingas, kai žodis gali būti kirčiuojamas skirtingai (ir sistema tiksliai nežino, pagal
kiek raidžių nuo galo reiktų ieškoti - pvz., vilt
is ir v
iltis), arba norint ieškoti pagal pasirinktą
kirčiuotą pabaigą.
Pvz.: šalis - ieškant pagal "pilną žodį", bus rodomi visi žodžiai, kurie baigiasi kirčiuota -is.
Nustačius, pvz., 3 raides, bus ieškoma tik žodžių su kirčiuota pabaiga -lis.
4. Bet kuri dalis
Ieškoma pagal įvestą žodžio dalį, kuri gali būti bet kurioje žodžio vietoje - pradžioje, viduryje ar pabaigoje.
- Įvedus 2 raides (tik dvibalsį/dvigarsį -
au
ai
ei
ie
ui
uo,
al
am
an
ar,
el
em
en
er,
il
im
in
ir,
ul
um
un
ur), ieškoma žodžių, kurių ta vieta yra kirčiuota (pvz., įvedus "
am", ieškoma
žodžių, turinčių bet kurioje vietoje kirčiuotą dvigarsį
am arba a
m)
- Kitu atveju (įvedus bent 3 raides) ieškoma žodžių, kurie turi tą dalį bet kurioje vietoje (į kirčiavimą nėra atsižvelgiama).
Šioje paieškos sąlygoje galima naudoti
pliuso ženklą +, leidžiantį sukonkretinti paiešką (nebūtina):
[x=paieškos užklausa]
x+ : žodžio pradžia
+x : žodžio pabaiga
+x+ : žodžio vidurys (ne pradžia ar pabaiga)
Nenaudojant pliuso, ieškoma žodžio dalis gali būti bet kurioje vietoje.
Pvz.: Ieškom žodžių, kuriuose yra raidžių derinys "duo":
duo : randami visi žodžiai, kuriuose ši dalis yra bet kurioje vietoje (>1000 žodžių)
duo+ : tik žodžiai, kurie prasideda "duo" (duonė, duona...)
+duo : tik žodžiai, kurie baigiasi "duo" (ruduo, vanduo)
Šis variantas skirtas surasti ne tiek rimus (kadangi į kirčiavimą neatsižvelgiama), kiek žodžius, turinčius
tam tikrus raidžių derinius.
Taip pat paieškoje galima naudoti du nustatymus - ar turi būti atsižvelgiama į kirčiavimą ir ar naudoti fonetinių panašumų
funkciją. Nors standartiškai šios funkcijos yra įjungtos, kai kada gali būti naudinga jas išjungti (pvz., gaunant pernelyg daug
rezultatų).
Kaip rūšiuojami paieškos rezultatai?
Paieškos rezultatai rūšiuojami pagal abėcėlę, išskyrus atvejus, kai ieškoma tik pagal vieną
ar dvi paskutines raides (t.y., kai žodis kirčiuojamas galūnėje), nes tada rezultatų būna labai daug. Tokiu atveju
pirmiau rodomi labiau sutampantys žodžiai (pvz., kurių sutampa kelios paskutinės raidės, o ne tik viena ar dvi), o paskui - visi likę.
Pvz., ieškant "mama", rezultatų yra keli tūkstančiai - visi žodžiai, kurie baigiasi kirčiuota "a". Tačiau
pirmiau rodomi žodžiai, kurie baigiasi -ama, po jų - kurie baigiasi -ma, o tada - visi likę, kurie baigiasi kirčiuota -a.
Yra nemažai senų/neegzistuojančių žodžių, o kai kurių populiarių kažkodėl nėra. Kodėl?
Dauguma žodžių yra iš "Dabartinės lietuvių kalbos žodyno", o jame yra gana nemažai jau iš esmės pasenusių/retai vartojamų
žodžių (taip pat naudoti kai kurie interneto šaltiniai). Kadangi šiai paieškai sukurti buvo būtina žinoti kiekvieno žodžio kirčiavimą, įtraukti tik tie žodžiai, kurių kirčiavimas yra žinomas. Todėl daugybės
žodžių teko atsisakyti, nes automatizuotai juos sukirčiuoti labai keblu, o rankiniu būdu - pernelyg daug darbo arba nėra kuo remtis. Dėl
tos pačios priežasties įtrauktos tik kai kurios nepagrindinės žodžių formos (įvairūs linksniai ir kt.) - tos,
kurių kirčio vietą buvo galima nustatyti automatiškai. Nepastovaus kirčio formų kol kas atsisakyta dėl sudėtingo automatizavimo.
Generuojant įvairias žodžių formas, neapsieita be techninio pobūdžio klaidų (pvz., sukurta vienaskaitinių žodžių daugiskaita). Nors viskas buvo kiek
įmanoma filtruojama, gali pasitaikyti vienas kitas neegzistuojantis ar neteisingai sukirčiuotas žodis. Visa tai pamažu tvarkoma.
Šis projektas nėra oficialus kirčiavimo žodynas ir nepretenduoja į 100% tikslumą ir išsamumą. Tai tik asmeninis
programavimo eksperimentas savo reikmėms, kurį po kurio laiko nusprendėme padaryti prieinamą visiems. Svetainė sukurta
2007-12-15, viešai veikia nuo 2009 m. vasario.
Kam skirti ženklai ? ir > prie kiekvieno žodžio paieškos rezultatuose?
Klaustukas išskleidžia informaciją apie tą žodį (jo paaiškinimą, raidžių skaičių ir kt.). Rodyklė
nukreipia
į pastovų paieškos rezultatų puslapį tam žodžiui.
Kadangi paieška atliekama tarp žodžių galūnių (pabaigos), daugeliu atvejų ieškant pagal žodžius su tokia pačia pabaiga,
gaunami visiškai vienodi rezultatai (pvz.,
bajoras ir
pomidoras).
Išimtis: kai žodis kirčiuojamas paskutinėje ar priešpaskutinėje raidėje, rezultatai (kurių būna labai daug) rūšiuojami ne paprastai
pagal abėcėlę, o pirmiau rodomi labiau sutampantys žodžiai (išsamiau
čia).
Turiu daugiau klausimų. Kur kreiptis?
Jei norėtumėte su mumis susisiekti, parašykite mums adresu
svetaines [eta] gmail.com
© Rimai.DainuTekstai.lt .:. DainuTekstai.lt, 2010