Tip istraživanja: primjenjeno Trajanje od: 01.07.92. do 31.12.95. Ukupno radova na projektu: 7
Naziv ustanove: Filozofski fakultet - Humanističke znanosti, Zagreb (130) Odjel/Zavod: Odsjek za informacijske znanosti Adresa: Đ. Salaja 3. Grad: 10000 - Zagreb, Hrvatska
Komunikacija
Telefon: 385 (0)620147
teleFaks: 385 (0)513834
E-mail: btepes@phil.hr
Sažetak: Originalnost i izvornost glagoljskoga pisma na području Hrvatske omogućava primjenu egzaktnih modela za istraživanje specifičnosti hrvatskoga jezika. Scaniranjem glagoljskih tekstova stvorit će se korpus glagoljskih tekstova hrvatske redakcije. Oblici riječi korpusa omogućiti će morfološku analizu. Stohastički modeli odredit će pravila i transformacije bitne za oblikovanje rečenica u hrvatskom jeziku. Morfološka i sintaktička analiza odredit će gramatiku starohrvatskoga jezika korištenjem suvremenih lingvističkih i informatičkih metoda.
Ključne riječi: Hrvatski jezik, lingvistički modeli, glagoljica, računarski sustavi, morfologija, sintaksa, gramatika.
Ciljevi istraživanja: U projektu će biti analizirani glagoljski
tekstovi tiskani na Guttenbergovim strojevima. Postupak je tiskanja
zahtijevao veći stupanj organizacije i uređivanja teksta, što je
rezultiralo boljom reprodukcijom teksta. Tiskani će se tekstovi postupkom
scaniranja izravno unositi u računske strojeve, uz minimalne greške pri
kasnijem strojnom prepoznavanju teksta. Budući da je cilj opis gramatike
hrvatskog jezika, odabrani su tekstovi glagoljski tekstovi hrvatske
redakcije koji najvjernije opisuju starohrvatski jezik. Osnovni je cilj
istraživanja opis gramatike hrvatskog jezika. Do toga će se osnovnog cilja
doći obradom sljedeće četiri teme: 1. tema: strojno prepoznavanje
glagoljskih pismena 2. tema: korpus glagoljskih tekstova na stroju 3. tema:
morfološka analiza 4. tema: sintaktička analiza. Rezultati projekta bit će
objavljeni u knjizi. Ostali podaci o projektu.