Littera Deusto

Modern Languages, Basque Studies and Humanities

Itzulpen automatikoa

abril 26th, 2009 · No hay Comentarios

Irlandako “National Center for Language Techonology”, Dublin Cityko unibertsitateko ordenagailu eskolan kokatuta dagoen zentrua da. Bertan makinen itzulpena, indukzio gramatikoa, galdera-erantzunen programak, ordenagailu bidezko hizkuntzen ikasketak, software lokalizazioa eta hizketaren errekonozimendua lantzen dira eta nik hauen arteko itzulpena automatikoa aukeratu dut bertan sakontzeko helburuz.

Azken urteotan informazioaren gizartean bizi garenez gero, jendeak hamaika lekutan dauka eskuragarri informazioa. Testu aberastasun honengatik eta egin diren aurrerepenei esker gertatu den munduaren globalizazioagatik, gero eta beharrezkoagoak bihurtu dira itzultzaileak. Itzultzaile automatikoak sortzeko nahia ordenagailuak existitu baino lehenagokoa da. 1940tik aurrera jendeak ordenagailu bat eskura izan zuenetik, itzulpengintza automatikoa informatikaren aplikaziorik arrakastatsuenetakoa bihurtu zen. Ordutik hona, esperimentu asko egin dira, eta instituzio eta enpresen aldetik inbertsio handiak egin dira. 1950ko hamarkadan itzultzaile automatikoa sortzeko baikortasuna nagusi izan bazen ere, 1966an argitaratu zen ALPAC txostenak ezkortasuna ekarri zuen, eta Kanadan eta Europan ikerketak jarraitu zuen arren, Estatu Batuetan nabarmen egin zuen behera. Hala eta guztiz ere, 1980ko hamarkadan suspertu egin zen ostera ere, hainbat sistemaren argitalpen eta teknika berrien agerpenei esker.

Itzultzaile automatikoen funtzionamenduari begiratuz gero, bi talde nagusi aurkituko genituzke; arauetan oinarritutako itzulpena eta Corpusean oinarritutako itzulpena. Lehenengokoa da bien arteko zaharrena (1970ko hamarkadan garatu zen) eta hau da benetako itzultzaile automatikotzat hartzen dena. Bere funtzionamendua honakoa da; testu originala hartu egiten da eta ordenadoreak bertan dauden hitzen parekoak edo antzekoak bilatzen ditu, hitzez hitz itzulten joaten delarik. Batzuetan, hitzak banaka aztertu beharrean esaldi edo unitate sintaktiko osoak itzultzen ditu (interlingua delako sistemaren bitartez).

Bigarren metodoa edo Corpusean oinarritutako itzulpen metodoa 1990ko hamarkadan garatu zen eta honen barruan bi azpi sistema topa ditzakegu: estatistikoa eta adibideen bidezkoa. Estatistikoak lehendik itzulita dauden testuak hartzen ditu (adibidez EBeko aktak) eta horietan oinarrituta, testu berriak sortzen ditu. Metodo hau IBMk asmatu zuen eta Googlek ere etorkizunean erabiliko duela uste da. Adibideetan oinarritutakoan ostera, Corpus elebidun bat hartzen da eta analogiaren bitartez itzuli egiten da.

Azkenik testuinguruaren araberako itzulpena daukagu. Honetan hitzak 4 eta 8 tarteko multzotan hartzen dira eta haien inguruan dituzten hitzen arabera itzultzen dira. Ateratzen diren aukera denen artetik zentzua daukatenak bakarrik aukeratzen dira eta gero, hitz multzo hauek denak lotzen dira eta haien artea zentzua sortzen dutenak aukeratzen dira. Horrela testua osorik itzulita eduki arte.

Iturriak:

Machine Translation, AI topics ( December 13, 2008, at 08:33 PM ). Retrieved 19:16, April 26, 2009 from: www.aaai.org/AITopics/pmwiki/pmwiki.php/AITopics/MachineTranslation

Traducción automática. ( April 17, 2009). Wikipedia, La enciclopedia libre. Retrieved: 17:18, April 26, 2009 from http://es.wikipedia.org/w/index.php?title=Traducci%C3%B3n_autom%C3%A1tica&oldid=25652325

Etiquetas:

  • Etiquetas