1-Testu artxiboak Testu osoak, berezko interesa dutenak. Idatzizkoak eta grabaziozkoak izan daitezke, adibidez literatura obrak, errefrau bildumak, bertso txapelketen grabazioak, ipuin kontaketak etab. 2-Testu corpusak Helburu linguistiko batekin osatzen diren bildumak. Testu aztertugabeak. Praktikan testu idatziei baino ez dagokie. 3-Hizkuntza corpusak Testu aztertuak (lemak, etiketa morfosintaktikoak, lokuzioak, informazio morfologikoa…) 4-Erreferentzia corpusak Hizkuntzaren erabilerari dagokio. 5-Hizkuntza […]
CORPUS MOTAK
junio 22nd, 2009 · Comments Off on CORPUS MOTAK
Etiquetas:
TESTU CORPUS
junio 22nd, 2009 · Comments Off on TESTU CORPUS
Corpus edo testu corpus bat egituratutako testu sorta handi bat da hizkuntzalaritzan. Hizkuntza baten deskribatzeko eta ikertzeko baliatzen den hizkuntza-datu bilduma da, edo baliabide elektronikoak erabiltzen eta eskaintzen dituena. Korpusa bilduma berezi bat da. Latinetik datorren hitza da. Latinez gorputza esan nahi du. Datu ala testu literarioak, edo zientifikoak, konposatua. Zenbat eta zabal eta txukunago […]
Etiquetas:
LENGOA NATURALEN PROZESAMENDURAKO ZAILTASUNAK
junio 22nd, 2009 · Comments Off on LENGOA NATURALEN PROZESAMENDURAKO ZAILTASUNAK
1-Anbiguotasuna Lengoaia naturala maila ezberdinetan anbiguoa izan ohi da: Mailan lexikoan: hitz bakar batek esanahi ezberdinak izan ditzake, eta hauetako egokiaren hautapena testuinguruaren edo oinarrizko ezagutzaren araberakoa izan behar da. Zentzu honetan ikerketa ezberdinak burutu izan dira, hiztegiak, gramatika, ezagutza oinarriak eta korrelazio estatistikoetan oinarritutako metodoekin. Erreferentzia mailan: anafora eta kataforak ebazteak erreferentzia egiten duten […]
Etiquetas:
Lengoaia naturalen prozesamendua
junio 22nd, 2009 · Comments Off on Lengoaia naturalen prozesamendua
Lengoaia naturalen prozesamendua (LNP, edo ingelesez, NLP – Natural Language Processing) adimen artifizialaren barne izanik, hizkuntzalaritza konputazionalean ingeniaritzari zuzendutako atala da. LNP lengoaia naturalen bidez pertsona eta makinen arteko komunikazioa era konputazionalean burutzea ikertzeaz arduratzen da. Eredu hauek ez dira lengoaiaren ulermenean bakarrik oinarritzen, baizik eta baita giza ezagutzaren aspektu orokor batzuetan eta memoriaren antolaketan. […]
Etiquetas:
ERLANG
junio 22nd, 2009 · Comments Off on ERLANG
Erlang es un lenguaje de programación concurrente y un sistema de ejecución que incluye una máquina virtual y librerías. El subconjunto de programación secuencial de Erlang es un lenguaje funcional, con evaluación estricta, asignación única, y tipado dinámico. Fue diseñado en la compañía Ericsson para realizar aplicaciones distribuidas, tolerantes a fallos, soft-real-time y de funcionamiento […]
Etiquetas:
IULA ( Instituto Universitario de Lingüística Aplicada)
junio 22nd, 2009 · Comments Off on IULA ( Instituto Universitario de Lingüística Aplicada)
El proyecto Corpus es el proyecto de investigación prioritario del IULA. Recopila textos escritos en cinco lenguas diferentes (catalán, castellano, inglés, francés y alemán) de las áreas de especialidad de la economía, el derecho, el medio ambiente, la medicina y la informática. A través del establecimiento del corpus, se intentan inferir las leyes que […]
Etiquetas:
V Jornada CRAI
junio 22nd, 2009 · Comments Off on V Jornada CRAI
La Conferencia de Rectores de las Universidades Españolas y la Red de Bibliotecas Universitarias (REBIUN) vienen organizando desde el año 2003 unas Jornadas CRAI para presentar tendencias, experiencias y divulgar la idea de los nuevos servicios universitarios orientados al nuevo modelo de enseñanza universitaria que se prepara.La Conferencia de Rectores de las Universidades Españolas y […]
Etiquetas:
WEB 3.0
junio 22nd, 2009 · Comments Off on WEB 3.0
Web 3.0 martxan jartzerako orduan, “Data Web” delakoak paper garrantzitsua bete du, interneten banatzen den informazioa XML, RDF eta mikroformatoetakoa baita. Data Web-ek datuen sartze eta eguneratzea errazten du, interaktiboagoa bihurtuz. Horregatik smentika-weberako lehen urratsa izan da. Web 3.0-k ez du alde hori bakarrik aztertzen. Askok inteligentzia artifiziala ezinezkotzat jotzen dute baina Google bezalakoek uste […]
Etiquetas:
UZEIk dituen egitasmoak
junio 22nd, 2009 · Comments Off on UZEIk dituen egitasmoak
Hona hemen UZEIren egitasmoak: -Euskararen normalizazio linguistikoaren alde lan egitea – Euskararen barnean, xede berezietako hizkeren finkapena eta hedapena sustatzea. Euskararekin zerikusia duten hiztegi eta lan terminologiko eta lexikografikoak egitea, horretarako irizpide lexikografikoak eta terminologikoak finkatuz. – Datu-banku terminologikoa eta Datu-base lexikografikoa antolatu eta mantentzea. Terminologia eta lexikografiako ikastaroak antolatu eta ematea. Lexikografiari eta terminologiari […]
Etiquetas:
UZEI
junio 22nd, 2009 · Comments Off on UZEI
UZEI 1977an sortu zen, hizkuntza edozein hiztunek edozein lan-eremutan egokitasunez eta zehaztasunez erabil dezan. Urtetan egindako hiztegi terminologiko guztiak banku terminologiko batean sartu ziren. Honela, 1986an EUSKALTERM terminologia-bankua sortu zen bere baitan. 1987an, 226/1987 Dekretuaren arabera eta berariazko lankidetza-hitzarmena izenpetuz, Eusko Jaurlaritzaren Babespeko Elkarte bihurtu zen hizkuntza-plangintzako ikerlanean aritzeko. 1989an, Onura Publikoko aitorpena eman zion […]
Etiquetas:
Iztulpengintza automatikoa
junio 22nd, 2009 · Comments Off on Iztulpengintza automatikoa
Itzulpengintza etengabe hedatzen ari den honetan, ondorengo dokumentua aurkitu dut itzulpengintzaren teknikarik sinpleena ulertzeko, prozesua alegia: http://www.justizia.net/docuteca/Documentos/2990Zer%20da%20itzulpen%20automatikoa.pdf Egia da euskaraz oso zaila dela itzultzaile automatiko bat egitea. Izan ere, euskara hain da ezberdina non makina batek zailtasunak dituen itzultzeko. Itzulpen automatikoa (labur IA edo MT – Machine translation) da iturburu-hizkuntzako testu batetik abiatuta helburu-hizkuntzako testu […]
Etiquetas:
2007ko euskarazko itzultzaile automatikoa sortzeko lehia
junio 22nd, 2009 · Comments Off on 2007ko euskarazko itzultzaile automatikoa sortzeko lehia
Eusko Jaurlaritzako Hizkuntza Politikarako Sailburuordetzak jarri zuen abian euskarazko itzultzaile automatikoa sortzeko prozesua. Lehiaketa publikora deitu aurretik hizkuntzen prozesamendu automatikoan lan egiten zuten bost enpresei (Eleka Ingeniaritza Linguistikoa, EmergiaTech, InterLan System, Automatic Trans eta Translendium) informazioa eskatu eta itzulpen proba bat jarri zien. 2007ko apirilean egindako aurkezpen eta probak adituek aztertu zituzten eta ondoren, uda aurretik, lehiaketa publikoa […]
Etiquetas: