Natural Language Generation is a subfield of Computational Linguistics and language-oriented Artificial Intelligence research devoted to studying and simulating the production of written or spoken discourse. The study of human language generation is a multidisciplinary enterprise, requiring expertise in areas of linguistics, psychology, engineering and computer science. One of the central goals is to investigate […]
Natural Language Generation (Questionnaire 2)
abril 22nd, 2009 · Comments Off on Natural Language Generation (Questionnaire 2)
Etiquetas:
Viento en popa
abril 22nd, 2009 · Comments Off on Viento en popa
Tras unas semanas de relax, volvemos manos a la obra. Si antes de Semana Santa estuvimos buscando ejemplos para comparar el español de España y el de Latino-América, ayer estuvimos viendo como funciona el corpus de la RAE. Dado que es una herramienta nueva, se nos hizo un poco dificil al principio entender como funcionaba, […]
Etiquetas:
Giza lengoaiaren teknologiak
abril 22nd, 2009 · Comments Off on Giza lengoaiaren teknologiak
Aditu askoren ahotan egon den gaia da giza lengoaiaren teknologiak. Hauek, teknologia linguistikoak edo lengoaiaren teknologiak ere deituak dira eta aplikazio informatikoetan integratuta aurkitzen ditugu. Ordenagailuetako zuzenketa ortografikoa edota itzulpengintza ere, hauen bitartez egiten da horregatik, izugarrizko garrantzia hartu dute gure gizartean. Azalpen eta definizio asko eman dira hauei buruz eta hauek dira horietako batzuk:
Hans […]
Etiquetas:
Questionnaire #2: Research Topics. Automatic Summarization.
abril 22nd, 2009 · Comments Off on Questionnaire #2: Research Topics. Automatic Summarization.
Automatic Summarization is a technique which has a huge importance nowadays, but what is it exactly?
It is a process where you can summarize any type of text by just using a computer program. Your own computer extracts the content from the text, and presents the most important points of it, so you don’t have to […]
Etiquetas:
-GO eta -GARRI atzizkiak direla eta
abril 22nd, 2009 · Comments Off on -GO eta -GARRI atzizkiak direla eta
Seihileko honetan egin behar dugun proiektua gauzatzeko, -GO eta -GARRI atzikien osaera eta erabilerari dagokion azterketa bat egitea erabaki dugu nire lan taldean. Atzizki hauenosaera eta erabilera, bai zuzena eta bai okerra, aztertuko ditugu lan honetan. Hau egiteko, tradizioa eta gaur egungo egoera hartuko ditugu kontuan. Proiektu honen helburu, arazo lexikologiko edo sintaktiko bat oinarritzat […]
Etiquetas:
EREDUZKO PROSA GAUR CORPUSA
abril 22nd, 2009 · Comments Off on EREDUZKO PROSA GAUR CORPUSA
Ereduzko Prosa Gaur Corpusa EHUko Euskara Zerbitzuak sortutako lanabesa da. Corpus honetan, euskal idazle batzuen azken urteotako testuak biltzen dira, corpus konplexu bat eratzeko helburuarekin.
Corpus honen xehetasunak:
* Ereduzko Prosa Gaur 2001an abiatutako egitasmoa da,
2007ko uztailean burutua.
2009ko urtarrilean, corpus arakatzaileari itxura berria eman zitzaion.
Denera: 25,1 milioi hitz
Liburuak
13,1 milioi hitz
2000-2006 bitarteko 287 liburu
Prentsa
12 milioi hitz
2004-2006 […]
Etiquetas:
XX.MENDEKO EUSKARAREN CORPUS ESTILISTIKOA
abril 22nd, 2009 · Comments Off on XX.MENDEKO EUSKARAREN CORPUS ESTILISTIKOA
XX.mendeko euskararen corpus estilistikoa UZEI elkarteak sortutako corpusa da. UZEI-ren helburua euskara ikertzen duten pertsonak hizkuntza-datutegiak kontsultatzeko corpus hau baliogarria izatea da. Corpus hau 4.658.036 testu-hitzez osatua dago. Erabili izan den eta erabiltzen den euskararen lekuko eta erakusgarri izatea du egiteko nagusi eta ia bakarra, eta ez ereduzko hizkuntza proposatzea.
Corpus estatistikoaren oinarria, XX. mendeko euskal […]
Etiquetas:
UZEI-REN EGITASMOAK
abril 22nd, 2009 · Comments Off on UZEI-REN EGITASMOAK
♣ Euskararen normalizazio linguistikoaren alde lan egitea, hizkuntzaren erabilerarekin zerikusia duten balio erantsiko zerbitzuak eskainiz. Kulturatik eta goi-mailako zientzietatik sortzen diren, eta etorkizunean sortuko diren, premietara euskara moldatu eta egokitu ahal izateko euskararen ikerketan, normalizazioan eta hedapenean diharduten erakunde publiko eta pribatuekin lankidetzan aritzea.
♣ Euskararen barnean, xede berezietako hizkeren finkapena eta hedapena sustatzea. Euskararekin zerikusia […]
Etiquetas:
ZER DA UZEI?
abril 22nd, 2009 · Comments Off on ZER DA UZEI?
UZEI irabazi-asmorik gabeko elkartea da. Euskara berritu eta mundu modernora egokitzeko helburuarekin 1977an sortua, edozein hiztunek edozein lan-eremutan egokitasunez eta zehaztasunez erabil dezan.
Urtetan egindako hiztegi terminologiko guztiak banku terminologiko batean sartu ziren. Honela, 1986an EUSKALTERM terminologia-bankua sortu zen bere baitan.
1987an, 226/1987 Dekretuaren arabera eta berariazko lankidetza-hitzarmena izenpetuz, Eusko Jaurlaritzaren Babespeko Elkarte bihurtu zen hizkuntza-plangintzako ikerlanean […]
Etiquetas:
CORPORA MOTAK ETA ADIBIDEAK
abril 22nd, 2009 · Comments Off on CORPORA MOTAK ETA ADIBIDEAK
CORPORA MOTAK
Corpus bat osatzen duten testuek ez dute zertan hizkuntza bakar batean ( monolingue) idatzirik egon behar, bi hizkuntzatan edo gehiagotan idatzirik egon daitezke. Bi hizkuntzetan edo gehiagotan idatzita egongo balira testuak,corpusak bilingueak edo multilingueak izango lirateke. Kasu honetan, testuak ez dira modu arbitrario batean aukeratzen,hizkuntza baten kriterioak kontuan izanda baizik. Adibidez, “Aarhus Corpus of […]
Etiquetas:
ZER DA CORPUS BAT?
abril 22nd, 2009 · Comments Off on ZER DA CORPUS BAT?
Corpus bat, (pluralean corpora), testuen bilduma bat da eta normalean testu hauek elektronikoki biltegiratuta eta prozesatuta daude. Definizio hau, gaur egun leku askotan topa dezakegun definizioa da, baina hona hemen kontzeptu honen gainean emandako beste definizio batzuk:
● “On the face of it, a computer corpus is an unexciting phenomenon: a helluva lot of text, […]
Etiquetas:
Yorick Wilks(Q.1)
abril 22nd, 2009 · Comments Off on Yorick Wilks(Q.1)
Yorick Wilks is a Professor of Artificial Intelligence at the University of Sheffield, and a Senior Research Fellow at the Oxford Internet Institu. He was bornc in 1939 in the United Kingdom.
He’s most important works that have been published are:
Ballim, A., Wilks, Y. (1991) Artificial Believers: The Ascription of Belief. Lawrence Erlbaum Press.
Wilks, Y., Fass, […]
Etiquetas: