Littera Deusto

Modern Languages, Basque Studies and Humanities

Natural Language Generation (Questionnaire 2)

abril 22nd, 2009 · Comments Off on Natural Language Generation (Questionnaire 2)

Natural Language Generation is a subfield of Computational Linguistics and language-oriented Artificial Intelligence research devoted to studying and simulating the production of written or spoken discourse. The study of human language generation is a multidisciplinary enterprise, requiring expertise in areas of linguistics, psychology, engineering and computer science. One of the central goals is to investigate […]

[Lee más →]

Etiquetas:

Viento en popa

abril 22nd, 2009 · Comments Off on Viento en popa

Tras unas semanas de relax, volvemos manos a la obra.  Si antes de Semana Santa estuvimos buscando ejemplos para comparar el español de España y el de Latino-América, ayer estuvimos viendo como funciona el corpus de la RAE. Dado que es una herramienta nueva, se nos hizo un poco dificil al principio entender como funcionaba, […]

[Lee más →]

Etiquetas:

Giza lengoaiaren teknologiak

abril 22nd, 2009 · Comments Off on Giza lengoaiaren teknologiak

Aditu askoren ahotan egon den gaia da giza lengoaiaren teknologiak. Hauek, teknologia linguistikoak edo lengoaiaren teknologiak ere deituak dira eta aplikazio informatikoetan integratuta aurkitzen ditugu. Ordenagailuetako zuzenketa ortografikoa edota itzulpengintza ere, hauen bitartez egiten da horregatik, izugarrizko garrantzia hartu dute gure gizartean. Azalpen eta definizio asko eman dira hauei buruz eta hauek dira horietako batzuk:
Hans […]

[Lee más →]

Etiquetas:

Questionnaire #2: Research Topics. Automatic Summarization.

abril 22nd, 2009 · Comments Off on Questionnaire #2: Research Topics. Automatic Summarization.

Automatic Summarization is a technique which has a huge importance nowadays, but what is it exactly?
It is a process where you can summarize any type of text by just using a computer program. Your own computer extracts the content from the text, and presents the most important points of it, so you don’t have to […]

[Lee más →]

Etiquetas:

-GO eta -GARRI atzizkiak direla eta

abril 22nd, 2009 · Comments Off on -GO eta -GARRI atzizkiak direla eta

Seihileko honetan egin behar dugun proiektua gauzatzeko, -GO eta -GARRI atzikien osaera eta erabilerari dagokion azterketa bat egitea erabaki dugu nire lan taldean. Atzizki hauenosaera eta erabilera, bai zuzena eta bai okerra, aztertuko ditugu lan honetan. Hau egiteko, tradizioa eta gaur egungo egoera hartuko ditugu kontuan. Proiektu honen helburu, arazo lexikologiko edo sintaktiko bat oinarritzat […]

[Lee más →]

Etiquetas:

EREDUZKO PROSA GAUR CORPUSA

abril 22nd, 2009 · Comments Off on EREDUZKO PROSA GAUR CORPUSA

Ereduzko Prosa Gaur Corpusa EHUko Euskara Zerbitzuak sortutako lanabesa da. Corpus honetan, euskal idazle batzuen azken urteotako testuak biltzen dira, corpus konplexu bat eratzeko helburuarekin.
Corpus honen xehetasunak:
* Ereduzko Prosa Gaur 2001an abiatutako egitasmoa da,
2007ko uztailean burutua.
2009ko urtarrilean, corpus arakatzaileari itxura berria eman zitzaion.
Denera: 25,1 milioi hitz
                                                               Liburuak
13,1 milioi hitz
2000-2006 bitarteko 287 liburu
                                                                Prentsa
12 milioi hitz
2004-2006 […]

[Lee más →]

Etiquetas:

XX.MENDEKO EUSKARAREN CORPUS ESTILISTIKOA

abril 22nd, 2009 · Comments Off on XX.MENDEKO EUSKARAREN CORPUS ESTILISTIKOA

XX.mendeko euskararen corpus estilistikoa UZEI elkarteak sortutako corpusa da. UZEI-ren helburua euskara ikertzen duten pertsonak hizkuntza-datutegiak kontsultatzeko corpus hau baliogarria izatea da. Corpus hau 4.658.036 testu-hitzez osatua dago. Erabili izan den eta erabiltzen den euskararen lekuko eta erakusgarri izatea du egiteko nagusi eta ia bakarra, eta ez ereduzko hizkuntza proposatzea.
Corpus estatistikoaren oinarria, XX. mendeko euskal […]

[Lee más →]

Etiquetas:

UZEI-REN EGITASMOAK

abril 22nd, 2009 · Comments Off on UZEI-REN EGITASMOAK

 ♣ Euskararen normalizazio linguistikoaren alde lan egitea, hizkuntzaren erabilerarekin zerikusia duten balio erantsiko zerbitzuak eskainiz. Kulturatik eta goi-mailako zientzietatik sortzen diren, eta etorkizunean sortuko diren, premietara euskara moldatu eta egokitu ahal izateko euskararen ikerketan, normalizazioan eta hedapenean diharduten erakunde publiko eta pribatuekin lankidetzan aritzea.
♣  Euskararen barnean, xede berezietako hizkeren finkapena eta hedapena sustatzea. Euskararekin zerikusia […]

[Lee más →]

Etiquetas:

ZER DA UZEI?

abril 22nd, 2009 · Comments Off on ZER DA UZEI?

UZEI irabazi-asmorik gabeko elkartea da. Euskara berritu eta mundu modernora egokitzeko helburuarekin 1977an sortua, edozein hiztunek edozein lan-eremutan egokitasunez eta zehaztasunez erabil dezan.
Urtetan egindako hiztegi terminologiko guztiak banku terminologiko batean sartu ziren. Honela, 1986an EUSKALTERM terminologia-bankua sortu zen bere baitan.
1987an, 226/1987 Dekretuaren arabera eta berariazko lankidetza-hitzarmena izenpetuz, Eusko Jaurlaritzaren Babespeko Elkarte bihurtu zen hizkuntza-plangintzako ikerlanean […]

[Lee más →]

Etiquetas:

CORPORA MOTAK ETA ADIBIDEAK

abril 22nd, 2009 · Comments Off on CORPORA MOTAK ETA ADIBIDEAK

CORPORA MOTAK
Corpus bat osatzen duten testuek ez dute zertan hizkuntza bakar batean ( monolingue) idatzirik egon behar, bi hizkuntzatan edo gehiagotan idatzirik egon daitezke. Bi hizkuntzetan edo gehiagotan idatzita egongo balira testuak,corpusak bilingueak edo multilingueak izango lirateke. Kasu honetan, testuak ez dira modu arbitrario batean aukeratzen,hizkuntza baten kriterioak kontuan izanda baizik. Adibidez, “Aarhus Corpus of […]

[Lee más →]

Etiquetas:

ZER DA CORPUS BAT?

abril 22nd, 2009 · Comments Off on ZER DA CORPUS BAT?

Corpus bat, (pluralean corpora), testuen bilduma bat da eta normalean testu hauek elektronikoki biltegiratuta eta prozesatuta daude. Definizio hau, gaur egun leku askotan topa dezakegun definizioa da, baina hona hemen kontzeptu honen gainean emandako beste definizio batzuk:
  ● “On the face of it, a computer corpus is an unexciting phenomenon: a helluva lot of text, […]

[Lee más →]

Etiquetas:

Yorick Wilks(Q.1)

abril 22nd, 2009 · Comments Off on Yorick Wilks(Q.1)

Yorick Wilks is a Professor of Artificial Intelligence at the University of Sheffield, and a Senior Research Fellow at the Oxford Internet Institu. He was bornc in 1939 in the United Kingdom.
He’s most important works that have been published are:
Ballim, A., Wilks, Y. (1991) Artificial Believers: The Ascription of Belief. Lawrence Erlbaum Press.
Wilks, Y., Fass, […]

[Lee más →]

Etiquetas:

  • Etiquetas