Littera Deusto

Modern Languages, Basque Studies and Humanities

Getting to know better SARA and Xaira…

16 de mayo, 2009 |

‘SARA (SGML Aware Retrieval Application) was developed specifically for access to the BNC in a Microsoft Windows environment. It is freely available to all BNC licensees and also for registered users of the BNC Subscription service hosted by the British Library. A copy of SARA is delivered with every copy of the BNC World corpus. […]

Continúa leyendo la entrada... »

Different kinds of Corpora.

16 de mayo, 2009 |

I am going to give a brief introduction on these different kinds of corpora. It is not going to be technical because if we would want technical examples we would go to the page itself. It is going to be a description from my own experience, who do these systems work and what can we […]

Continúa leyendo la entrada... »

What is a corpus?

16 de mayo, 2009 |

In linguistics, a corpus is a large and structured set of texts (now usually electronically stored and processed). They are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules on a specific universe. They have also multiple examples of each word in different contexts and each example is categorized by […]

Continúa leyendo la entrada... »

Received Pronunciation

16 de mayo, 2009 |

In England, one accent has traditionally stood out above all others in its ability to convey associations of respectable social standing and a good education. This “prestige” accent is known as RECEIVED PRONUNCIATION, or RP. It is associated with the south-east, where most RP-speakers live or work, but it can be found anywhere in the […]

Continúa leyendo la entrada... »

Automatic Summarziation (Questionnaire 2)

15 de mayo, 2009 |

This technique helps us summarize the content of a text automatically. It is based on statistical, linguistical and heuristic methods where a summarization key controls how many times a considered “key word” appears. These key words belong to something which the experts call open class words.
This summarization system controls how many times the key words […]

Continúa leyendo la entrada... »

Europako Teknologia Zentruak eta proiektuak

15 de mayo, 2009 |

Europan mota askotako teknologia zentruak aurkitzen dira. Artikulu honetan teknologia zentru nagusien berri emango da eta horrekin batera, proiektuak diren zentruak aurkeztuko dira.
Lehenik eta behin, European Association for Machine Translation (EAMT ) aurkeztuko dizuet. Hau itzulpen automatikoaren batzordea da eta MT-an interesatutako pertsonei zuzenduta dago itzulpenak egin ditzaten batzorde honen bitartez.  
Bestalde, International association for […]

Continúa leyendo la entrada... »

Martin Kay, Yorick Wilks eta Hans Uszkoreit

15 de mayo, 2009 |

Martin Kay, Yorick Wilks eta Hans Uszkoreit-i buruz egingo dugu berba artikulu honetan. Hiru gizon hauek mundu informatikoan eragin handia izan duten pertsonak dira eta alor honetan eman dituzten aurrerapauso eta lan eredugarriengatik dira ezagun. Martin Kayk eta Hans Uszkoreitek Linguistika Konputazionalaren gainean egin dituzte lan nagusienak eta Yorick Wilkek, berriz, Jakituria Artifizialean gailendu da. […]

Continúa leyendo la entrada... »

THIRD DEBATE (bis)

14 de mayo, 2009 |

MARKUP LANGUAGES: HTML and XML
They are both two markup languages. The first one is the main markup language of the Web while the second one is nowadays more used than before.
HTML (hypertext markup language) was borned in the year 1990 and is the markup language that permits the creation of hypertexts in the Worl Wide […]

Continúa leyendo la entrada... »

Don’t think too much

14 de mayo, 2009 |

Me he levantado cansada y congestionada. La verdad es que ésta alergia no ayuda en lo más mínimo.
Está nublado y lluvioso, bastante. Ayer tuve un día agotador, y es hoy cuando me pasa factura. A parte de que salí de casa a las 11 y regresé a las 8:30 de la noche, me trataron […]

Continúa leyendo la entrada... »

“Hasta” en EspEs

14 de mayo, 2009 |

Aquí veremos la utilización de la preposición “hasta” en el castellano que se habla en España. Se usa para expresar el término límite en relación con el tiempo, el espacio o la cantidad: No lo tendré listo hasta el viernes; Corrió hasta la casa; Contaré hasta veinte; Vino hasta mí y me besó. Seguida de […]

Continúa leyendo la entrada... »

GALDERA-ERANTZUN SISTEMAK (Q.3)

13 de mayo, 2009 |

Ingelesez Question Answering (QA) izenaz ezagutzen diren sistema hauek informazioa aurkitzeko eta berreskuratzeko baliagarriak dira. Dokumentu kantitate zehatza emanda (World Wide Web-a, adibidez) sistema hauek gai dira lengoaia naturalean proposatutako galdera zehatz batzuei erantzuna emateko. Galdera-erantzun sistemek bestelako sistemak baino teknologia konplexuagoak eskatzen dituzte Lengoaia Naturalen Prozesamenduei dagokienez. Sistema hauek prozedura bi jarraitzen dute: lehena galdera ulertzea da eta bigarrena, […]

Continúa leyendo la entrada... »

Itzulpen automatikoaren jatorria.

13 de mayo, 2009 |

Itzulpen automatikoari ere Machine Translation (MT) deitzen zaio. Hizkuntzalaritza konputazionalaren alor bat da, software-ren bidez, testuak hizkuntza batetik bestera pasatzeko. Bi maila eduki ditzake: Erraza-> Hizkuntzen artean baliokideak diren hitzak aldatu, nahiz eta jatorrizko zentzua desagertu (Itzulpen literala) Zehatzagoa -> “Corpus” linguistikoen bidez, itzulpen zailagoak egiten dira, non egokiagoak eta errealagoak baitira. Baina itzulpen automatikoarena […]

Continúa leyendo la entrada... »