‘SARA (SGML Aware Retrieval Application) was developed specifically for access to the BNC in a Microsoft Windows environment. It is freely available to all BNC licensees and also for registered users of the BNC Subscription service hosted by the British Library. A copy of SARA is delivered with every copy of the BNC World corpus. […]![]()
Getting to know better SARA and Xaira…
16 de mayo, 2009 | Daniel Vergara
Different kinds of Corpora.
16 de mayo, 2009 | Daniel Vergara
I am going to give a brief introduction on these different kinds of corpora. It is not going to be technical because if we would want technical examples we would go to the page itself. It is going to be a description from my own experience, who do these systems work and what can we […]![]()
What is a corpus?
16 de mayo, 2009 | Daniel Vergara
In linguistics, a corpus is a large and structured set of texts (now usually electronically stored and processed). They are used to do statistical analysis and hypothesis testing, checking occurrences or validating linguistic rules on a specific universe. They have also multiple examples of each word in different contexts and each example is categorized by […]![]()
Received Pronunciation
16 de mayo, 2009 | Eos Gonzalez
In England, one accent has traditionally stood out above all others in its ability to convey associations of respectable social standing and a good education. This “prestige” accent is known as RECEIVED PRONUNCIATION, or RP. It is associated with the south-east, where most RP-speakers live or work, but it can be found anywhere in the […]![]()
Automatic Summarziation (Questionnaire 2)
15 de mayo, 2009 | Ainhize León Villate
This technique helps us summarize the content of a text automatically. It is based on statistical, linguistical and heuristic methods where a summarization key controls how many times a considered “key word” appears. These key words belong to something which the experts call open class words.
This summarization system controls how many times the key words […]
Europako Teknologia Zentruak eta proiektuak
15 de mayo, 2009 | parizi
Europan mota askotako teknologia zentruak aurkitzen dira. Artikulu honetan teknologia zentru nagusien berri emango da eta horrekin batera, proiektuak diren zentruak aurkeztuko dira.
Lehenik eta behin, European Association for Machine Translation (EAMT ) aurkeztuko dizuet. Hau itzulpen automatikoaren batzordea da eta MT-an interesatutako pertsonei zuzenduta dago itzulpenak egin ditzaten batzorde honen bitartez.
Bestalde, International association for […]
Martin Kay, Yorick Wilks eta Hans Uszkoreit
15 de mayo, 2009 | parizi
Martin Kay, Yorick Wilks eta Hans Uszkoreit-i buruz egingo dugu berba artikulu honetan. Hiru gizon hauek mundu informatikoan eragin handia izan duten pertsonak dira eta alor honetan eman dituzten aurrerapauso eta lan eredugarriengatik dira ezagun. Martin Kayk eta Hans Uszkoreitek Linguistika Konputazionalaren gainean egin dituzte lan nagusienak eta Yorick Wilkek, berriz, Jakituria Artifizialean gailendu da. […]
THIRD DEBATE (bis)
14 de mayo, 2009 | iraya
MARKUP LANGUAGES: HTML and XML
They are both two markup languages. The first one is the main markup language of the Web while the second one is nowadays more used than before.
HTML (hypertext markup language) was borned in the year 1990 and is the markup language that permits the creation of hypertexts in the Worl Wide […]
Don’t think too much
14 de mayo, 2009 | Maialen Garbizu
Me he levantado cansada y congestionada. La verdad es que ésta alergia no ayuda en lo más mínimo.
Está nublado y lluvioso, bastante. Ayer tuve un día agotador, y es hoy cuando me pasa factura. A parte de que salí de casa a las 11 y regresé a las 8:30 de la noche, me trataron […]
“Hasta” en EspEs
14 de mayo, 2009 | Eos Gonzalez
Aquí veremos la utilización de la preposición “hasta” en el castellano que se habla en España. Se usa para expresar el término límite en relación con el tiempo, el espacio o la cantidad: No lo tendré listo hasta el viernes; Corrió hasta la casa; Contaré hasta veinte; Vino hasta mí y me besó. Seguida de […]![]()
GALDERA-ERANTZUN SISTEMAK (Q.3)
13 de mayo, 2009 | Amaia Navarro
Ingelesez Question Answering (QA) izenaz ezagutzen diren sistema hauek informazioa aurkitzeko eta berreskuratzeko baliagarriak dira. Dokumentu kantitate zehatza emanda (World Wide Web-a, adibidez) sistema hauek gai dira lengoaia naturalean proposatutako galdera zehatz batzuei erantzuna emateko. Galdera-erantzun sistemek bestelako sistemak baino teknologia konplexuagoak eskatzen dituzte Lengoaia Naturalen Prozesamenduei dagokienez. Sistema hauek prozedura bi jarraitzen dute: lehena galdera ulertzea da eta bigarrena, […]![]()
Itzulpen automatikoaren jatorria.
13 de mayo, 2009 | Alain
Itzulpen automatikoari ere Machine Translation (MT) deitzen zaio. Hizkuntzalaritza konputazionalaren alor bat da, software-ren bidez, testuak hizkuntza batetik bestera pasatzeko. Bi maila eduki ditzake: Erraza-> Hizkuntzen artean baliokideak diren hitzak aldatu, nahiz eta jatorrizko zentzua desagertu (Itzulpen literala) Zehatzagoa -> “Corpus” linguistikoen bidez, itzulpen zailagoak egiten dira, non egokiagoak eta errealagoak baitira. Baina itzulpen automatikoarena […]![]()