The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of British English from the later part of the 20th century, both spoken and written. The latest edition is the BNC XML Edition, released in […]
What is the British National Corpus?
17 de junio, 2009 | Luz Ustara Diez
Machine Translation
17 de junio, 2009 | Marta Retuerto
Machine translation, whose abbreviation is MT, is one of the most interesting, useful and complete HLT application. It is a sub-field of computational linguistics that investigates the use of computer softwaretranslate text or speech from one natural language to another to. Using corpus techniques, more complex translations may be attempted, allowing for better handling of […]![]()
Metadatuak
17 de junio, 2009 | odeiba
Metadatuak zer diren definitzea ez da gauza erraza, izan ere horren arlo zabalean zentzu asko hartzen ditu hitz berak. Jakin beharrekoa da metadatuak datuen bidez osatzen direla. Normalean datu hoiek ikerketa zientifiko baten fruitua dira. Datu hoiek testu edo excel moduan agertu daitezke adibidez.
Metadatuen adibide orokor bat emateko, demagun liburu bat bilatzen ari garela. Liburu […]
Interfazeak Lengoaia Naturalean
17 de junio, 2009 | parizi
Ordenagailuak gure eguneroko bizitzako alderdi guztietan sartzen ari dira: dendetan, bulegoetan, eskoletan, zerbitzu publikoetan. Betsalde, herriak ez du konputagailuak eskatzen duten jakintza edo prestakuntza, eguneroko bizitzak hala eskatu arren. Eta sekula ez du prestakuntza hori izango gizakiak, honexegatik: ekonomikoki, makinak giza komunikaziora egokitzea baino pertsonak egokitu behar garelako makinetara, makinak erabiltzen ikasi behar ditugu.
Hemendik dator […]
Folksonomia
17 de junio, 2009 | odeiba
Folksonomia hitza ingelesetik heldu den neologismo bat da. Folksonomia objektuak (argazkiak, artikuluak, estekak…) kategorizatzean datza. Jakin behar da etiketatze modu honek ez duela ordena jerarkiko bat segitzen, horrek esan nahi du etiketa guztiek balio berdina dutela.
Software sozialetan erabiltzen da batez ere, hau da, Flickr, Flof, Tagzania eta horrelako web orrialdeetan.
Hona hemen definizo bat: El término folksonomy ha […]
Web semantikoa (Q.2)
17 de junio, 2009 | Leire Zamalloa
Azalpen hau, World Wide Web-etik dator eta HTML formatuan idatzitako dokumentuetan baino oinarritzen da gehienbat. Markaketa lengoaia batek, interneten hipertextua sortzeko balio du. HTML lengoaiaren bidez, irudiak eta multimedia sartu daiteke testuan baina aukera gutxi ematen ditu testuaren egitura baino haratago dauden funtzioak aztertzeko. Web semantikoaren osagai nagusiak metalengoaiak eta XML, XML Schema, RDF, RDF […]![]()
COMPUTATIONAL SEMANTICS
17 de junio, 2009 | rubitxo
Computational semantics studies how to automate the constructing and reasoning process with meaning representations of natural language expressions. It plays an important role in natural language processing and computational linguistics. Computational Semantic shares with Formal Semantic which searchs linguistics and philosophy that both of them have as an aim formalizing the meanings of sentences and […]![]()
Adimen artifiziala (Q.2)
17 de junio, 2009 | Idoia Ibarluzea
Adimen artifizialak hainbat definizio ditu. Wikipedian, adibidez, horrela definitzen da: “izaki bizidunen prozesu arrazional eta deduktiboak burutzeko makina batek duen gaitasuna”. Allen Newellek, aldiz, horrela definitzen du adimen artifiziala: “estudio de los mecanismos de la inteligencia y las tecnologías que lo sustentan”. Beste definizio bat hau izan daiteke: “disciplina científico-técnica que trata de crear sistemas artificiales […]![]()
Hiztegia.net…hainbat hiztegi web orrialde batean
17 de junio, 2009 | Marta Zumeta
Artez euskara zerbitzuak Bizkaiko ForuAldundiaren babesarekin hiztegia.net web orrialdea sortu du. Bertan hainbat euskararekin lotura duten hiztegietara bidaltzen gaituzten estekak dauka: sinonimodunak, euskara beste hizkuntzetara itzultzen dituztenak, monolingueak… Hainbat hiztegi hain eskuragarri izatea abantaila handia da euskararen inguruan lanean gabiltzanontzako. Horretaz gain, badauka atal bat “Corpus” izenekoa non sarean dauden corpus ezberdinetara bidaltzen gaituena: corpeus, euskararen […]![]()
QUESTIONARIE 3: Question Answering
16 de junio, 2009 | 1lanozal
According to wikipedia question answering (QA) is the task of automatically answering a question posed in natural language. To find the answer to a question, a QA computer program may use either a pre-structured database or a collection of natural language documents (a text corpussuch as the World Wide Web or some […]
QUESTION ANSWERING SYSTEMS (Questionnaire 3)
16 de junio, 2009 | Amaia Aristondo
On the web we could find answers to a huge range of questions. This is possible because of the extraordinary quantity of information which is obtainable online. Question answering, well known as QA, is the assignment of answering a question which is presented in natural language. The QA computer have to answer to the posed […]![]()
ERATORPENA: -go eta -garri atzizkiak
16 de junio, 2009 | Jon Gastelurrutia
Eratorpena esanahia duen hitz bati esanahirik gabeko elementu bat erantsiz hitzak sortzeari esaten zaio. Esanahirik gabeko elementu horiek aurrizkiak, artizkiak edo atzizkiak izan daitezke. Elementu hauek hitzaren kategoria aldatzeko gaitasuna daukate. Euskaraz gehienak atzizkiak dira; artizki eta aurrizki gutxi ditugu. Lehenago aipatu dudan bezala, atzizkiek kategoria mota desberdinetako hitzak sortzen dituzte: izenak, izenondoak, aditzondoak eta […]![]()