Littera Deusto

Modern Languages, Basque Studies and Humanities

Zer da Corpus bat?

junio 22nd, 2009 · No hay Comentarios

Euskaraz “c” hizkia erabiltzen ez den arren, adituek corpus “c”-rekin idaztea gomendatzen dute.

Corpus bat hizkuntza batean dauden adibide-hitzen zerrenda baten modukoa da. Atalka banatu ohi dira corpusak, bakar bat egitea ez litzatekeelako zehatza izango.

Elhuyar hiztegiak, adibidez,  zientziaren inguruko korpus bat kaleratu du sarean.

Internet informazio-iturri ikaragarria da. Inork gutxik jartzen du zalantzan hori. Egun, informazioa bilatzeko ez ezik, gero eta gehiago erabiltzen da hizkuntza-kontsultak egiteko, corpusak osatzeko eta abarretarako. Hala, Internet baliabide linguistiko eta corpusen iturri aproposa bilakatzen ari da pixkanaka. Horren adibide bat da CorpEus, Internet euskarazko corpus erraldoi gisa baliatzeko aukera ematen duen tresna.

Corpusen kontuak baditu bere alde ez hain onak ere. CorpEus orain arteko corpusen osagarri izango da. Alabaina, abantailak ez ezik, zenbait desabantaila ere baditu. Batetik, arestian aipatu den bezala, Internet linguistikoki etiketatu gabea denez, nolabaiteko ziurgabetasuna izango du beti lema bat baino gehiago dituzten hitzekin. Pilotari hitza bilatzean, adibidez; izan ere, pilota hitzaren datiboa ez ezik, pilotan jokatzen duen pertsona ere bada pilotaria. Beste desabantaila bat da orraztu gabea dela neurri handi batean –blogak, foroak, eduki pertsonala eta horrelakoak, batez ere–; abantaila gisa ikus badaiteke ere (ahozko hizkuntzatik hurbil dagoen eredua ematen delako), desabantaila ere bada, kalitatez txarragoa eta akastuna izan baitaiteke.

Hona hemen Elhuyar Fundazioko kideen argazki bat:

Elhuyar fundazioko kideak

Etiquetas:

  • Etiquetas