Littera Deusto

Modern Languages, Basque Studies and Humanities

ZT corpusa

junio 21st, 2009 · No hay Comentarios

Zientzia eta Teknologiaren Corpusa (ZT corpusa) Euskal Herriko Unibertsitateko IXA taldeak eta Elhuyar Fundazioak elkarlanean sortu dute. Corpus honek zientzia eta tekonologiari buruzko testuak batzen ditu eta erabilerari buruzko arauak ematen ditu euskera ondo erabiltzeko arlo hauetan. Corpus espezializatua da.

Ezaugarriak hauek dira:

-1990 eta 2002 urteren bitartean argitaratutako idazlanak batzen ditu.

-Sailkapena hurrengoa da
*Eremua
*Generoa

-Corpus etiketatua da; formatukoki eta linguistikoki.

8,5 milioi hitz daude.

-Corpusa XMLn etiketatuta dago eta TEI estandarrari jarraitu diote.

Etiquetas:

  • Etiquetas