Littera Deusto

Modern Languages, Basque Studies and Humanities

Informazio Erauzketa (Q.2)

mayo 16th, 2009 · No hay Comentarios

Informazio Erauzketa (Ingelesetik datorren Information Extraction IE), informazioaren berreskurapen mota bat da. Bere helburua, ordenagailu batentzat irakurterrazak diren dokumentuetatik,  informazio egituratua edo erdiegituratua erauztea da automatikoki.

IE-ren Aplikazio arruntenetariko bat hizkuntza natural batean idatzitako dokumentu batzuen eskaneatua da eta bildutako informazioarekin datu-base bat betetzea. IE-rekin zerikusia duten egungo tendentziak hizkuntza naturalaren prozesamendurako diren teknikak erabiltzen dituzte, area mugatuetan zentratzen direnak.

Message Understanding Conference (MUC) edo Mezuetarako Ulerkotasun Konferentzia lehiaketan, aspektu hauei buruz hitz egin dute azken urte hauetan:

  • MUC- 1 1987, MUC-2 1989: Itsas operazioetarako mezuak.
  • MUC-3 1991: Latinoamerikar herrialdeetan terrorismoa.
  • MUC-5 1993: Mikroelektronika.
  • MUC-6 1995:  Kudeatze aldaketen artikulu berriak.
  • MUC-7 1998: Sateliteen jaurtiketen txostenak.

IE-ren zeregin arruntenetarikoak hauexek dira:

  1. Pertsonen izenen, lurralde, erakunde, denbora adierazpenak eta zenbaki adierazpen batzuen ezagutza.
  2. Objektu bera aipatzen duten izen sintagmak identifikatzea. Adibidez, anafora.

ITURRIAK:

Etiquetas:

  • Etiquetas