Littera Deusto

Modern Languages, Basque Studies and Humanities

INFORMAZIO ERAUZKETA

junio 9th, 2009 · No hay Comentarios

Informazio Erauzketa ingelesetik datorren hitz bat da (Information Extraction IE). Informazio berreskurapen mota bat da. Bere helburua honak hau da: ordenagailu batentzat irakurterrazak diren dokumentuetatik, automatikoki informazio egituratua edo erdiegituratua erauztea.

IE-ren aplikazio arruntenetariko bat hizkuntza natural batean idatzitako dokumentu batzuk eskaneatu eta bildutako informazio guztiarekin datu-base bat betetzea. Hizkuntza naturalaren prozesamendurako erabiltzen diren teknikak erabiltzen dituzte.

Message Understanding Conference (MUC) aspektu hauei buruz hitz egin dute azken urte hauetan:

  • MUC- 1 1987, MUC-2 1989: Itsas operazioetarako mezuak.
  • MUC-3 1991: Latinoamerikar herrialdeetan terrorismoa.
  • MUC-5 1993: Mikroelektronika.
  • MUC-6 1995:  Kudeatze aldaketen artikulu berriak.
  • MUC-7 1998: Sateliteen jaurtiketen txostenak.

IE-ren zeregin arruntenetarikoak hauek dira:

  1. Pertsonen izenen, lurralde, erakunde, denbora adierazpenak eta zenbaki adierazpen batzuen ezagutza.
  2. Objektu bera aipatzen duten izen sintagmak identifikatzea. Adibidez, anafora.

ERREFERENTZIAK:

Etiquetas:

  • Etiquetas