Informazio Erauzketa ingelesetik datorren hitz bat da (Information Extraction IE). Informazio berreskurapen mota bat da. Bere helburua honak hau da: ordenagailu batentzat irakurterrazak diren dokumentuetatik, automatikoki informazio egituratua edo erdiegituratua erauztea.
IE-ren aplikazio arruntenetariko bat hizkuntza natural batean idatzitako dokumentu batzuk eskaneatu eta bildutako informazio guztiarekin datu-base bat betetzea. Hizkuntza naturalaren prozesamendurako erabiltzen diren teknikak erabiltzen dituzte.
Message Understanding Conference (MUC) aspektu hauei buruz hitz egin dute azken urte hauetan:
- MUC- 1 1987, MUC-2 1989: Itsas operazioetarako mezuak.
- MUC-3 1991: Latinoamerikar herrialdeetan terrorismoa.
- MUC-5 1993: Mikroelektronika.
- MUC-6 1995: Kudeatze aldaketen artikulu berriak.
- MUC-7 1998: Sateliteen jaurtiketen txostenak.
IE-ren zeregin arruntenetarikoak hauek dira:
- Pertsonen izenen, lurralde, erakunde, denbora adierazpenak eta zenbaki adierazpen batzuen ezagutza.
- Objektu bera aipatzen duten izen sintagmak identifikatzea. Adibidez, anafora.
ERREFERENTZIAK:
- Extracción de la información. (2008, 2) de diciembre. Wikipedia, La enciclopedia libre. Kontsultatua: Ekainak 9, 2009 from: http://es.wikipedia.org/w/index.php?title=Extracci%C3%B3n_de_la_informaci%C3%B3n&oldid=22193693.
- Information Extraction. Jim Cowie and Yorick Wilks. Kontsultatua:Ekainak 9, 2009 from: http://www.dcs.shef.ac.uk/~yorick/papers/infoext.pdf
- Information Extraction. Natural Language Processing Group, The University of Sheffield. Kontsultatua:Ekainak 9, 2009 from: http://gate.ac.uk/ie/