Informazio Erauzketa (Ingelesetik datorren Information Extraction IE), informazioaren berreskurapen mota bat da. Bere helburua, ordenagailu batentzat irakurterrazak diren dokumentuetatik, informazio egituratua edo erdiegituratua erauztea da automatikoki.
IE-ren Aplikazio arruntenetariko bat hizkuntza natural batean idatzitako dokumentu batzuen eskaneatua da eta bildutako informazioarekin datu-base bat betetzea. IE-rekin zerikusia duten egungo tendentziak hizkuntza naturalaren prozesamendurako diren teknikak erabiltzen dituzte, area mugatuetan zentratzen direnak.
Message Understanding Conference (MUC) edo Mezuetarako Ulerkotasun Konferentzia lehiaketan, aspektu hauei buruz hitz egin dute azken urte hauetan:
- MUC- 1 1987, MUC-2 1989: Itsas operazioetarako mezuak.
- MUC-3 1991: Latinoamerikar herrialdeetan terrorismoa.
- MUC-5 1993: Mikroelektronika.
- MUC-6 1995: Kudeatze aldaketen artikulu berriak.
- MUC-7 1998: Sateliteen jaurtiketen txostenak.
IE-ren zeregin arruntenetarikoak hauexek dira:
- Pertsonen izenen, lurralde, erakunde, denbora adierazpenak eta zenbaki adierazpen batzuen ezagutza.
- Objektu bera aipatzen duten izen sintagmak identifikatzea. Adibidez, anafora.
ITURRIAK:
- Extracción de la información. (2008, 2) de diciembre. Wikipedia, La enciclopedia libre. Fecha de consulta: 16:34, mayo 16, 2009 from http://es.wikipedia.org/w/index.php?title=Extracci%C3%B3n_de_la_informaci%C3%B3n&oldid=22193693.
- Information Extraction. Jim Cowie and Yorick Wilks. Maiatzak 16, 2009, from http://www.dcs.shef.ac.uk/~yorick/papers/infoext.pdf
- Information Extraction. Natural Language Processing Group, The University of Sheffield. Maiatzak 16, 2009, from http://gate.ac.uk/ie/