Littera Deusto

Modern Languages, Basque Studies and Humanities

PARSING ETA TAGGING (Q.2)

abril 19th, 2009 · No hay Comentarios

Bigarren galdeketarekin jarraitzeko, HLT-aren inguruko beste ikerketa gai bi labur azalduko dizkizuet: parsing-a eta tagging-a.

Batik bat, informatika arloan eta hizkuntzalaritzan erabiltzen den terminoa dugu parsing-a, sintaxiaren azterketa izenaz ere ezagutua. Prozesu honen bidez token sekuentzia bat, hau da, programazio lengoaia batzuetan esanahi koherentea duen karaktere katea (hitz gakoak, zenbakiak, zeinuak, etab.) edo karakterizatutako testu blokea, analizatu egiten da bere egitura gramatikala aurretik emandako gramatika formal batean zehazteko. Paser-a da ekintza hori burutzen duen konputazio programa eta bi motatakoa izan daiteke: top-down eta bottom-up.

Heriot Watt Unibertsitatean irakasle den Alison Cawsey-ren arabera parsing-a garrantzia handikoa da programa informatikoen prozesamendurako. Izan ere, programa informatiko orok azterketa bat behar du sintaktikoki zuzena den baieztatzeko. Era berean, parsing-a beharrezkoa da lengoaia naturalen interpretaziorako.

Tag edo etiketa XML-an oinarritutako markaketa lengoaietan sail berezi bat finkatzen duena da, eta finkapen prozesu horri tagging deritzogu. World Wide Web-aren sorrerarekin batera etiketak etengabe erabiltzen hasi ziren. Hauek dira HTML-an agertzen diren etiketetako batzuk:

  1. <title>: dokumentu baten izenburua ematen du.
  2. <!DOCTYPE>: dokumentu mota zehazten du.
  3. <big>: tamaina handiko testua.
  4. <dl>: lista bat definitzen du.
  5. <img>: irudi bat txertatzen du.
  6. <p>: paragrafo bat definitzen du.
  7. <table>: taula bat txertatzen du.

Iturriak:

 

Etiquetas:

  • Etiquetas