Bigarren galdeketarekin jarraitzeko, HLT-aren inguruko beste ikerketa gai bi labur azalduko dizkizuet: parsing-a eta tagging-a.
Batik bat, informatika arloan eta hizkuntzalaritzan erabiltzen den terminoa dugu parsing-a, sintaxiaren azterketa izenaz ere ezagutua. Prozesu honen bidez token sekuentzia bat, hau da, programazio lengoaia batzuetan esanahi koherentea duen karaktere katea (hitz gakoak, zenbakiak, zeinuak, etab.) edo karakterizatutako testu blokea, analizatu egiten da bere egitura gramatikala aurretik emandako gramatika formal batean zehazteko. Paser-a da ekintza hori burutzen duen konputazio programa eta bi motatakoa izan daiteke: top-down eta bottom-up.
Heriot Watt Unibertsitatean irakasle den Alison Cawsey-ren arabera parsing-a garrantzia handikoa da programa informatikoen prozesamendurako. Izan ere, programa informatiko orok azterketa bat behar du sintaktikoki zuzena den baieztatzeko. Era berean, parsing-a beharrezkoa da lengoaia naturalen interpretaziorako.
Tag edo etiketa XML-an oinarritutako markaketa lengoaietan sail berezi bat finkatzen duena da, eta finkapen prozesu horri tagging deritzogu. World Wide Web-aren sorrerarekin batera etiketak etengabe erabiltzen hasi ziren. Hauek dira HTML-an agertzen diren etiketetako batzuk:
-
<title>: dokumentu baten izenburua ematen du.
-
<!DOCTYPE>: dokumentu mota zehazten du.
-
<big>: tamaina handiko testua.
-
<dl>: lista bat definitzen du.
-
<img>: irudi bat txertatzen du.
-
<p>: paragrafo bat definitzen du.
-
<table>: taula bat txertatzen du.
Iturriak:
- Parsing (2009, apirilak 15). Wikipedia, Entziklopedia askea. Kontsultatua: 17:23, apirilak 19, 2009. Orrialdea: http://en.wikipedia.org/w/index.php?title=Parsing&oldid=283988668
- Token, informática (2009, martxoak 19). Wikipedia, Entziklopedia askea. Kontsultatua: 17:48, apirilak 19, 2009. Orrialdea: http://es.wikipedia.org/w/index.php?title=Token_(inform%C3%A1tica)&oldid=24941501.
- Token definición. Diccionario informático. Alegsa. Kontsultatua: 17:55, apirilak 19, 2009. Orrialdea: http://www.alegsa.com.ar/Dic/token.php
- Alison Cawsey (1998, abuztuak 28). Parsing, String Processing Algorithms. Heriot Watt University. Kontsultatua: 18:31, apirilak 19, 2009. Orrialdea: http://www.macs.hw.ac.uk/~alison/ds98/node70.html
- Etiqueta, lenguaje de marcado (2009, apirilak 4). Wikipedia, Entziklopedia askea. Kontsultatua: 19:21, apirilak 19, 2009. Orrialdea: http://es.wikipedia.org/w/index.php?title=Etiqueta_(lenguaje_de_marcado)&oldid=25322664
- Tag HTML. W3C. Htmlquick. Kontsultatua: 20:00, apirilak 19, 2009. Orrialdea: http://www.htmlquick.com/es/reference/tags.html