Littera Deusto

Modern Languages, Basque Studies and Humanities

reCAPTCHA

noviembre 28th, 2010 · No hay Comentarios

CAPTCHA es el acrónimo de Completely Automated Puplic Turing test to tell Compurtes and Humans Apart, es decir, Prueba de Turing pública y automática para diferencia máquinas y humanos.  Se trata de una prueba desafío-respuesta utilizada en computación para determinar cúando el usuario es o no humano. Al día se resuelven 200 millones de CAPTCHA y la mitad corresponden con el servicio reCAPTCHA. Lo utilizan los principales servicios de Internet, medios de comunicación o blogs entre otros muchos.

reCAPTCHA se utiliza para digitalizar automáticamente infinidad de documentos y libros. El proceso es el siguiente: se “escanean” los documentos y a las imágenes se les aplica un sofware  de reconocimiento óptico de caracteres (OCR), de este modo identifican las palabras incluidas y las pasan a un formato textual. Pero el sofware de OCR no es del todo seguro y por ello cada imagen digitalizada se somete a veredicto de dos algoritmos diferentes.

Cuando entramos en una página protegida con reCAPTCHA nos aparecen dos palabras deformadas y debemos escribirlas en el cuadro de debajo. Una de las dos palabras es conocida por el sistema y la otra, en cambio, no. La conocida debemos introducirla correctamente ya que se usa como palabra de control. La otra palabra es la que utiliza para averiguar qué pone en la imagen original. Este sistema es muy efectivo a la hora de digitalizar documentos.

FUENTE:

Etiquetas:

  • Etiquetas