Colaborando a reconocer palabras y a Librarnos del Spam con reCAPTCHA
En Despuesdegoogle, Emili publica un post donde hace un paralelo entre los Populares CAPTCHAS y la cobertura que nos dan del Spam.
Pues bien, el Sistema que usan los scanners de Libros y otros impresos para transformar a digital cualquier contenido se llama OCR, que es una Tecnología que permite al ordenador distinguir las Palabras impresas por texto seleccionable, es decir, el Computador “traduce” textos impresos en textos digitales.

El problema sucede cuando el Computador no logra reconocer los textos que se procesan, por ejemplo, cuando hubieron problemas de Tinta o simplemente con el tiempo la letra se fue desgastando hasta hacerse notoria sólo al ojo humano.
Para ello, nace reCAPTCHA, un servicio que matará dos pájaros de un tiro, por una parte, colaborará con que los Blogs y CMS conocidos sean salvados del SPAM , por otra parte, colaborará con las empresas e Instituciones que digitalizan Libros para ponerlos al servicio de Todos, ya que cada palabra que se usa en el CAPTCHA no fue reconocida por un Computador y se pone a disposición de los Usuarios para que colaboren en su digitalización.
Esto colaborará a que los textos que son ilegibles sean pasados a Digital gracias a una plataforma colaborativa y que además te libra del Spam.
Ante todo esto, sólo me queda una pregunta… ¿Cómo le hacen para saber que la palabra que escribiste es la correcta? Porque si la ponen a disposición de los usuarios para que la descubran, significa que antes no existía en la Lista… Curioso…
Más Información | Despuesdegoogle
Sitio Oficial | reCAPTCHA
En Wikipedia | OCR – Reconocimiento Óptico de Caracteres










