Colaborando a reconocer palabras y a Librarnos del Spam con reCAPTCHA
Este artículo está probablemente obsoleto
Este artículo fue publicado hace más de 10 años (el 17 de septiembre del 2007, para ser exactos). La información contenida puede estar muy desactualizada o ya no ser relevante.
El artículo existe como archivo de este sitio y de la antigüedad del mismo. Este blog existe en el Internet desde el 2007!
Algunos o todos los enlaces de este artículo pueden haber sido removidos o estar rotos debido a la antigüedad del mismo. Te pedimos las disculpas por cualquier inconveniente que esto pueda causar.
En Despuesdegoogle, Emili publica un post donde hace un paralelo entre los Populares CAPTCHAS y la cobertura que nos dan del Spam.
Pues bien, el Sistema que usan los scanners de Libros y otros impresos para transformar a digital cualquier contenido se llama OCR, que es una Tecnología que permite al ordenador distinguir las Palabras impresas por texto seleccionable, es decir, el Computador “traduce” textos impresos en textos digitales.
El problema sucede cuando el Computador no logra reconocer los textos que se procesan, por ejemplo, cuando hubieron problemas de Tinta o simplemente con el tiempo la letra se fue desgastando hasta hacerse notoria sólo al ojo humano.
Para ello, nace reCAPTCHA, un servicio que matará dos pájaros de un tiro, por una parte, colaborará con que los Blogs y CMS conocidos sean salvados del SPAM , por otra parte, colaborará con las empresas e Instituciones que digitalizan Libros para ponerlos al servicio de Todos, ya que cada palabra que se usa en el CAPTCHA no fue reconocida por un Computador y se pone a disposición de los Usuarios para que colaboren en su digitalización.
Esto colaborará a que los textos que son ilegibles sean pasados a Digital gracias a una plataforma colaborativa y que además te libra del Spam.
Ante todo esto, sólo me queda una pregunta… ¿Cómo le hacen para saber que la palabra que escribiste es la correcta? Porque si la ponen a disposición de los usuarios para que la descubran, significa que antes no existía en la Lista… Curioso… 😀
Más Información | Despuesdegoogle
Sitio Oficial | reCAPTCHA
En Wikipedia | OCR – Reconocimiento Óptico de Caracteres
Continúa Leyendo

Los Resultados de Google podrían verse afectados con Webs de Malware
Según una empresa de Investigación Web, se ha detectado que al menos unas 40.000 páginas estarían …

Nuevo formato de Correo Spam "con clase"
Impresionante el correo que he recibido, esto netamente usa la ingeniería social como le llaman los …