Re Captcha

Hace unos meses estuvimos charlando el tema de los "Captcha" para poder identificar si un comentador es humano o no y las mil y una formas de violar estas técnicas.

Pero ahora me encuentro con una vuelta de tuerca super interesante, un sistema de captcha, si, pero con textos escaneados de libros antiguos. Recaptcha.

¿y para que serviría? para poder digitalizarlos mejor! es que los software de OCR (detección de texto) son falibles con estos escaneos de baja calidad, así que no sólo sirven para la seguridad del sitio, si para la cultura general :D

Como pueden ver en el ejemplo, es normal que muchas letras no sean bien escaneadas o la letra original sea muy cerrada o difusa, así, y sacando un promedio de varios captcha a la vez , se puede tener el texto correcto.



a 100 comentarios diarios, 200 palabras, 100 blogs podrían tener siete millones de palabras al año, imaginen miles de blogs, algunos que tienen no 100 comentarios, varios cientos al día, bueno, hagan sus cuentas, esto es OCR distribuído :D

Y como siempre, el único que actualmente podría acertar siempre, es un humano o un sistema de OCR demasiado complejo y caro como para justificarse el uso en un weblog.

Link: Recaptcha.

Obviamente lo pueden agregar en sus blogs tocando un poco de código, hay plugins para wordpress y los más conocidos.

Si te gustó esta nota podés...
Invitame un café en cafecito.app

Categoría: Informática Etiquetas:  

Otros posts que podrían llegar a gustarte...

Comentarios

  • K3NNY     04/07/2007 - 02:25:57

    No entiendo. Para poder saber si el comentarista ingresó correctamente el código, el "script" tiene que saber de antemano que es lo que dice la imagen. Y si ya sabe que es lo que dice, ¿donde está la utilidad?

  • Ale     04/07/2007 - 04:44:47

    Lo que hace es mostrarte dos palabras, una que se pudo OCRear bien y otra que no. Si ingresas correctamente la buena, verifica con eso y asume que la otra también la ingresaste correctamente. O sea, no es 100% confiable, pero imagino que la misma palabra le debe aparecer a más de uno, asique si hay una discrepancia se podrá resolver luego.

  • Martin Aberastegue     04/07/2007 - 07:23:30

    Interesante, creo que la mayar barrera seria el idioma aca, muchas palabras uno las "adivina" porque las conoce y les suenan parecidas, pero el que no tiene ni la mas minima idea de ingles,... le va a pifiar un par de veces antes de acertarle. Lo probe en un WP, pero lo saque porque se veia mal ... CSS de mierd... ademas con el akismet ando de diez.. por ahora

  • garci     04/07/2007 - 07:29:04

    Coincido con lo que dice Martin... pero bueno, supongo que es facilmente resoluble, con tal que te proveean de scans en una determinada lengua.. suficiente.

    Interesante la verdad! Mi blog usa blogger.. asi que bueh, por el momento esta fuera...

    Lo vas a integrar a PostRev?

    Saludos!

  • PabloS     04/07/2007 - 09:00:48

    Parece que está bueno che. Mucho quilombo para ponerlo sin embargo, jeje!

  • Cattel     04/07/2007 - 10:03:57

    Interesante. Ojalá ande mejor que el SETI program que todavía no encontró a ningún ET usando screen savers. Igual no quedan medio largos esos captchas? Lo bueno es que de a poco podés ir aprendiendo clásicos casi subliminalmente.

  • Pedro     04/07/2007 - 10:42:57

    y vos para cuando lo vas a poner fabio? Guiño

  • Fabio     04/07/2007 - 10:56:17


    Pedro dijo:

    y vos para cuando lo vas a poner fabio? Guiño


    no pienso hacerlo!


    garci dijo:

    Lo vas a integrar a PostRev?


    no, este tipo de plugins que los haga otro y me los pase, yo ni tengo tiempo para sacar una nueva versión, menos con cambios así o dependiendo de lo que haga otro, el PR tiene que poder valerse solo.

  • Leo     04/07/2007 - 13:34:45

    Zarpado. Que buena idea eh.

  • cypher     05/07/2007 - 11:38:08

    Wow.

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https

Negrita Cursiva Imagen Enlace


Comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador. Los comentarios son filtrados por ReCaptcha V3.