. El blog de la Núria Masdéu: reCAPTCHA: evitar l'spam i poder llegir llibres

28.5.07

reCAPTCHA: evitar l'spam i poder llegir llibres

Sabeu que els captcha són les imatges que contenen unes lletres o números que normalment ens fan escriure per enviar formularis online? Serveixen per evitar que els formularis i demés siguin espamejats, en només poder-ho omplir les persones i no les màquines automàticament.

Doncs bé, llegeixo a Read/WriteWeb que un equip d'investigadors de la Universitat Carnegie Mellon els ha trobat una altra aplicació: fer-los servir com a ajut en la digitalització de llibres.

Segons l'article esmentat, cada dia les persones desxifrem al voltant de 60 milions d'imatges captcha, gastant-hi unes 150.000 hores. Per aprofitar-ho, han llançat el recaptcha.

El projecte Internet Archive escaneja 12.000 llibres cada mes i envia als de la Carnegie Mellon centenars de milers d'imatges de paraules que l'ordinador no pot desxifrar. Aquestes imatges les transformen en captchas per al programa recaptcha.

Per certificar que la persona ha entrat correctament la paraula, el programa envia dues paraules per desxifrar: una que ja saben quina és i l'altra, que no. L'ordinador entén que si l'usuari respon bé la que coneix, amb un cert grau de confiança, respondrà correctament la que no es coneix.

Les eines per implantar aquest nou sistema estan disponibles per als webmàsters.