Tutto quello che volevate sapere sui captcha
Il CAPTCHA (acronimo di Completely Atomated Public Turing test to tell Computers and Humans Apart) è in pratica un test di Turing per far capire se dall’altra parte del PC c’è un umano o un robot.
Col diffondersi del web 2.0, si è sentita sempre più l’esigenza di limitare il caricamento dei contenuti sul web (commenti, news, video, ecc…) ai soli umani e di impedire che programmi preparati ad hoc intasassero forum e blog con fastidiosi messaggi di spamming inseriti in maniera automatica.
Bisognava trovare qualcosa che facesse capire che chi, per esempio, inseriva un commento in un blog fosse una persona in carne e ossa e non un software programmato.
Si è pensato a un test molto semplice: prima di accedere a un servizio o pubblicare un commento, si deve digitare inserire una sequenza di numeri e lettere che compaiono distorte in un’immagine in modo che un cervello umano possa comunque capirne correttamente il significato e mettendo così fuori gioco un software che, come si sa, manca ancora della capacità interpretativa.
Indubbiamente inserire un captcha rappresenta una scocciatura, ma visto che comunque va fatto, perché non farlo a fin di bene? Nasce infatti l’idea di recaptcha, ovvero proporre parole, tratte da libri scansionati, troppo sbiadite o stampate male per poter essere interpretati da un programma di riconoscimento del testo al posto di una sequenza di caratteri casuali.
Il funzionamento è molto semplice: ogni parola non interpretata dalla scansione OCR, viene proposta insieme ad un altra parola il cui significato è già noto; l’utente dovrà inserire entrambi i termini e se la risposta alla parola con significato noto è corretta, il sistema assumerà come corretta anche l’altra e permetterà l’accesso al servizio. Ovviamente non si fiderà di una sola risposta ma riproporrà la parola di difficile interpretazione ad altri utenti fino a quando avrà un numero elevato di risposte identiche. Semplicemente geniale.
L’idea del captcha è talmente buona che anche dagli spammer ne fanno uso per evitare di essere censurati dai filtri di protezione della posta.
Invece di spedire il messaggio in testo chiaro e facilmente analizzabile dai filtri antispam, si invia un immagine con il testo distorto (i filtri più precisi tentano un riconoscimento dei caratteri all’interno delle immagini).
Un umano ne capisce lo stesso il senso, una macchina no e quindi il filtro rimane ingannato e la lascia passare

Ma utilizzarne il principio a proprio uso, non era sufficiente, perchè riuscire a superare un captcha è una sfida con una posta in palio molto allettante per uno spammer; Hotmail e Gmail, per la cui registrazione è necessario inserire un captcha, sono domini appetitosi per i produttori di mail-spazzatura: il rischio di essere inseriti in qualche blacklist è nullo, se si considera l’enorme base di utenti registrati.
Così, raffinando le tecniche di attacco, anche i captcha cadono: stando a WebSense, oggi bot può creare un 24 ore più di 1400 indirizzi email e contemporanemente spedire spam da questi. ()
E’ tempo quindi di rimpiazzare i captcha con un sistema più efficace, ed ecco quello che hanno pensato i ricercatori della PENN STATE UNIVERSITY; per confermare che c’è un umano in carne e ossa dall’altra parte della tastiera, si dovrà procedere ad un test in due parti: la prima consiste nel cliccare col mouse nel centro di una qualsiasi immagine di un collage di foto (io ho cliccato sul centro dell’immagine del bicchiere in basso a sinistra)
e poi procedere ad identificare il soggetto di una seconda immagine scegliendo tra diverse opzioni possibili (nell’esempio un leone)
Questo secondo step ricorda molto Google Image Labeler il gioco usato da Google per etichettare le immagini e indicizzarne al meglio la ricerca.
Anche qui il meccanismo è ben studiato: si prendono due utenti internet, si propongono ed entrambi delle immagini di cui dovranno descrivere il soggetto. Quando entrambi scrivono la stessa parola (tag) passano ad una nuova immagine guadagnando punti e la parola comune sarà poi utilizzata da Google per indicizzare la ricerca dell’immagine presentata.
Potrebbe essere un trampolino di lancio per bypassare la nuova generazione di … captcha!


Molto utile e molto interessante.
Grazie mille!
Ciao. Il tuo articolo mi e piacuto, vorrei communque tradurlo il francese e publicarlo sul mio sito ( http://www.studioznak.net/site ); posso ?
Certamente!
Il problema ancora più grande è che da paesi con grandi problemi di disoccupazione (leggi Russia) giunge la notizia della grande disponibilità di studenti e giovani pagati una miseria per interpretare migliaia di soluzioni.
Credo costino meno dell’energia spesa per alimentare il terminale sul quale gira il bot:-)
@ FattoreWow
Ne ho sentito parlare anche io… e qui non esiste test di Turing che tenga!
Non so se i principali provider di posta si siano già cautelati contro questo genere di minaccia implementando, ad esempio, un controllo che inibisca la registrazione di un account dallo stesso indirizzo IP a breve tempo di distanza.
Sarei quasi tentato di fare qualche prova…
Purtroppo temo che per ora possano fare proprio poco.
Del resto un uomo come lo blocchi?
Il filtro IP non credo regga in quanto possono tranquillamente cammuffarlo.
Potrebbero bloccare gli indirizzi MAC ma ho letto che ora si possono modificare anche quelli.
Cioè, se non posso più credere nell’indirizzo MAC dimmi tu in cosa posso credere.