CAPTCHA

De la Viquipèdia, l'enciclopèdia lliure.
Saltar a la navegació Saltar a la cerca
Aquest CAPTCHA (versió 1) de "smwm" evita la interpretació del seu missatge per un ordinador girant algunes lletres, deformant-les i afegint un to blau clar al fons.

L’ acrònim anglès CAPTCHA (pronunciat: [ˈkæp.tʃə] ) denota en el camp de la informàtica una prova formada per una o més preguntes i respostes per determinar si l’usuari és un ésser humà i no un ordinador o, més exactament, un bot .

Les sigles, suposadament derivades de l'anglès " C ompletely A utomated P ublic T uring-test-to-tell C omputers and H umans A part " (" Prova pública i totalment automàtica de Turing per distingir entre ordinadors i humans"), de fet reprodueix fonèticament l'expressió col·loquial "t'ha atrapat!" (T’he atrapat!) . El terme va ser encunyat el 2000 per Luis von Ahn , Manuel Blum i Nicholas J. Hopper de la Universitat Carnegie Mellon i John Langford d' IBM .

Una prova CAPTCHA que s’utilitza normalment és aquella en què es demana a l’usuari que escrigui quines lletres o números hi ha en una seqüència, que apareix distorsionada o borrosa a la pantalla .

Atès que la prova és gestionada per un ordinador, mentre que la prova original de Turing és gestionada per un humà, la prova CAPTCHA de vegades es descriu com una prova inversa de Turing; tanmateix, es tracta d’una definició enganyosa, perquè també podria indicar una prova de Turing en què tots dos participants intenten demostrar que no són humans; de fet, literalment parlant, ets un robot .

Descripció

Orígens

Els CAPTCHA van ser desenvolupats per primera vegada el 1997 pel departament de R + D d’ AltaVista dirigit per Andrei Broder , per evitar que els robots afegissin URL al seu motor de cerca . Broder i els seus col·legues van intentar crear imatges resistents als atacs OCR i, per tant, van consultar el manual dels escàners Brother , que indicava totes les característiques que ha de tenir un text per tal de ser reconegut per l’escàner: caràcters lineals i ben definits, manca de diferències entre els tipus de lletra utilitzats al text, un fons homogeni que es distingeix clarament del text, etc. Aplicant aquestes indicacions al contrari, es va poder obtenir la pitjor situació possible, és a dir, un text l’escaneig del qual hauria estat molt difícil: caràcters torts, tipus de lletra diferents, colors del text similars al del fons o dispositius similars. Broder va argumentar que la introducció d'aquesta tecnologia havia reduït el correu brossa en més d'un 95%.

Independentment de l’equip d’AltaVista, Luis von Ahn i Manuel Blum van desenvolupar i difondre la idea de la prova CAPTCHA el 2000 , és a dir, qualsevol tipus de programa que fos capaç de distingir entre persones i ordinadors. Van inventar diversos tipus de proves, incloses les primeres que van rebre una difusió generalitzada gràcies a l’ús de Yahoo!

Aplicacions

Els CAPTCHA s’utilitzen per evitar que els robots facin servir determinats serveis, com ara fòrums , registrar-se a llocs web , escriure comentaris i, en general, qualsevol cosa que es pugui utilitzar per crear correu brossa o per incomplir la seguretat amb operacions de pirateria , com ara la força bruta . Aquest tipus de prova també es va utilitzar per combatre el correu brossa generat per bot obligant l’emissor d’un missatge de correu electrònic desconegut pel destinatari a passar una prova CAPTCHA abans de permetre el lliurament del missatge.

Característiques

Per definició, les proves CAPTCHA són completament automàtiques i no requereixen normalment intervenció humana per a administració o manteniment, amb avantatges indubtables en termes de costos i fiabilitat.

Els algoritmes utilitzats per dur a terme les proves sovint es divulguen al públic, tot i que en molts casos estan protegits per patents. Aquesta política de transparència té com a objectiu demostrar el fet que la seguretat del mètode no rau en el coneixement d’un algorisme secret (que es podria obtenir amb tècniques d’ enginyeria inversa o de manera fraudulenta); al contrari, per "trencar" l'algoritme cal resoldre un problema classificat com a "dur" en el camp de la intel·ligència artificial .

No és obligatori utilitzar tècniques visuals: qualsevol problema d’intel·ligència artificial que tingui el mateix grau de complexitat, com el reconeixement de la parla , és adequat per servir de base per a una prova d’aquest tipus. Algunes implementacions permeten a l'usuari triar alternativament una prova basada en tècniques auditives, encara que aquest enfocament hagi experimentat un desenvolupament més lent i no sigui necessàriament tan eficaç com el visual. A més, és possible recórrer a altres tipus de proves que requereixen una activitat de comprensió del text, com respondre a una pregunta o un qüestionari lògic, seguir instruccions específiques per crear una contrasenya, etc. També en aquest cas les dades sobre la resistència d’aquestes tècniques a les contramesures són escasses.

Una tècnica prometedora que s’ha desenvolupat en els darrers anys utilitza proves basades en el reconeixement d’una cara dins d’una imatge familiar. Per a aquest tipus de CAPTCHA parlem de RTT basat en el reconeixement de cares . En la literatura actual, només s’han implementat dos mètodes basats en aquest tipus de CAPTCHA : l’ ARTiFACIAL [1] i un CAPTCHA basat en el reconeixement facial . [2] [3]

Accessibilitat

L’ús de proves CAPTCHA basades en la lectura de textos o altres activitats relacionades amb la percepció visual impedeix o limita severament l’accés a recursos protegits per a usuaris amb problemes de visió i, atès que aquestes proves estan dissenyades específicament per no ser llegibles per eines automàtiques, la tecnologia normal els ajuts utilitzats per usuaris invidents o amb discapacitat visual no poden interpretar-los; però fins i tot els usuaris daltònics poden no ser capaços de passar la prova. L’ús de proves CAPTCHA , generalment vinculades a les fases inicials d’accés o registre als llocs i de vegades repetides per a cada accés, pot constituir una discriminació contra aquests usuaris amb discapacitat, de manera que en algunes jurisdiccions constitueix una violació de la llei.

A les noves generacions de CAPTCHA , creades per resistir els programes de reconeixement de text més sofisticats, pot ser molt complicat, per no dir impossible, reconèixer el text de molts usuaris, fins i tot en plena possessió de la seva capacitat visual.

El W3C ha elaborat un informe que posa de manifest alguns dels problemes d’accessibilitat associats a l’ús d’aquestes tècniques. [4]

Contramedides

Després de l’ús massiu de CAPTCHA , s’han descobert algunes contramesures que permeten als spammers passar les proves.

El programari intel·ligent ara pot resoldre CAPTCHA de diversos tipus. [5]

Greg Mori i Jitendra Malik van presentar el 2003 un estudi [6] que il·lustra com evitar un dels sistemes més populars per dur a terme proves CAPTCHA , EZ-Gimpy; aquest enfocament va resultar eficaç en el 92% dels casos. En comparació amb el sistema Gimpy més sofisticat però menys estès, l’eficàcia del mètode baixa fins al 33%. De moment, però, no se sap si aquest algorisme s’ha implementat fora del context de la investigació.

Alguns programes també s’han creat per cercar una solució repetidament i d’altres per reconèixer els caràcters escrits, utilitzant tècniques especials i no les estàndards d’ OCR . Projectes com PWNtcha [7] han fet grans avenços, contribuint a la migració global a CAPTCHA que és cada vegada més difícil.

Una altra manera de passar un CAPTCHA és aprofitar les sessions en què la prova ja ha superat, desant les proves i creant un arxiu de solucions.

Però el mètode més eficaç és utilitzar un ésser humà per resoldre el CAPTCHA : de fet, és possible confiar a les persones remunerades la tasca de resoldre els CAPTCHA . L'esmentat document W3C [4] estableix que un operador pot resoldre fàcilment centenars de proves CAPTCHA en una hora.

Aquesta possible solució requeriria una inversió econòmica que no sempre es justifica, però s’ha descobert un mètode més econòmic per obtenir els mateixos resultats: el spammer utilitza amb aquest propòsit un lloc d’Internet amb un servei que els usuaris humans sol·liciten. un fòrum però també una col·lecció d'imatges pornogràfiques. Així, quan un usuari sol·licita iniciar la sessió, se li ofereix un CAPTCHA obtingut del lloc extern al qual el spammer vol atacar: la prova la resol l’usuari, que rep a canvi una remuneració que té un cost insignificant per al spammer , mentre el sistema "recicla" la solució de prova per superar la barrera del lloc objectiu.

reCaptcha

Logotip de ReCaptcha

Les proves CAPTCHA han tingut usos secundaris no relacionats exclusivament amb l’eliminació del correu brossa: el més conegut es refereix al reconeixement de textos continguts en llibres antics i s’anomena reCaptcha . Moltes biblioteques estan convertint digitalment les seves col·leccions de textos antics (inclosos manuscrits); aquesta conversió s’obté mitjançant la digitalització de les pàgines i la seva posterior anàlisi mitjançant un programa OCR , que analitza les imatges de les pàgines i n’extreu el text. Tanmateix, els programes d’OCR tenen dificultats per interpretar lletres esvaïdes i pàgines grogues de textos antics i, quan són incapaços de reconèixer un text amb certesa, requereixen una intervenció humana, que alenteix el procés i augmenta el cost de la digitalització.

Investigadors de la Universitat Carnegie Mellon van decidir utilitzar sistemes CAPTCHA per interpretar paraules qüestionables identificades pels programes OCR. Quan dos sistemes OCR identifiquen una paraula de manera diferent, s’associa a una paraula coneguda i s’envia a un usuari que ha de passar una prova CAPTCHA per accedir a un servei. Se suposa que si un usuari pot trobar correctament la paraula coneguda, també trobarà la paraula desconeguda amb una alta probabilitat. Quan tres usuaris donen la mateixa resposta, el sistema emmagatzema la paraula com a correcta. Aquest sistema va permetre convertir 440 milions de paraules amb un 99% de precisió. A l'agost de 2008, aquest sistema convertia 4 milions de paraules al dia. [8] El projecte es va convertir posteriorment en una empresa d’inici que Google va adquirir el setembre del 2009, que va iniciar un procediment d’exploració de desenes de milions de llibres emmagatzemats en centenars de llibreries de tot el planeta i té la intenció d’explotar el projecte reCaptcha per corregir els errors resultants de Escaneig OCR de textos. [9] El reCaptcha es pot comparar amb la categoria de jocs amb un propòsit (GWAP) . [ sense font ]

CAPTCHA a la cultura d’Internet

Un dels fenòmens d'Internet nascut a 4chan és el CAPTCHA . Es refereix a un codi en què es llegia "Inglip Summoned": va donar lloc a la falsa llegenda que un déu fosc, com Inglip, va tornar a la terra per arrossegar-lo a la foscor. També hi ha diversos vídeos a YouTube en què Inglip donaria ordres als seus seguidors, sempre mitjançant codis CAPTCHA extravagants i sovint incomprensibles. [10]

Nota

  1. ^ Còpia arxivada ( PDF ), a research.microsoft.com . Consultat el 14 de març de 2010 ( arxivat el 7 de gener de 2010) .
  2. ^ Descàrregues gratuïtes de Captcha de reconeixement facial: Luxand FaceSDK per Luxand Development, Luxand Blink! Pro by Luxand Development and More
  3. ^ IEEE Xplore - Resum de la pàgina
  4. ^ a b ( EN ) Matt May, Inaccessibilitat de les proves antirobot orientades visualment , a la nota del grup de treball del W3C , 23 de novembre de 2005. Consultat el 12 de juliol de 2011 ( arxivat el 19 de juliol de 2011) .
  5. ^ La startup americana crea programari per resoldre Captcha mitjançant intel·ligència artificial , a CesarNews . Arxivat de l' original el 28 d'octubre de 2013. Obtingut el 26 de març de 2021 .
  6. ^ (EN) Greg Mori, Jitendra Malik, Recognizing Objects in Adversarial Clutter: Breaking a Visual CAPTCHA (PDF) a cs.sfu.ca. Consultat el 12 de juliol de 2011 ( arxivat el 29 de setembre de 2011) .
  7. ^ PWNtcha - Caca Labs , a sam.zoy.org . Consultat el 3 d'octubre de 2005 ( arxivat l'11 de setembre de 2005) .
  8. ^ Els textos antics tenen futur "Un mètode antispam els salvarà" , a repubblica.it . Consultat el 19 d'agost de 2008 ( arxivat el 21 d'agost de 2008) .
  9. ^ Google compra reCaptcha , a macitynet.it . Consultat el 16 de setembre de 2009 ( arxivat el 22 de setembre de 2009) .
  10. ^ Inglipedia , a inglipnomicon.wikia.com , 16 de setembre de 2009. Consultat el 5 de juny de 2011 ( arxivat el 18 de juny de 2011) .

Articles relacionats

Altres projectes

Enllaços externs

Control de l'autoritat LCCN (EN) sh2009002990 · GND (DE) 4828986-3 · BNF (FR) cb17001362r (data)
Seguretat informàtica Portal de seguretat informàtica : accediu a les entrades de Wikipedia relacionades amb la seguretat informàtica