Anonim

Jeg hadde lest den høyt, men jeg er redd for at den kan vekke Azathoth.

Har du noen gang lurt på hva det svarte, tvinnede sinnet drømte om styggedom som er Captcha? Har du noen gang stilt spørsmål ved hvilke stygiske dybder som skapte dette fryktelige antispam-tiltaket, og hvorfor det for kjærligheten til alt som er rett og bra, må være så uleselig? Det spørsmålet kom opp for meg her om dagen, faktisk - så jeg bestemte meg for å gjøre litt research.

Vi begynner med en veldig kort historie om teknologien.

Den første bruken av noe som ligner på CAPTCHA var langt tilbake i 1997, da søkeplattformen Alta-Vista søkte et middel for å blokkere automatisk URL-innlevering til motoren deres. Selv om muligheten til å sende inn nettadresser til organisasjonen definitivt hjalp dem med å utvide horisonten og forbedre søket, var det nok av skruppelløse individer som kastet sammen roboter designet for å bare spam serverne sine med URL-en underhanded innsats for å skjule motorens rangering algoritmer i deres favør.

Alta Vists sjefforsker, Andrei Broder, mente han kom med en løsning, ved å utvikle en algoritme som tilfeldig genererte et bilde av trykt tekst - den tidligste forekomsten av CAPTCHA-teknologien. Algoritmen ble perfeksjonert av forskere ved Carnegie Mellon i 2000, som kalte teknologien CAPTCHA, en forkortelse for Completely Automated Public Turing Test for å fortelle Computers and Humans Apart. Ja… akronymer var egentlig ikke deres greie.

Uansett var datamaskiner ikke i stand til å gjenkjenne den, men mennesker var fremdeles perfekt i stand til å lese meldingen og skrive den inn. Teknologien fanget raskt, og i kort rekkefølge, over hele Internett. Et patent ble utstedt til Broder og teamet hans i april 2001.

Det var et ganske dødelig slag i våpenløpet mellom profesjonelle programmerere og spam-agenter for tiden.

Se- og her er grunnen til at moderne CAPTCHAS så ofte er uleselige og nesten umulige å lese - det tok ikke lang tid for spammere å finne ut en måte å omgå teknologien. Mange av dem rett og slett tvangsvei seg forbi svak sikkerhet for å komme inn, men mange av dem jobbet frem enda smartere spambots, som var i stand til karaktergjenkjenning i bildene.

Ingen sa at spammere var dumme - tvert imot, de beste av dem er like smarte som de lyseste fagfolkene.

Nok en gang leverte Carnegie Mellon University, og kom med en ny teknologi kjent som GIMPY CAPTCHA, som nå litt deformerte og forvrengt ordene, ofte gjengi dem mot merkelig bakgrunn. Det fungerte ved å tappe et utvalg tilfeldige ord fra ordboken - brukeren måtte identifisere minst noen få av dem riktig for å bestå testen og komme dit de prøvde å gå.

På dette tidspunktet var datamaskiner faktisk mer dyktige til å gjenkjenne enkeltpersoner enn mennesker.

Nok en gang viste teknologien seg etter hvert som ineffektiv, ettersom applikasjoner ble ganske raskt utviklet som gjorde at datamaskiner kunne "segmentere" bildene i deler, gjenkjenne individuelle tegn og dele dem sammen til ord. Våpenløpet eskalerte nok en gang, og moderne CAPTCHA - den ofte uleselige kløften som vi ser oftest - ble født. Denne formen for CAPTCHA brukte høye nivåer av forvrengning, overfylte karakterene sammen, og generelt gjorde dem ekstremt vanskelige å både lese og segmentere.

Andre former for CAPTCHA

Grafiske CAPTCHAer er ikke den eneste formen for spambeskyttelse som finnes der ute - de er ganske enkelt den vanligste (og mest irriterende). Det er lydtekst (som ofte er forvrengt for å motvirke lydgjenkjenningsprogrammer), tekstspørsmål som datamaskiner ennå ikke er i stand til å forstå (dvs. "Et av disse ordene hører potet til"), og til og med PiCAPTCHAs, som presenterer en bruker med en serie bilder og be dem klikke på dem i en bestemt sekvens.

Selv dessverre er ikke disse formene for CAPTCHA uknuselige, og vi har begynt å se en trend med spammere som bruker andre mennesker for å løse problemene for dem. Noen ganger er de 'digitale sweatshop-arbeidere', tvunget til å sitte kram over en datamaskin som viser løsninger for CAPTCHA-problemer, slik at disse spammere kan legge dem til i databasen.

Imidlertid kan de imidlertid være uvitende dupes, for eksempel de stakkars dårene som uforvarende økte spammersens arsenal fordi de ønsket gratis porno.

Vi har ennå ikke funnet en løsning på denne angrepsmåten - og det kan hende vi aldri finner en.

Uansett, der har du det. En kort historie bak hodepinefremkallende svingete linjer på dataskjermen.

Historien bak captcha