CAPTCHA w słusznym celu ?

Co to CAPTCHA ? Gdyby tak próbować dokładnie rozłożyć na części pierwsze to “Completely Automated Public Turing Test to Tell Computers & Humans Apart”, czyli test dzięki któremu możemy oddzielić ludzi od komputerów, głównie stosowany w formularzach w serwisach WWW jako obrazek przedstawiający liczby i/lub litery, które zazwyczaj są proste do odczytania przez człowieka ( to różnie bywa przy moim -1,75 ) jednak nie możliwy jest do odczytania przez komputerowe OCRy ( choć to także tylko założenie ) poprzez używanie niskiego kontrastu, zbliżonych kolorów, nieregularnych odstępów i przesunięć do 180st włącznie. Technika ta ma głównie chronić serwisy, portale, fora przed spamem, zakładaniem kont przez boty ( zazwyczaj dodatkowo hurtowo ). Całość jest dosyć kontrowersyjna, nie jest w 100% skuteczna ( prawie każda CAPTCHA wcześniej czy później zostaje złamana ) oraz jest utrudnieniem dla użytkowników. Ale ja nie o tym.

Każdy zapewne wiele razy w tygodniu musi w czasie rejestracji lub logowania do jakiegoś serwisu Internetowego odgadnąć tajemnicze powyginane hasła i musi spędzić nad tym co najmniej parę sekund. Gdyby tak ten czas wszystkich osób, które muszą odgadywać co autor miał na myśli połączyć razem i zamiast wpisywać bezsensowne klucze zrobić coś dla ludzkości ? Do takiego wniosku też doszedł doktorant Carnegie Mellon University Luis von Ahn. Obliczył on, że w czasie jednego dnia ludzie spędzają w sumie 150,000 godzin na odgadywanie kluczy, można przecież by to wykorzystać w innym celu i tak powstał projekt reCAPTCHA. Ma on służyć jako narzędzie do digitalizacji materiałów, które aktualnie są dostępne wyłącznie w wersji papierowej ( głównie powstałe przed 1900 ) a oprogramowanie OCR nie jest w stanie sobie z nim poradzić. Aktualnie projekt pomaga zdigitalizować książki dla Internet Archive oraz starszych edycji New York Times. reCAPTCHA nadal dostarcza podstawowe zabezpieczenia CAPTCHA jednak z tą różnicą, że formularz zabezpieczony metodą reCAPTCHA wymaga wprowadzenia dwóch słów. Pierwsze to zabezpieczenie formularza, drugie zaś nie zostało rozpoznane przez oprogramowanie OCR podczas digitalizacji tekstu. Jeżeli użytkownik rozpozna poprawnie pierwsze słowo, które system już zna, uznaje on automatycznie także, że drugie słowo zostało wpisane poprawnie. I tak przy okazji, nigdy nie wiesz, które słowo jest zabezpieczeniem formularza a które skanem. Jednakże to nie koniec weryfikacji, gdyż mogłoby być obarczone zbyt dużym błędem. Następnie to samo słowo jest przesyłane do rozszyfrowania wielu innym niezależnych użytkownikom jeżeli oni w ten sam sposób rozszyfrują słowo zostanie ono wykorzystane w zapisie cyfrowym dokumentu go zawierającego.

Wynik ? 750 milionów osób, które już skorzystało z reCAPTCHA tworząc jeden z największych projektów na świecie. Co ciekawe, znakomita większość osób biorących w nim udział nie jest nawet tego świadoma. Dlaczego ? Ponieważ jest są im podawane pary słów w czasie logowania do ich ulubionego serwisu, które mechanicznie deszyfrują nie wiedząc nawet że w ten sposób pomagają w tworzeniu cyfrowych kopii papierowych odpowiedników sprzed wielu lat.

Do czego zmierzam ? Tworzysz bloga ? Startujesz z nowym serwisem społecznościowym ? Boty uprzykrzają Ci życie każdego dnia. Zamiast korzystać z wyrafinowanych algorytmów matematycznych, zwykłych CAPTCHA, skorzystaj z reCAPTCHA, to nie boli. Na stronie projektu możesz znaleźć opisy jak wdrożyć system do własnego projektu na przykładzie wielu języków, wykorzystać jeden z wielu przykładów lub po prostu posłużyć się gotowymi wtyczkami dla powszechnie używanych systemów takich jak Joomla, Drupal czy WordPress. A gdyby tego jeszcze mało mamy jeszcze wiki oraz forum.