Недавно некоторые пользователи заметили, что среди задач в сервисе reCAPTCHA появились увеличенные фотографии каких-то номеров. На сайте BlackHat World собрана большая коллекция таких фотографий.
На скриншотах видно, что одна половина теста reCAPTCHA осталась прежней, а вторую половину заменили на фотографию с номером. На некоторых фотографиях явно заметно, что это таблички с номерами домов. Очевидно, их берут из снимков, сделанных для сервиса Google StreetView.
Представители компании Google официально подтвердили этот факт. Они сообщили, что эксперимент проводится «для добавления в Google Maps такой полезной информации, как адреса зданий». По результатам эксперимента будет решено, сделать ли распознавание адресов через reCAPTCHA стандартной функцией.
reCAPTCHA — система, разработанная в университете Карнеги-Меллон для защиты от ботов. Она выполняет ту же функцию, что и стандартные тесты CAPTCHA, но при этом несёт дополнительную полезную нагрузку — помогает распознавать тексты, с которыми плохо справляются системы оптического распознавания символов. Тесты reCAPTCHA предполагают, что пользователю предъявляется одно случайно сгенерированное слово (обычная CAPTCHA) и одно слово из оцифрованного документа. Если пользователь успешно справился с первым словом, предполагается, что это не робот, а живой человек, следовательно, он правильно распознал и второе слово. Для надёжности, конечно, второе слово прогоняют ещё через несколько человек. То есть здесь армию людей используют для краудсорсинга.
В сентябре 2009 года система reCAPTCHA была приобретена компанией Google и с тех пор использовалась для распознавания текстов при оцифровке архивов газеты The New York Times и книг, доступных в Google Book Search.