В подтверждении тезиса о том, что оставленная в интернете информация остается
в нем навсегда, студент Амстердамского Университета с нелегким именем Matthijs
R. Koot составил огромную базу данных интернет-пользователей. Его справочник
включает имена, почтовые адреса, а также биографию 35 миллионов самых разных
людей. Много, - скажешь ты? Нет, - ответит Matthijs R. Koot, - не много. Свою
базу он собрал за один месяц.
Наградой трудолюбивому нидерландцу стал бесценный экзистенциальный опыт.
Пытливому юноше было интересно узнать как легко собираются данные в интернете,
каких трудов стоит какому-нибудь частному детективу насобирать персональной
информации, к примеру, на
Google Profiles, в объеме, достаточном для вознаграждения трудов. Ответ
перед нами: проще простого! Сами Google Profiles открыты для всех и
совершенно не против индексации информации, в отличие, например, от Facebook,
чья политика запрещает вышеупомянутое под страхом смерти через отрубание головы.
Успех предприятия мистера Кута в том, что инженеры Гугла не отказывают в
доступе к информации, фактически все записи о клиентах собраны в одном файле,
названном profiles-sitemap.xml. Сам код голландского студента, используемый для
сбора данных, находится
здесь.
"Как все это началось? Мне было скучно и я написал небольшой скриптик чтобы
скачать все файлы типа sitemap-NNN(N).txt - сначала скачал 10 000, потом 100
000, пока не добрался до 1 000 000. Я был удивлен не встретив никакого
сопротивления или CAPTCHA. Воодушевленный, я выпил зеленого чаю и скачал
остальные 34 000 000".
В своем блоге на Blogger простой парень из Амстердама написал, что его
действия служат высокой исследовательской цели и попросил не искать в них
подводных камней.
"Я очень любопытный, - делится Koot, - а сейчас мне любопытнее всего,
например, что может остановить другого любопытного человека от скачивания целых
архивов пользовательских данных. Интересно посмотреть как отреагирует Google:
предпримут ли действия для защиты персональной информации своих пользователей
или продолжат делать вид, что это не важно".
Google выступил с официальным заявлением: "Буду краток: общедоступная
пользовательская информация легко находится нажатием кнопки поиска. Для
получения доступа к ней не нужно быть и трех пядей во лбу. Информация,
полученная таким образом, не нарушает ничьих прав. Ну вы знаете, - подмигнул
сотрудник, - публичная информация такая публичная…".
А между тем, Google – не единственные безалаберные стражи пользовательских
данных, у которых дудочники вроде Р. Кута уводят клиентов из-под самого носа. В
июне, например, независимый (имя им – легион) исследователь скомпилировал в один
файл имена и URL 100 000 000 пользователей Фэйсбука и разместил для свободного
скачивания. Все загрузившие релиз независимого исследователя получили доступ к
этим самым страницам безотносительно того, закрыли свои профили пользователи или
нет.
Аналогично Гуглу, Фэйсбук позволяет настроить профиль таким образом, чтобы
страница не индексировалась, но – увы – для жертв независимого исследователя
по-прежнему нет хороших новостей.
"Всю базу я загрузил с одного IP. Хочу, чтобы впредь люди думали, прежде чем
постить что-нибудь на Гугл, Твиттере, Фэйсбуке или других Web 2.0 сервисах: не
будете осторожными - окажетесь в ежовых рукавицах".