Вступление

Однажды мне позвонил знакомый и предложил небольшую работенку. Он занимается массовой рассылкой сообщений по мылу и icq, в народе таких людей называют спамерами. Я вообще-то плохо отношусь к спамерам, но написать программу за некоторое количество титульных знаков WMZ было очень интересно и выгодно. Тем более я люблю заниматься разработкой всяких пауков в инете. После того как я сказал, что возьмусь за это дело, он скинул мне ТЗ на программу. Не буду вдаваться в подробности, скажу что нужно было собрать базу мыл коммерческих организаций, а именно с сайтов yellowpages.ru или с naitiprosto.ru на выбор.

Исследуем сайты

Первом делом я решил заглянуть на сайт yellowpages.ru. Первое впечатление было положительное, но оказалось, что все мыла там в виде
картинок:

Честно говоря, распознавание картинки делать не очень хотелось, хотя для этого случая было бы не очень-то и сложно сделать, поэтому я и решил посетить второй предложенный сайт.

Посетив сайт naitiprosto.ru, я очень обрадовался. Напротив каждой фирмы стояла строка e-mail, при наведении мышкой на эту строку в статусной строке браузера показывался e-mail. Сходив в магазин за газировкой, и предвкушая, что работа на 80% уже сделана, т.к. заготовки многопоточного грабера у меня уже были набросаны, я сохранил содержимое страницы на винт.
Не тут то было. Код страницы был напичкан
javascript-ами, а сами e-mail были какими-то странными.

Немного подумав я вспомнил, что при наведении мышкой в браузере в статусной строке отображается нормальное мыло. Значит в коде страницы есть функция расшифровки.
Поковыряв страницу я обнаружил функцию дешифровки мыла в файле: napro34v9a.js.
Вот эта смешная функция (особенно понравился комментарий): 

Поскольку я программирую в Delphi, я быстренько переписал эту функцию на свой любимый язык программирования. Вот как она выглядит в
Delphi: 

Заключение

Через пару дней программа была готова. Осталось только составить список страниц, с которых вытаскивать мыла. К счастью все страницы имели следующий вид:

http://www.naitiprosto.ru/cgi-bin/step23.exe?what=XX&where=YY&Adver=30&User=AC

Опытным путем выяснилось, что XX число от 98 до 1217, а YY число от 10001 до 10109.
Сгенерированный файл с всевозможными страницами занял аж 9! Мегабайт.
Стоит ли говорить, что после завершения работы программы, я и мой друг остались довольны. 

Поскольку прошло уже более полугода (а naitiprosto.ru совершенно не
изменил алгоритм), друг мне разрешил выложить эту программу в общий доступ, так что качайте на здоровье. Но помните
— traffic warning :), программа потребляет немерянное количество
трафика:

http://www.topprst.info/dwn/emex.zip

 

Оставить мнение

Check Also

Антиотладка. Теория и практика защиты приложений от дебага

К методам детектирования отладки прибегают многие программисты: одни хотели бы уберечь сво…