Разработчик по имени Колин Кейгер (Colin Keigher) давно интересовался сбором чужой персональной информации из окружающего шума, по примеру известного твиттер-аккаунта @NeedADebitCard, который публикует ретвиты чужих платёжных карт, или веб-сервиса WeKnowWhatYoureDoing.com с разной компрометирующей информацией на случайных пользователей Facebook.
Ещё в январе Колин запустил бота @PhoneNumberTwit, который искал в твиттере номера телефонов и ретвитил их, сообщая владельцу о находке. Этот аккаунт был заблокирован через 36 часов после начала работы.
Автор не сдался, и решил проделать всю работу в офлайне. Он написал скрипт Avivore — дата-майнер по твиттеру с открытым исходным кодом. Программа ищет в Twitter три вида информации: телефоны, пинкоды Blackberry и IPv4-адреса. Вся информация заносится в базу данных SQLite, а результат работы может также дублироваться в консоль.
$ python avivore.py Avivore 1.0 A Twitter-based tool for finding personal data. │ Licensed under the LGPL and created by Colin Keigher http://github.com/ColinKeigher [1364844946] Using existing database to store results. [1364844946] 12447 entries in this database so far. [1364844956] Type: bbpin, User: SocialGamerMax, PIN: 261D288C, TweetID: 318808517685440513 [1364844957] Type: bbpin, User: AsgharBhatti3, PIN: 21D91A46,TweetID: 318808291490791424 [1364844957] Type: bbpin, User: MIDOO_889, PIN: 26CFA12B, TweetID: 318807746273214464 [1364844957] Type: bbpin, User: Tsa7el, PIN: 25ba2a8f, TweetID: 318806708887629824
Эти 12,4 тыс. записей были собраны всего лишь за 24 часа, так что Twitter — это действительно неисчерпаемый кладезь персональной информации.
Скрипт протестирован под Ubuntu, но должен работать и под другими платформами, где запускается Python, в том числе OS X и Windows.
Свою разработку хакер презентовал на конференции BSides Vancouver в марте.