По заказу DARPA военный подрядчик Raytheon BBN создал компьютерную систему, которая автоматически составляет досье на граждан и организации, собирая информацию из открытых источников. Фактически, эта программа делает то же самое, что и армия редакторов Википедии — изучает средства информации, извлекает из них новые факты и дописывает их в энциклопедическую статью со ссылкой на источник информации. Только всё делается автоматически.
Прототип уже работает на сервере Raytheon BBN, он собирает информацию с 40 источников на английском, китайском и арабском языках. Представители разведывательных служб уже начали тестирование. Сдача окончательной версии системы должна состояться до конца текущего года: в итоге она будет автоматически обрабатывать сотни новостных сайтов на всех основных языках мира, а в идеале — даже распознавать текст из телевизионного эфира, так что к ней можно подключить и телевидение.
Скриншот одной из страниц проекта, разработанного Raytheon BBN
Заказчики из Пентагона надеются, что новая программа станет основой для универсальной разведывательной системы, которая поможет быстро получить первичную информацию по людям и организациям. При этом очевидно, что компьютер не может отделять важное от второстепенного, не распознаёт шутки или очевидную ложь, не способен выделять ключевые факты, а иногда такая система будет выдавать абсолютный бред. Так что подобные разработки ещё нескоро выйдут на «человеческий» уровень качества.
Естественно, в открытых источниках информации содержится только базовая информация об объектах слежения, секретные сведения туда попадают крайне редко. Так что эта программа может играть лишь вспомогательную роль для разведывательных служб. Но, как и Википедия, она идеально выполняет функцию «поверхностного осведомителя». Система умеет также находить связи между объектами и расставлять перекрёстные ссылки на вики-страницах.
Кроме Raytheon BBN, аналогичные системы извлечения знаний разрабатывают компании SRI International и IBM.