Когда закончится военный конфликт в Сирии? Начнется ли война на Корейском полуострове? Даже лучшие умы не могут ответить на эти вопросы, но создаются компьютерные алгоритмы, которые способны помочь военным аналитикам в обработке больших массивов информации. И самое главное — создается база данных, которая вмещает в себя все факты, могущие иметь отношение к развитию конфликтов.
Журнал New Scientist пишет о создании базы данных GDELT (Global Data on Events, Location and Tone), которая уже содержит почти 250 миллионов событий, начиная с 1979 года, и ежедневно пополняется на 100 000 новых. Программа сканирует ленты информационных агентств Associated Press, Agence France Presse (Франция), Xinhua (главное информационное агентство Китая) и многие другие. Вместе они покрывают новости всех стран.
Программное обеспечение способно автоматически анализировать текст каждой информационной заметки и извлекать из него фактуру, распознавая значимые объекты. Например, если в тексте содержится фраза «Суданские студенты и полиция вступили в противостояние в египетской столице», то сообщение кодируется как “SUDEDU fought COP”. Затем система ищет упоминание города или местности в тексте (Каир) и добавляет в базу данных его координаты. За счет такого кодирования система устраняет дублирование информации, когда одна и та же новость проходит через множество информационных агентств.
События в Сирии, отфильтрованные по наличию насилия, наглядно показывают, как разгорался конфликт в 2011-2012 гг
Создатели базы данных Калев Литару из Иллинойского университета в Урбане-Шампейне и Пол Шродт из Государственного университета Пенсильвании говорят, что впервые в истории создали базу данных подобного масштаба. Теперь они собираются расширить выборку вплоть до 1800 года.