Корпорация IBM объявила, что приспособит самообучающийся суперкомпьютер Watson, способный работать с информацией на естественном языке, для использования в сфере информационной безопасности. Обучение машины уже началось.
В данном случае слово «обучение» использовано в самом прямом смысле. Речь не идёт о программировании. Чтобы освоить незнакомую область знаний, Watson придётся много читать. Специалисты IBM и исследователи из восьми американских университетов планируют скормить самообучающейся системе содержимое библиотеки X-Force, которая содержит материалы, охватывающие два десятилетия исследований в сфере информационной безопасности, подробную информация о восьми миллионах спамерских и фишинговых атак и описания ста с лишним тысяч уязвимостей.
На первых порах документы для Watson будут подбирать и размечать вручную, но затем машина станет справляться с этой задачей без помощи людей. На это в IBM и рассчитывают. Предполагается, что после завершения обучения Watson будет оперативно собирать и сопоставлять общедоступные сведения о новых угрозах, в том числе информационные бюллетени, статьи, отчёты компаний, видео, даже публикации в блогах. Он будет в курсе всего, что происходит, и за счёт этого сможет самостоятельно опознавать проблемы и предлагать рекомендации по их решению.
В IBM исходят из предположения, что поток информации об угрозах если ещё не превысил человеческие возможности, то непременно это сделает. Национальная база данных по уязвимостям уже сейчас содержит более 75 тысяч записей и быстро растёт. Каждый год публикуется порядка десяти тысяч исследовательских работ, так или иначе связанных с информационной безопасностью, и более 60 тысяч постов в блогах по той же теме. Watson способен переварить их все. Люди — нет.
Умение Watson работать с неструктурированной информацией и сведениями, изложенными на естественном языке, будет сочетаться с более традиционными методами анализа больших данных. Система будет замечать аномалии, указывающие на атаки, выявлять скрытые закономерности и прослеживать связи между различными документами. Кроме того, в Watson встроены мощные средства визуализации. Специалистам по информационной безопасности они тоже не помешают.