Google составляет самую большую базу знаний в человеческой истории, причём делает это совершенно без человеческого участия, пишет New Scientist.
Для базы Knowledge Vault осуществляется автоматическое сканирование всего интернета и извлечение фактов о мире, людях и объектах. Эта информация нужна для лучшего понимания смысла человеческой речи, а конкретно — для понимания вопросов, которые задают пользователи на натуральном языке, и адекватного ответа на них.
В отличие от обычного поискового индекса, в базе Knowledge Vault хранятся конкретные факты. Эта база является естественным расширением базы Knowledge Graph, которую пополняли люди. Но тот проект застопорился на определённом этапе, так что компания Google решила автоматизировать процесс и запустить ботов.
На данный момент Knowledge Vault содержит 1,6 млрд фактов, из них 271 млн — «подтверждённые факты», правдивость которых оценивается более чем в 90%. Оценка правдивости рассчитывается путём перекрёстной проверки из нескольких источников. Пока что Knowledge Vault не доросла до размеров Knowledge Graph, но это вопрос времени, поскольку она увеличивается с каждым днём.
Эксперты говорят, что аналогичную работу по составлению базы знаний ведут и другие крупные компании, в том числе Microsoft, Facebook, Amazon и IBM. Это крайне важная технология, которая необходима для ряда ключевых приложений будущего. Одно из них — персональные цифровые ассистенты (продвинутые наследники Siri). Эти программы с зачатками искусственного интеллекта смогут автоматически обрабатывать бóльшую часть почтовой корреспонденции, выделять самые важные письма, бронировать билеты на самолёт и номера в гостинице, следить за здоровьем хозяина и определять болезни по симптомам (как это делает суперкомпьютер IBM Watson).
Возможно, для пополнения базы знаний Google сканирует не только публичные данные, но и информацию из Gmail, Google+ и Youtube. Вполне вероятно, что Knowledge Vault содержит факты не только о знаменитых людях, но и о рядовых гражданах. Эта информация тоже может пригодиться.
Кроме того, Knowledge Vault имеет огромную научную ценность для историков, социологов и других исследователей, которые получат новый инструмент для изучения человеческой цивилизации. Некоторые эксперты высказывают мнение, что анализ развития цивилизации с помощью Knowledge Vault позволит даже предсказывать будущее.
Доклад о Knowledge Vault прочитает сотрудник компании Google Кевин Мёрфи (Kevin Murphy) 25 августа на конференции в Нью-Йорке (Conference on Knowledge Discovery and Data Mining).