В мае текущего года сенатор США Крис Кунс (Chris Coons) направил письмо руководству компании Amazon, в котором поинтересовался, как именно та хранит разговоры пользователей (аудиофайлы и стенограммы их расшифровок), записанные в ходе общения с такими устройствами, как Echo и Echo Dot, с Alexa на борту.
Официальный ответ компании был опубликован вчера, 3 июля 2019 года, и неприятно удивил многих. Amazon сообщает, что хранит голосовые записи и стенограммы до тех пор, пока пользователь не решит их удалить. «Когда клиент удаляет голосовую запись, мы удаляем расшифровки, связанные с учетной записью пользователя, как по запросу клиента, так и по ответу Alexa», — гласит ответ компании. Однако все не так просто, как кажется на первый взгляд. Фактически Amazon признала, что хранит пользовательские данные, сколько пожелает, если только пользователь прямо не укажет обратное.
Дело в том, что если пользователь не знает, как удалить записи вручную (настроить это можно в настройках, в разделе Alexa Privacy), Amazon продолжит хранить их, а в некоторых случаях расшифровки будут сохранены даже после удаления самой аудиозаписи. Причем пользователь об этом не узнает, а Amazon не уточняет, как долго хранит подобные данные.
Письмо гласит, что даже если аудио было удалено, компания все равно может хранить другие записи взаимодействий клиентов с Alexa, включая записи действий, предпринятых Alexa в ответ на запрос пользователя.
Дело в том, что сама Amazon, а также третьи стороны, которые создают специальные skills для Alexa, ведут постоянный учет взаимодействий пользователей с голосовым помощником. К примеру, пользователь заказывает пиццу, приобретает цифровой контент или вызывает автомобиль. В таких случаях Amazon и сторонним разработчикам «навыков» нужно вести учет происходящего и осуществленных транзакций. Якобы это помогает легко повторить задачу и удобно для пользователей. При этом Amazon не сообщает, какие именно данные содержатся в подобных записях.
Известно, что записанная информация не является анонимной, а расшифровки связаны с учетными записями клиентов. Так, Amazon использует эти стенограммы для обучения как своих сотрудников, систем обработки естественного языка и «обучения» Alexa. Ранее сообщалось, что для этого многие сотрудники компании (некоторые из которых даже не работают в Amazon напрямую) имеют доступ к головным записям и их расшифровкам, и слушают до 1000 аудиоклипов в день. В частности, именно эта информация и заинтересовала сенатора Кунса, побудив его направить компании письмо с рядом вопросов.
Также в ответе компании сообщается, что на серверах Amazon оседают и другие типы запросов к Alexa, к примеру, связанные с установкой будильника, напоминаниями или событиями календаря. «Наши клиенты не хотят и не ожидают, что удаление аудиозаписи повлечет за собой удаление базовых данных и помешает Alexa выполнить поставленную задачу», — аргументируют разработчики.
«Ответ Amazon не исключает того, что стенограммы голосового взаимодействия пользователей с Alexa не удаляются со всех серверов компании Amazon даже после того, как пользователь удалил запись своего голоса. Более того, остается неясным, в какой степени эти данные передаются третьим сторонам, и как эти третьи стороны используют и контролируют эту информацию», — резюмирует сенатор Кунс.