Группа ученых из Университета Стоуни-Брук, Массачусетского университета, Калифорнийского университета в Беркли, а также Университета Торонто в Канаде попыталась определить масштабы китайской интернет-цензуры изучить работу «великого китайского файрвола».
Исследование длилось более девяти месяцев, и специально для него эксперты создали систему под названием GFWatch, которая обращалась к доменам внутри и за пределами китайского интернет-пространства, а затем проверяла, как "великий китайский файрвол" реагирует на это и вмешивается в соединения на уровне DNS (для предотвращения доступа к домену со стороны китайских пользователей или ограничения доступа к внутренним сайтам страны).
С помощью GFWatch исследователи проверили 534 млн различных доменов, ежедневно обращаясь к примерно 411 млн доменов, чтобы фиксировать, а затем перепроверять, постоянны ли обнаруженные ими блокировки. В итоге было подсчитано, что в настоящее время «великий китайский файрвол» блокирует около 311 000 доменов, причем 270 000 блокировок работают как нужно, а еще 41 000 доменов, похоже, оказались заблокированы случайно.
Ошибки возникли в силу того, что китайские власти пытались блокировать домены, используя регулярные выражения для фильтрации DNS, но они не учитывали ситуации, когда короткий домен является частью более длинного доменного имени, и блокировки затронули другие сайты. Например, власти страны запретили доступ к reddit.com, при этом случайно заблокировав booksreddit.com, geareddit.com и 1087 других сайтов.
Исследовательская группа составила список 311 000 заблокированных доменов, чтобы определить, какой тип контента китайские власти запрещают чаще всего. Используя сервисы, подобные FortiGuard, исследователи выяснили, что около 40% заблокированных сайтов — это недавно зарегистрированные домены, которые китайские власти блокируют превентивно, пока те не категоризировали и не внесли свой контент в белый список.
Что касается прочих «запрещенных» доменов, чаще всего на них размещается бизнес-контент, порнография, или информация, связанная с ИТ. Также под блокировки попадают сайты, на которых размещены инструменты, позволяющие обойти блокировки, игорные ресурсы, личные блоги, развлекательные порталы, новостные и медиасайты, а также домены с вредоносным и мошенническим контентом.
Также интересно, что после начала пандемии коронавируса, к блокировкам добавилось много доменов, связанных с COVID-19. В числе «закрытых» доменов были: covid19classaction.it, covid19song.info, covidcon.org, ccpcoronavirus.com, covidhaber.net и covid-19truth.info. Некоторые из этих сайтов содержат материалы, обвиняющие в пандемии коронавируса Китай.
«Мы выяснили, что большинство доменов, заблокированных “великим китайским файрволом”, непопулярны и вообще не попадают в списки самых популярных сайтов», — рассказывают исследователи.
К примеру, из выборки в 138 700 доменов только 1,3% сайтов (около 1800) входят в число 100 000 самых популярных сайтов в интернете (по данным рейтинга Tranco).
Кроме того, исследователи заявили, что выявили случаи, когда китайские DNS-блокировки, которые обычно подразумевают изменение записей DNS, возвращаемых китайским пользователям, случайно «портили» записи DNS за пределами китайского интернет-пространства, в сетях некоторых DNS-провайдеров. Такие ошибки затронули не менее 77 000 сайтов.