СМИ сообщают, что Роскомнадзор нашел разработчика для системы поиска противоправного контента «Окулус». На это выделят 57,7 млн рублей, и система на основе нейросетей будет в реальном времени анализировать фото, видео и тексты на сайтах, в соцсетях и мессенджерах на предмет запрещенной информации, в том числе пропаганды гомосексуализма, изготовления наркотиков и оружия. Ожидается, что «Окулус» должен появиться уже к декабрю.
Издание «Коммерсант», со ссылкой на результаты тендера на сайте госзакупок, пишет, что разработкой системы «Окулус» займется ООО «Эксикьюшн Эр Ди Си». Компания получит на реализацию проекта 57,7 млн рублей, а сделать систему нужно уже к 12 декабря текущего года.
По словам журналистов, эксперты выражают сомнение в том, что выделенной суммы хватит на разработку, а исполнитель сможет уложиться в срок. Так, только для обучающих дата-сетов для нейросети нужно гораздо больше времени.
По условиям тендера подрядчик обязан не только создать систему, но и предоставить «Главному радиочастотному центру» (ФГУП ГРЧЦ, структура Роскомнадзора) дата-сеты, которые позволят определять запрещенную информацию. Исполнитель также поставит ГРЧЦ размеченные наборы данных для обучения модели распознавания лиц «в объеме не менее 100», так как в «Окулус» должен быть реализован «функционал каталогов определяемой символики, сцен и действий, персоналий». Отдельно подчеркивается, что система должна обнаруживать запрещенный контент не только в текстовом виде, но и в «сценах, сочетаниях предметов, композициях образов, лицах, статике и динамике движений».
Мощность системы должна составлять 200 000 изображений в сутки, а значит, что каждую секунду «Окулус» должен анализировать два кадра или картинки.
По словам директора по цифровым технологиям ГРЧЦ Константина Буланова, для стабильной работы системы понадобится не менее 48 серверов, оснащенных графическими ускорителями, а поиск запрещенного контента будет осуществляться благодаря нейронным сетям, работающим на основе глубокого машинного обучения.
При этом Буланов пояснил РБК, что «Окулус» не ищет и не собирает информацию в интернете самостоятельно:
«Для мониторинга предназначены другие информационные системы, которые уже работают в составе Единого модуля анализа (ЕМА). АС “Окулус” также интегрируют в ЕМА. Данные из мониторинговых систем будут загружаться в “Окулус” автоматически. Новая система даст оценку того, есть ли в материале признаки запрещенной законом информации. Далее (при выявлении таких признаков) автоматический отчет направится операторам для экспертного подтверждения и принятия дальнейших решений».
В неназванной крупной IT-компании, знакомой с содержанием технического задания проекта, журналистам «Коммерсанта» сообщили, что на деле реализовать такую систему практически невозможно, не только в столь короткий срок и за 57 млн рублей, но в принципе:
«Исполнителю ставят не конкретные цели, задачи и требования, которые можно выполнить при доработке уже существующей и работающей системы, а просят спроектировать принципиально новое решение, что невозможно сделать в обозначенный срок».
В то же время глава Smart Engines Владимир Арлазаров полагает, что «на текущем уровне развития IT» заявленные задачи можно решать с качеством порядка 90%, но тоже выражает удивление поставленными сроками. По его словам, «только сбор репрезентативных обучающих дата-сетов может занять гораздо больше времени».