Роскомнадзор выделил 57,7 млн рублей на систему поиска противоправного контента
Структура Роскомнадзора выделила 57,7 млн рублей на разработку системы поиска противоправного контента «Окулус». Система на основе нейросетей будет анализировать фото, видео и тексты на сайтах, в соцсетях и мессенджерах на предмет запрещенной информации, в том числе пропаганды гомосексуализма, изготовления наркотиков и оружия
Компания «Эксикьюшн Эр Ди Си» (Execution RDS) получит от «Главного радиочастотного центра» (ФГУП ГРЧЦ, структура Роскомнадзора) 57,7 млн рублей на разработку системы поиска запрещенной информации «Окулус». Сделать систему нужно к 12 декабря, пишет «Коммерсантъ» со ссылкой на материалы сайта госзакупок. Эксперты предупредили о невозможности разработки за такой короткий срок.
По технической документации, «Окулус» сможет в реальном времени анализировать изображения и видео, переписки в чатах и материалы каналов мессенджеров, URL-адреса и другие данные на предмет противоправного контента. Система должна уметь находить такой контент как в текстовом виде, так и в «сценах, сочетаниях предметов, композициях образов, лицах, статике и динамике движений». По условиям тендера подрядчик обязуется создать систему и предоставить ГРЧЦ дата-сеты, которые позволят определять запрещенную информацию.
Исполнитель поставит ГРЧЦ размеченные наборы данных для обучения модели распознавания лиц «в объеме не менее 100». Предполагается, что в «Окулус» должен быть реализован «функционал каталогов определяемой символики, сцен и действий, персоналий». Мощность системы должна составить 200 000 изображений в сутки, то есть в секунду «Окулус» будет анализировать два кадра или картинки.
По данным «СПАРК-Интерфакс», Execution RDS учреждено в 2014 году с уставным капиталом 10 000 рублей. По итогам 2021 года компания получила 229 млн рублей выручки, чистая прибыли составила 23 млн рублей. Возглавляет компанию Анастасия Юрикова, 95% принадлежит Артему Пономореву, а 5% — Сергею Браилко. По данным «СПАРК-Интерфакс», компания ранее не была исполнителем по госконтрактам. Execution RDS реализовывала проекты по внедрению в российских компаниях решений на базе софта немецкой SAP, сообщается на сайте компании.
По оценке директора по цифровым технологиям ГРЧЦ Константина Буланова, для стабильной работы системы понадобится не менее 48 серверов. Они должны быть оснащены графическими ускорителями, а поиск запрещенного контента вести благодаря нейронным сетям, работающим на основе глубокого машинного обучения. В приложениях к технической документации содержится перечень материалов, которые будет искать система:
- материалы с признаками экстремизма и терроризма,
- призывы к массовым незаконным мероприятиям,
- выражение явного неуважение к обществу, государству и официальным символам России,
- информация о способах совершения суицида и методах изготовления наркотиков,
- пропаганда нетрадиционных сексуальных отношений и демонстрация употребления табачной продукции.
По словам собеседника газеты в крупной IT-компании, знакомого с содержанием технического задания проекта, реализовать такую систему в принципе практически невозможно. По его оценке, исполнителя «просят спроектировать принципиально новое решение, что невозможно сделать в обозначенный срок». Гендиректор Smart Engines Владимир Арлазаров отметил, что «на текущем уровне развития IT» заявленные задачи можно решать с качеством порядка 90%, то есть с 10% ошибок.
По словам Арлазарова, только сбор репрезентативных обучающих дата-сетов может занять гораздо больше времени, чем оговорено технической документацией. Современные модели искусственного интеллекта, классифицирующие поведение человека в видеоряде, обычно обучаются на данных объемом около 1 млн роликов, рассказал эксперт.