Роскомнадзор начнет вести реестр запрещенной информации с помощью ИИ
Роскомнадзор с этого года начнет вести реестр запрещенной информации с помощью технологий ИИ, узнал «Коммерсантъ». Это позволит сократить издержки и устанавливать «неочевидные связи», считают эксперты. По информации газеты, технология будет работать на базе системы, через которую уже анализируются и классифицируются тексты в интернете. В ведомстве ожидают, что время, необходимое для обнаружения незаконного контента, сократится с трех до двух часов уже в этом году
Роскомнадзор начнет формировать и вести реестр заблокированных сайтов с помощью технологий искусственного интеллекта, нововведение запланировано на 2024 год. Об этом сообщил «Коммерсантъ» со ссылкой на новую версию паспорта программы цифровой трансформации Роскомнадзора. В ведомстве не ответили на запрос издания.
Газета пишет, что о планах ведомства говорится в описании работ, касающихся единой информационной системы Роскомнадзора (ЕИС, также объединяет реестры лицензий, СМИ, разрешений) и информационной системы мониторинга интернет-ресурсов (ИС МИР), которая предназначена для отслеживания текстов с запрещенной информацией, их классификации по характеру (нейтральное, негативное или позитивное мнение автора) и поиска перепечаток.
Согласно тексту документа, в прошлом году Роскомнадзору требовалось три часа, чтобы выявить незаконный контент в интернете с момента публикации. В этом году время планируется сократить до двух часов, а к концу 2026 года — до одного. Согласно информации в паспорте программы цифровой трансформации Роскомнадзора, в прошлом году ведомство вело реестр запрещенных сайтов без применения ИИ. Помимо этого, ведомство планирует повысить эффективность работы: в частности, снизить показатель ошибочно выявленных признаков нарушений в СМИ с 20% в 2023 году до 10% в 2026 году, пишет «Коммерсантъ».
По словам менеджера продуктов Innostage Евгения Суркова, использование ИИ позволит сократить объем человеческих ресурсов для обслуживания систем. Помимо этого, применение таких технологий даст возможность выявлять сложные контекстуальные связи между текстовыми фрагментами, скрытые закономерности и ассоциации», считает менеджер продукта Just AI Алексей Борщов.
Через два года Роскомнадзор также рассчитывает использовать ИИ для ведения реестра операторов персональных данных, следует из информации в паспорте программы цифровой трансформации Роскомнадзора. Но эту задачу автоматизировать будет сложнее, считают опрошенные газетой эксперты. В частности, гендиректор разработчика систем анализа данных «Социальная лаборатория» Наталия Тылевич обратила внимание на то, что чтение юридических документов, даже если они опубликованы в виде, удобном для автоматического извлечения, «требует глубокого семантического анализа». По словам аналитика профильного Telegram-канала abloud62 Алексея Бойко, «есть риск, что на первых порах такой ИИ станет выдавать ложные обнаружения».
В январе Роскомнадзор сообщил, что по итогам 2023 года заблокировал или удалил более 670 000 запрещенных материалов, что на 1% больше, чем годом ранее. Также ограничил доступ к 558 000 интернет-страницам и сайтам по требованию Генпрокуратуры или по решению суда. Больше всего заблокированных материалов было связано с пронаркотическим контентом: ведомство заблокировало 134 700 таких материалов (против 94 300 в 2022 году). Также оно заблокировало 113 000 материалов об азартных играх, 84 700 — за детскую порнографию, 73 500 — с фейками о российской армии, 36 600 — о способах самоубийства, 28 400 материалов, посвященных вовлечению несовершеннолетних в совершение противоправных действий, а также 19 300 — по статье о пропаганде ЛГБТ («международное общественное движение ЛГБТ» признано в России экстремистским и запрещено; включено Росфинмониторингом в перечень организаций, причастных к терроризму и экстремизму).