К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего браузера.

В приватном режиме: как обеспечить сохранность личных данных, используя нейросети

Фото Getty Images
Фото Getty Images
Отсутствие приватности данных при использовании нейронных сетей — одна из ключевых проблематик на 2024 год, в первую очередь для финансового сектора, государственных информационных систем и медицинских организаций. Поэтому в ближайшее время будут активно развиваться методы обезличивания персональных данных для нейронных сетей как механизмы обеспечения приватности пользователей. Заместитель руководителя лаборатории криптографии по научной работе в компании «Криптонит» Иван Чижов рассуждает о важных задачах, которые стоят перед компаниями — разработчиками информационных систем, обрабатывающих персональные данные

Задача 1: Обучение нейросетей на обезличенном массиве данных

Большинство информационных систем, которыми мы пользуемся, собирают статистику. Например, если это интернет-магазин, платформа собирает информацию, что и когда мы покупаем, сколько денег мы в среднем тратим и так далее. Потом нейронная сеть обучается на этих данных, и создается модель. Но проблема в том, что это — данные реальных пользователей, наши с вами. Зачастую такой набор информации позволяет идентифицировать конкретного человека. Поэтому одна из первых задач — обеспечить обучение нейросетей на зашифрованных данных.

Задача 2: Обеспечение анонимизации данных, поступающих в нейросеть

Представьте, что вы хотите обработать фотографию с помощью нейросети. Вы открываете приложение, загружаете свое фото и просите сервис выполнить задачу. Здесь возникает еще одна проблема: посылая запрос в систему, мы используем свои личные данные — фотографию. Но это безобидный пример. Теперь представьте, что это сервис для получения информации о состоянии вашего здоровья. Чтобы получить диагноз, вы посылаете свои анализы, снимки — некую чувствительную медицинскую информацию, которой вы бы не хотели делиться. Но как этими данными распорядится сервис? Не произойдет ли утечки информации при работе с нейросетью? Вторая и не менее важная задача — обеспечить анонимность или обезличивание данных пользователей при построении модели нейронной сети.

Telegram-канал Forbes.Russia
Канал о бизнесе, финансах, экономике и стиле жизни
Подписаться

Задача 3: Обучение модели на данных нескольких компаний

Модель нейронной сети строится на основе огромного количества данных. Чем больше разной информации об объекте изучения, тем точнее будет работать нейронная сеть. Если объединить данные, например, нескольких банков, мы бы смогли получить более усовершенствованную модель. Как же собрать данные из разных компаний, чтобы каждый обучил модель нейронной сети для своих задач? Очевидно, что каждая компания будет охранять данные, которые собрала, потому что это ее доход. Третья задача — получить синергетический эффект от обучения модели на данных сразу от нескольких компаний, обеспечив приватность данных одной компании по отношению к другой.

 

Варианты решения

Каждая из этих задач может решаться различными методами.

Для решения первых двух задач можно использовать криптографические механизмы гомоморфного шифрования, которые появились сравнительно недавно. Они позволяют обрабатывать зашифрованные данные и результат (модель нейросети) тоже получать зашифрованный. Таким образом, реальные данные пользователей будут защищены уже на этапе обучения модели. В открытом виде нигде и ни у кого, кроме как на вашем устройстве, эти данные не появятся. Однако этот подход достаточно сложно реализовать. Схемы гомоморфного шифрования только развиваются и имеют серьезные ограничения, которые снижают полезность нейронной сети.

 

Также можно использовать метод обезличивания персональных данных. Но и здесь есть свои тонкости. Совокупная информация о пользователях (пол, стоимость покупки, время посещения сайта и т. д.) повышает точность работы моделей нейронных сетей. Если обезличить данные и подать в систему, например, только информацию о стоимости покупки, мы не получим то преимущество, которое есть у системы нейронных сетей сейчас. Поэтому важно разработать такой метод, который позволял бы обезличить персональные данные для обучения модели, но чтобы они сохраняли свойства персональных данных реального человека. 

Для решения третьей задачи можно использовать технику федеративного обучения, когда одна компания не просто передает другой обезличенные данные, а создает зашифрованную модель нейронной сети на своих данных. И далее вторая компания дообучает свою модель, используя полученную. Федеративное обучение — тоже сравнительно новая технология. Однако кажется, что ее внедрить проще, чем создать нейронную сеть, которая обучается полностью на зашифрованных данных. Но здесь тоже есть свои проблемы. Во-первых, психологическая: при передаче своих данных компании сомневаются в надежности этого метода, и этот страх нужно преодолеть. И, во-вторых, необходимы более развитые методы доказательства безопасности подобного обучения.

Уверен, что в этом году будут активно вестись научные исследования в области защиты данных, которые циркулируют в системах искусственного интеллекта. Мы обязательно увидим новые подходы и развитие старых идей. Скорее всего, некоторые крупные компании начнут внедрять методы обезличивания персональных данных в свои информационные системы, построенные на базе технологии искусственного интеллекта.

 

Мнение редакции может не совпадать с точкой зрения автора

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+