«Коммерсантъ» узнал о тестировании российских языковых моделей для «Госуслуг»
В России начали тестировать отечественные языковые модели для внедрения в сервис «Госуслуги», узнал «Коммерсантъ». Речь идет о YandexGPT и GigaChat от «Яндекса» и «Сбера» соответственно. Эксперты отмечают, что для использования моделей оператору портала придется использовать инструменты, маскирующие персональные данные пользователей
В России проходит тестирование двух отечественных LLM-моделей (Large Language Model, большая языковая модель, обучается на массивах текстов и используется в нейросетевых сервисах) от «Яндекса» и «Сбера» — YandexGPT и GigaChat — для внедрения в «Госуслуги», пишет «Коммерсантъ» со ссылкой на источник, близкий к Минцифры.
По данным издания, тестирование проводит принадлежащий «Ростелекому» оператор портала «Госуслуги» «РТ Лабс». Минцифры планирует внедрить одну из этих моделей в интерфейс «Госуслуг» до конца 2024 года. При этом в министерстве пока «нет четкого понимания объемов бюджета» для интегрирования LLM-моделей в сервис госуслуг, отмечает источник «Коммерсанта». В «Ростелекоме» и «Яндексе» отказались от комментариев, в «Сбере» не ответили на запрос издания.
По словам собеседника «Коммерсанта», для наполнения базы знаний моделей в «РТ Лабс» используют скрипты «Робота Макса», базу ответов операторов кол-центра «Ростелекома», обезличенные жалобы и обращения пользователей, поступающие в ведомства, а также ответы на них. Директор по развитию бизнеса Just AI Светлана Захарова считает, что после интеграции модель сможет теоретически продолжить обучаться на данных, которые пользователи вводят в чат-бот госуслуг, пишет «Коммерсантъ». В то же время эксперт отмечает, что при такой интеграции оператору «Госуслуг» придется использовать инструменты, способные маскировать персональные данные пользователей.
Премьер-министр Михаил Мишустин, комментируя планы по внедрению языковых моделей в сервис «Госуслуг», заявил, что в российские модели и иностранный ChatGPT заложены разные картины мира, в частности разное понимание того, что такое «хорошо», а что такое «плохо». Он отметил, что в области науки, медицины и промышленности «важно использовать модели, отвечающие собственным национальным интересам». «Российские нейросети ничем не хуже западного ChatGPT», — добавил премьер. Он уточнил, что за последние два года средний уровень использования технологий искусственного интеллекта в отраслях экономики и госуправлении вырос в полтора раза.
Накануне, 1 февраля, министр цифрового развития России Максут Шадаев заявил, что Минцифры планирует в 2024 году начать внедрение на портале «Госуслуги» технологии GPT для консультации граждан. «Государственные услуги будут оказываться онлайн. Это означает, что в момент обращения будет выдаваться результат. При этом мы считаем, что нужно развивать проактивные услуги, которые могут оказываться без обращения, а все консультации должен выполнять GPT, заполняя за человеком необходимые заявления», — говорил он.
«Сбер» выпустил собственную версию мультимодальной нейросети GigaChat в апреле 2023-го. В отличие от иностранного аналога ChatGPT нейросеть от «Сбера» изначально поддерживает мультимодальное взаимодействие и более грамотно общается на русском языке, отмечалось в пресс-релизе банка. В мае того же года «Яндекс» внедрил в своего виртуального помощника «Алису» разработанную компанией генеративную нейросеть YandexGPT.