К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего броузера.

Yandex Research разработал новые методы сжатия нейросетей


Yandex Research разработал и выложил в открытый доступ новые методы сжатия нейросетей. По заявлению компании, они позволяют сократить расходы бизнеса на вычислительные ресурсы до восьми раз

Специалисты Yandex Research совместно с коллегами из IST Austria и Kaust разработали и выложили в открытый доступ новые методы сжатия больших языковых моделей, сообщила пресс-служба российской компании. Решение делает внедрение нейросетей и обслуживание оборудования дешевле для бизнеса. 

В Yandex Research объяснили, что для качественных и быстрых ответов большая языковая модель нуждается в большом количестве дорогостоящих и мощных графических процессоров. Новая разработка уменьшает модель в несколько раз и делает возможным ее запуск на устройствах с меньшей вычислительной мощностью. При этом, если другие методы сжатия приводят к снижению качества ответов нейросети, то разработка «Яндекса» «решает эту проблему».  

Новое решение включает в себя два инструмента. Первый уменьшает нейросеть до восьми раз и позволяет запустить ее на одном графическом процессоре вместо четырех. А второй исправляет ошибки, возникающие при сжатии большой языковой модели. Уменьшенная нейросеть при этом работает быстрее.

 

При проверке эффективности методов сжатия нейросетей на моделях с открытым исходным кодом (Llama 2, Llama 3, Mistral и другие) было установлено, что метод «Яндекса» сохраняет в среднем 95% качества ответов нейросети. Другие популярные методы сохраняют от 59% до 90% качества. 

Код нового метода сжатия нейросетей уже опубликован на GitHub и доступен для применения. Исследователи Yandex Research, кроме того, выложили в сеть обучающие материалы, чтобы помочь разработчикам дообучить уменьшенные нейросети под свои сценарии. Научная статья Yandex Research о методе сжатия AQLM включена в программу одной из самых престижных в мире конференций по машинному обучению — ICML. 

 

Yandex Research — команда исследователей, которая изучает фундаментальные вопросы в области искусственного интеллекта. В том числе они занимаются обработкой естественного языка, компьютерным зрением, нейросетями и создают решения, которые будут внедрены в продукты компании. Благодаря специалистам Yandex Research «Яндекс» стал одной из лидирующих технологических компаний по числу научных публикаций на NeurIPS, ICML и других главных международных конференциях по машинному обучению.

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

иконка маруси

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+