Вежливая сеть: как научить искусственный интеллект относиться к людям непредвзято
Мир начинает переживать из-за предвзятости искусственного интеллекта в системах распознавания лиц. Люди беспокоятся, что такие системы изначально «хорошо относятся» только к европейцам.
Год назад разработчик системы распознавания лиц Gfycat удивился, когда его система не распознала некоторых азиатских сотрудников. Исследование аналогичных систем Microsoft и IBM показало, что они были на 95% точнее при распознавании женщин со светлой кожей. Компании рассказали, что улучшили собственные алгоритмы, но не уточнили, каким образом.
По каким признакам нейросеть определяет расовую принадлежность человека
Никто не сможет точно рассказать, как именно нейросеть учится распознавать лица, на что она обращает внимание. Многим факторам, на основании которых нейросеть распознает лица, она научилась сама. Она сравнивает миллионы фотографий, находит общие признаки и учитывает их внутри своей системы. При обучении нейросеть в явном в виде не выдает различие между разными типами лиц по расовому признаку, но в своих найденных признаках свойство расы может быть отражено, так как оно помогает нейросети ориентироваться по разным типам лиц. Эти признаки могут никак не интерпретироваться человеком, потому что это набор нулей и единиц.
Нейросеть смотрит на особенности лица: на то, как расположены глаза и брови, какая у человека форма носа, высота лба и так далее. В VisionLabs при обучении нейросети мы стремимся иметь как можно больше фотографий, зафиксированных в разных условиях. Это означает, что модель должна выучить признаки устойчивые к изменению освещения, ориентации или каким-либо другим атрибутам лица. Например, нейросеть не обращает внимание на цвет кожи, чтобы не учитывать такие изменения во внешности человека, как, например, загар. Чтобы сместить внимание модели с цвета кожи, мы добавляем искажения цвета таким образом, что нейросеть перестает обращать на это внимание. Такой подход помогает нейросети найти признаки, которые не учитывают цвет кожи. Поэтому, например, альбиносы будут распознаваться корректно, ведь алгоритм обратит внимание на черты лица и другие признаки.
От чего зависит качество нейросети
Качество обучения нейросети зависит напрямую от качества предоставленных данных. Если в выборке, по которой обучается нейросеть, азиатов или темнокожих в десять раз меньше, чем европейцев, то нейросеть будет хуже распознавать представителей этой расы. Если в обучающей выборке расы представлены равномерно и в достаточном количестве, то нейросеть будет хорошо справляться со своей задачей.
Один из методов обучения нейросети — работа с клиентами, у которых есть своя база, например, банками или кредитными бюро, которые позволяют дообучить модель на своих данных. Проблема в том, что, если компания работает в определенном регионе, например в России, европейцы будут преобладать в выборке клиента. Когда компания выходит на международные рынки, с каждым новым регионом нейросеть будет обучаться на более вариативных данных и будет становиться лучше.
Другой способ — скачивать из интернета дата-сеты со знаменитостями, людьми, которых часто публикуют в сети. Их можно фильтровать по ключевым запросам. Таким образом можно составить выборку, в которой все расы и гендеры будут представлены в досаточном количестве. Но есть проблема: с одной стороны люди добровольно выкладывают эти данные в сеть, а с другой — это их персональные данные. Интернет-гиганты вроде Facebook и Google могут использовать данные своих социальных сетей, но использование этих данных сторонними компаниями официально не регулируется. Впрочем, разработчики могут напрямую обратиться к владельцам соцсетей и попросить разрешение на использование фотографий.
Трудности, с которыми сталкивается нейросеть
У IBM и Microsoft возникли проблемы с распознаванием лиц в зависимости от гендера и расы, скорее всего, потому, что в выборке не хватало соответствующих групп. Но когда технологии распознавания становятся повседневностью, очень важно, чтобы они обеспечивали безопасность и предоставляли лучший пользовательский опыт для всех без исключения — именно поэтому важно обучать модели одинаково хорошо распознавать людей любых рас и национальностей.
Отличие между маленькими этническими группами сейчас не сможет найти даже человек. В глобальном смысле с этим связан активный процесс ассимиляции разных народов: этнические группы смешиваются, стирая границы и различия между собой. У нейросети мало данных о таких небольших группах, намного меньше, чем о расах, поэтому они практически не распознаются. Если получится собрать много данных для малочисленных групп, то и распознаваться они будут лучше. Когда-нибудь, по мере накопления этих данных, системы смогут распознавать людей всех рас и этносов без исключения, так как границы и различия между ними сотрутся.