Распознавание лиц — одна из тех задач, где искусственный интеллект пока не достиг способностей человеческого мозга. Эта особенность нашего сознания уникальна: человек способен угадывать человеческое лицо — и даже приписывать ему эмоциональные состояния — в простейшей комбинации из скобки и двоеточия или в радиаторе и фарах автомобиля, но при этом, вероятно, не назовет абсолютно одинаковыми никакие два лица из семи миллиардов человечества.
Число параметров лиц, анализируемых компьютерными программами распознавания, исчисляется десятками; человеческий мозг, возможно, обрабатывает их на порядок больше. Казалось бы, такая работа требует, во-первых, серьезных вычислительных возможностей мозга, а во-вторых, достаточно детализованных входных данных, поступающих от органов зрения.
К такому выводу мог бы прийти программист — но с ним готов поспорить биолог. Он укажет на простой пример: плодовая мушка дрозофила имеет очень небольшой мозг (примерно в 100 000 раз меньше, чем у человека), а ее несложные фасеточные глаза способны создавать изображение всего из нескольких десятков пикселей. Тем не менее, по единодушному мнению всех биологов, работающих с мухами, эти ничтожные насекомые прекрасно умеют различать своих сородичей на индивидуальном уровне. Интересно, что сами биологи — с их совершенным зрением и огромным человеческим мозгом — с задачей распознавания мушиной индивидуальности справиться не могут.
Чтобы разобраться в этой загадке, ученые двух канадских университетов создали исследовательскую группу для междисциплинарного проекта на стыке биологии и ИТ. Перед программистами и биологами стояла задача: создать самообучающийся алгоритм (нейронную сеть), основанный на принципах работы мозга мухи и, главное, ограниченный его ресурсами. В недавней статье они сообщают о сенсационных результатах.
Во-первых, возможности зрения дрозофилы на самом деле шире, чем предполагалось ранее: данные от 29 пикселей обогащаются с помощью некоторых несложных фокусов, вроде анализа изменения картинки при движении. Исследователи смогли восстановить картину, которую видит муха, когда ей показывают другую муху. Вместо ожидаемого темного вытянутого пятна компьютер реконструировал довольно подробное изображение, с лапками, крыльями и ясно различимой головой.
Но главное достижение исследователей в том, что им удалось обучить свой искусственный мозг — то есть нейронную сеть — распознавать индивидуальные особенности мух.
Всего на третий день обучения программы она распознавала мух (то есть идентифицировала их индивидуальные особенности и вспоминала, видела ли она раньше именно эту муху) с эффективностью 75%. Интересно, что аналогичная программа, но без искусственных физиологических ограничений, вроде числа доступных нейронов, — то есть использующая все возможности компьютера, — справлялась с задачей лишь немногим лучше (83%). Но самый удивительный результат получен при сравнении возможностей программы с обычным человеческим мозгом. Испытуемые — все как один биологи с многолетним опытом работы с мухами — узнавали нужную муху из выборки в 20 насекомых с эффективностью всего 8%. Случайное совпадение дало бы результат в 5%.
На специалистов по ИТ результат произвел сильное впечатление. Алгоритмы глубокого обучения обычно с большим трудом справляются с тем, чтобы воспроизвести возможности человеческого мозга, будь то распознавание лиц, речи или музыкальных мелодий. Случаи, когда такому алгоритму удается превзойти человека, крайне редки и обычно требуют серьезных вычислительных ресурсов. В данной же работе программа легко превзошла способности человека — правда, всего лишь достигнув того же результата, который в природе демонстрирует насекомое с жалкими 100 000 нейронов в крохотной голове.
По словам соавтора работы Джона Шнейдера, результаты свидетельствуют о «потрясающем факте: мухи способны различать индивидуальность друг друга. Когда они садятся рядом, то могут сказать: «Привет, Алиса! — Привет, Боб!»
Джоэл Левин, научный руководитель проекта, считает, что это исследование открывает широкие перспективы. «Объединение машинного обучения и данных изучения нервной системы невероятно плодотворно. Оно способно многое разъяснить в работе самих систем машинного обучения, в принципах коммуникации между нейронами и в общих принципах организации животного мира. Это неисследованная территория».
Результатами остались довольны и биологи — специалисты по исследованиям дрозофилы — привлеченные к работе в качестве испытуемых. Ранее в распоряжении генетиков были только статистические данные: они могли подсчитать общее число мух с теми или иными идентифицируемыми признаками. Однако разработанный учеными алгоритм позволяет автоматически прослеживать судьбу и поведение индивидуальных особей. Эта возможность может быть использована в разнообразных экспериментальных задачах.