Михаил Хитров продает за $5 программу, которая позволяет экономить сотни долларов
«Скажите в трубку кодовую фразу», — предлагает Михаил Хитров. Я проговариваю свой телефонный номер в протянутый им смартфон. «Не опознан», — безжалостно высвечивается на экране. Слишком коротко, объясняет Хитров, нужна фраза минимум на пять секунд. Сразу в голову не приходит ничего осмысленного, и я декламирую: «В лесу родилась елочка, в лесу она росла». «Опознан», — соглашается смартфон. Соглашается не сам аппарат, а установленная в нем программа опознания человека по голосу VoicePin, которую разработала основанная Михаилом Хитровым компания «Центр речевых технологий» (ЦРТ). Через пару лет красть сотовые будет бессмысленно, с энтузиазмом объясняет Хитров, аппараты будут узнавать владельца по голосу. И это только самое простое применение разработок ЦРТ. Сейчас компания Хитрова работает над заказом одной из латиноамериканских стран — программой пенитенциарного управления: для опознания заключенных наряду с фотографией будут использовать голос.
Голос каждого человека уникален, его характеристики определяются особенностями строения гортани и голосовых связок, ростом, телосложением, даже привычками. Как давно выяснили акустики, каждый гласный звук содержит четыре форманты — набора частот, на которых голос звучит особенно громко. Первой из них считается форманта с самой низкой частотой, дальше — по возрастанию частоты. Частоты формант уникальны для каждого человека, и их можно использовать как биометрические характеристики для идентификации наряду с отпечатками пальцев, радужной оболочкой глаза, узором вен или изображением лица. В 2009 году производители систем голосовой биометрии во всем мире заработают $100 млн, по оценкам аналитической компании International Biometric Group. Этот рынок растет на 50% в год, и ЦРТ рассчитывает принять участие в его дележе.
Михаил Хитров занимался технологиями анализа речи еще в советское время в закрытом НИИ «Дальняя связь», в спецотделе, работавшем на КГБ. Свою компанию он создал сразу после распада СССР; до сих пор 65% «Центра речевых технологий» принадлежит ему и еще трем его коллегам по «Дальней связи». Одним из первых проектов была разработка системы анализа речи для правоохранительных органов и экспертов. Сейчас ЦРТ выпускает на собственном производстве в Петербурге профессиональные высокоточные диктофоны, системы шумоподавления, принятые армией на вооружение цифровые магнитофоны и другие устройства работы со звуком. В 2008 году выручка ЦРТ составила $16 млн, чистая прибыль — $2 млн. Впервые компания получила известность в 2002-м: она занималась расшифровкой записей разговоров экипажа подлодки «Курск». Задача была непростая, вспоминает Хитров: магнитная лента в спутанном виде пролежала год в морской воде на глубине около 100 м. В 2003 году Хитрова поддержал немецкий инвестиционный фонд Quadriga Partners, купив 35% акций ЦРТ, по оценкам, за $1–3 млн (точная сумма не раскрывалась).
Крупных игроков рынка голосовой биометрии в мире сейчас пять — израильская компания PerSay, американская Nuance, британская Voicevault, испанская Agnitio и немецкая Voice Trust, рассказывает региональный директор по продажам и развитию бизнеса PerSay в России Зив Коэн. ЦРТ получил патент на «Метод распознавания диктора и устройство для его осуществления» еще в 2002-м, но продажей биометрических технологий занялся только сейчас: раньше для работы с программным обеспечением компании не хватало мощности сотовых телефонов и коммуникаторов, объясняет Хитров. ЦРТ договорился о продажах программы VoicePin с Microsoft: этой осенью американская корпорация запускает AppStars, интернет-магазин программ для платформы WinMobile на сайте Microsoft. VoicePin будет продаваться там по $5 за скачивание.
В смартфоне голосовая идентификация используется вместо пароля — чтобы воры не смогли воспользоваться аппаратом, а также для разделения приложений между пользователями, как это происходит на компьютере. Но Хитров рассчитывает, что по мере роста рынка можно будет зарабатывать и на других видах голосовой верификации: опознание по голосу может заменить, например, сканеры отпечатков пальцев. Экономическая выгода налицо: сканер отпечатков стоит как минимум $50, и встраивание его в любую технику (от ноутбука до замка сейфа) ощутимо повышает цену. Сканер сетчатки глаза еще дороже — от $1000. А голосовая биометрия не требует вообще никакого спецоборудования — достаточно микрофона и компьютерной программы. Хитров ожидает, что скоро голос заменит систему кодовых слов при звонках в службу поддержки банков, ввод PIN-кодов в банкоматах, а со временем — и систему верификации в интернете. Возможно, через несколько лет для входа в электронную почту или на сайт «Одноклассники» вам достаточно будет произнести кодовое слово или фразу, вместо того чтобы вводить пароль на клавиатуре. Нет ли ограничений? Зарегистрироваться в системе голосовой верификации не может 2% людей. Это меньше, чем для других видов биометрии. Например, сканерами отпечатков пальцев не могут пользоваться 4% людей из-за необычно тонкой кожи или стершегося узора на подушечках.
С точки зрения голосовой биометрии безразлично, на каком языке человек говорит, поэтому «национальная принадлежность» не дает на этом рынке никаких преимуществ. На что может рассчитывать ЦРТ в противостоянии американским, израильским и немецким конкурентам? Ее преимущество — гигантская база голосовых записей людей всех возрастов, накопленная за 19 лет работы, считает Алексей Гостомельский, управляющий партнер ValueTech Advisers, инвестиционной компании, специализирующейся на сделках с активами компаний высоких технологий стран СНГ. Еще одно преимущество, по мнению Гостомельского, большой штат ученых: из 200 сотрудников ЦРТ научными разработками занимается около 80 человек.
Хитрову сейчас 59 лет. Долго ли он собирается оставаться в бизнесе? В прошлом году он и другие акционеры, включая Quadriga, пытались продать ЦРТ — в числе партнеров по переговорам называли Nokia и IBM. Тогда аналитики оценивали ЦРТ в $20–40 млн. Сейчас, в период рецессии, Хитров продавать бизнес не хочет: ЦРТ, по его словам, хватает денег на развитие, а вот после восстановления экономики компания, возможно, снова будет выставлена на продажу.
Только цифры
- 1788 год — рождение биометрии. Немецкий ученый Иоганн Кристоф Андреас Майер открыл, что отпечатки пальцев сугубо индивидуальны.
- $3,4 млрд — объем мирового рынка биометрических решений. Доля голосовой биометрии в этом объеме — 3%. 67% приходится на распознавание отпечатков пальцев, 11% — на биометрию лица.
- 140 дБ — громкость крика летучей мыши. Это громче, чем звук взлетающего истребителя (120 дБ). Но летучие мыши кричат на ультразвуковой частоте 50–100 кГц, поэтому мы их не слышим.
- 95% всех обращений в банк ABN AMRO приходятся на интернет и телефон.
Источник: International Biometric Group, ABN AMRO, PLoS ONE