Михаил Хитров нажимает кнопку коммутатора и просит секретаря соединить его с начальником отдела маркетинга. Но, дозвонившись, тут же дает отбой: «Я просто барышню проверял». Его «барышня» не получает зарплаты, не просит отпуска и не уйдет в декрет — это компьютерная программа распознавания и синтеза речи. «Причем ей наговаривать ничего не нужно, достаточно дать таблицу Excel с контактами, программа сама распознает каждую фамилию и номер», — нахваливает сообразительность «секретарши» Хитров.
Основные направления деятельности его компании «Центр речевых технологий» (ЦРТ) со штаб-квартирой в Санкт-Петербурге — многоканальная запись и анализ переговоров, производство диктофонов, видеодиктофонов и программно-аппаратных комплексов для фоноскопической (звуковой) экспертизы, биометрия — идентификация личности по голосу. За 2011 год выручка ЦРТ, по прогнозу, вырастет как минимум на 20%, до 600 млн рублей.
А начиналось все в 1990 году, когда знакомый по секции альпинизма предложил инженеру из секретного НПО «Дальняя связь» заняться бизнесом: дал комнату в офисе, бухгалтера и полную свободу. Первым заказчиком стало Всероссийское общество слепых (ВОС) — там потребовались «говорящие клавиатуры», которые озвучивали бы нажатые клавиши. Второй заказ тоже пришел от ВОС: усовершенствовать «говорящую газету» для слепых. Газета представляла собой записанные на магнитофонную пленку новости, кому-то из «читателей» хотелось слушать их в более быстром темпе, кому-то — в медленном. Но если крутить запись медленно, голос превращался в бас, а если быстро — в писк. Хитров привлек знакомых инженеров на полставки и разработал приставку к магнитофону, которая решала эту проблему. «Звучит просто, но математика там применялась довольно сложная», — вспоминает он.
Заниматься бизнесом ему понравилось — по сравнению с режимным НПО здесь была полная свобода: приходи на работу когда хочешь, занимайся чем хочешь. Внутри команды действовала неформальная договоренность — заниматься только научными проектами, не отвлекаясь на коммерчески более выгодные дела вроде торговли компьютерами или спиртом Royal. Поначалу, правда, с финансами было туго — Хитров ночами «бомбил» на «жигулях», полученных в 1987 году в качестве приза за лучшую инженерную разработку в сфере кодирования речи. «Конечно, мы совершили все возможные коммерческие ошибки. Например, чтобы первыми значиться в справочниках, фирму следовало назвать на букву А, мы же назвались на Ц», — смеется Хитров.
Первый крупный заказ (60 000 рублей, что тогда составляло более $30 000 по курсу) поступил Хитрову в 1990 году от свежесозданного МВД РСФСР. Эксперты по фоноскопии попросили разработать программу, которая помогала бы чистить записи от постороннего шума и точно определять, кто и что говорит. Разработанный ЦРТ софт требовал устройства для ввода и вывода звукового сигнала в компьютер и перевода его из аналогового в цифровой формат. На рынке таких не было, так что компании пришлось создать и прибор. Так появился программно-аппаратный комплекс «Икар», который до сих пор является одним из основных продуктов Хитрова. Свое «железо» послужило надежной защитой от пиратов — без аппаратной части программа не работает. Сейчас ЦРТ поставляет фоноскопические лаборатории в госорганы по 2 млн рублей за комплект.
Появление первых денег, как это часто бывает, привело к обострению разногласий среди бывших коллег по НПО, основателей компании (у всех первых сотрудников были акции, что Хитров сейчас считает своей самой большой коммерческой ошибкой). В итоге три человека в 1998 году покинули компанию, продав акции по $300 за 1% — с оценкой стоимости компании в $30 000 никто не спорил. Один из ушедших, Виктор Сазанов, теперь работающий в конкурирующей фирме «Иста», сказал Forbes, что основной причиной конфликта было недовольство тем, что жена Хитрова участвует в управлении. Это и сейчас повод для конфликтов. «Решения в компании принимают только два человека, сам Хитров и его жена. Меня такая система управления не очень устраивала», — критикует бывшего шефа Герман Зубов, занимавший в ЦРТ должность начальника отдела маркетинга. После ухода из компании он создал собственную фирму «Форенэкс», которая занимается в основном судебной речевой экспертизой.
А вот инвесторов авторитарное управление не смутило — в 2003 году 35% ЦРТ приобрел немецкий инвестиционный фонд Quadriga. «Уже тогда это была хорошая фирма, с интеллектуальной собственностью, способная создавать что-то новое на рынке, — объясняет свой интерес Райнхард Кольайк, управляющий директор российского подразделения Quadriga Capital. — У нас с Хитровым сложилось взаимопонимание, я тоже физик по образованию». Сумма сделки не разглашается, но, по предположению аналитика «Финам» Леонида Делицына, компанию оценили тогда как минимум в $5 млн. И это притом что выручка компании за 2002 год была всего около $1 млн, много средств тратилось на НИОКР, а российский рынок высоких технологий находился в зачаточном состоянии: о «Яндексе», например, мало кто знал, лидирующей поисковой системой был Rambler.
По совету инвесторов в 2003 году Хитров впервые составил план работы компании. «[Представители инвестора] ходили и нудили: а где план, а почему он не выполняется. В общем, приучили нас к порядку», — вспоминает он. Полученные от инвесторов деньги пошли на организацию серийного производства на Тайване аппаратных средств, например устройств ввода-вывода сигнала и диктофонов «Гном». Это позволило снизить издержки, выручка уже в 2003 году увеличилась до 58 млн рублей, а чистая прибыль — с 4 млн до 14 млн рублей.
Бизнес с тех пор сильно вырос. Сейчас продукты Хитрова используются в 74 странах, экспорт дает более 50% выручки. И заказы там крупнее, чем у любого из российских клиентов. В прошлом году, например, ЦРТ внедрил систему голосовой идентификации по заказу правительства Мексики, озабоченного борьбой с наркотрафиком. Система позволяет создать базу данных из миллионов голосов, а потом мгновенно определять по отрывку, скажем, перехваченного телефонного разговора, кто именно говорит. «Человеческий голос обладает уникальными характеристиками. Это как отпечатки пальцев, только лучше», — поясняет Хитров. На подходе внедрение аналогичной системы в Эквадоре, Панаме. Для продаж в Латинской Америке Хитров даже нанял несколько испаноговорящих иностранцев. (Осваивать зарубежные рынки, а заодно и выучить английский Хитрова еще в середине 1990-х сподвиг западный консультант, бывший сотрудник NASA. Причем ЦРТ его помощь ничего не стоила — правительство США выделяло тогда гранты на обучение российских бизнесменов работе за рубежом.)
Технологии распознавания речи оказались интересны не только силовикам. Одно из перспективных направлений — поддержка записи переговоров в крупных колл-центрах с последующим автоматическим анализом их содержания. Программа может определить, кто именно из операторов говорил с клиентом, о чем, произносил ли ключевые слова и как часто говорил, например, «спасибо». Такая система установлена в колл-центре МТС.
А вот с продуктами, рассчитанными на конечного потребителя, у ЦРТ все не так гладко. «У людей из советских «почтовых ящиков» другой менталитет, у них в психологии неприязнь к продуктам, которые создают массовый спрос», — отмечает аналитик Делицын. Программа, аналогичная популярному распознавателю музыки Shazam, была создана в ЦРТ еще 10 лет назад, но, кому ее продать, Хитров так и не придумал. App Store тогда не существовало, а когда он появился, ЦРТ не успел вовремя на это среагировать. Анонсированная в прошлом году программа идентификации владельца мобильного телефона по голосу VoicePIN не прижилась на рынке: ее сделали под мобильную ОС Symbian, которая уже сдает позиции.
Хитров, которому сейчас 61 год, осознает, что компании пора меняться. «Мы мощнейшая контора, у нас сильные инженеры, — как заклинание повторяет он, — но нам не всегда везет и не всегда хватает коммерческой жилки, чтобы превратить разработку в продукт». Предприниматель начал привлекать молодых ученых, сотрудничать с модным «Сколково» — стартап «ЦРТ-Инновации», дочерняя компания ЦРТ, специализирующаяся на речевой биометрии, стал резидентом иннограда.
Для пропаганды речевых технологий запущен сайт Voicefabric.ru, там можно, например, написать открытку, которая будет зачитана адресату синтезированным голосом (на выбор два мужских и три женских голоса). Наконец, на App Store в октябре появился первый продукт от ЦРТ — это RSS Radio, которое вслух зачитывает тексты с выбранной вами новостной ленты, хоть из «Коммерсанта», хоть с портала Хабрахабр. За два месяца бесплатное приложение скачали уже 12 000 пользователей. Дополнительный функционал платный. Возможность слушать еще 50 новостных каналов стоит $1,99.
На большем внимании к сервисам, а не к «железу» настаивает и новый инвестор — Газпромбанк. В 2011 году он стал крупнейшим акционером, выкупив долю Quadriga в ЦРТ и часть пакета акций у основателей. Откуда такой интерес? «Они молодцы большие, в России мало инновационных компаний, продукты которых могут уверенно побеждать в международных тендерах», — говорит Владимир Румянцев, начальник управления медиа-, телеком-, интернет- и высоких технологий Газпромбанка. Сумму сделки стороны не разглашают, говоря лишь, что это «десятки миллионов долларов». Но Румянцев признает, что банк покупал акции по более низким мультипликаторам, чем у торгующихся иностранных аналогов.
Делицын из «Финама» оценивает общую капитализацию ЦРТ в $30–50 млн (мультипликатор к выручке 1,5–2,5). Для сравнения: лидер рынка речевых технологий, американская Nuance при выручке $1,4 млрд имеет капитализацию $7,4 млрд (мультипликатор 5,3). Рецепт повышения капитализации новому инвестору ясен. Во-первых, 10% акций собираются выделить на опционную программу: мотивация специалистов в технологических компаниях — один из критических факторов успеха. Во-вторых, объединить разные продукты ЦРТ, рассчитанные на конечного пользователя, под одним зонтичным брендом — Румянцев уверен, что потребительский бренд поможет и корпоративным продажам. И самое главное — сменить приоритеты, сделав упор на сервисы, а не на «железо».
Сам же Хитров надеется, что поддержка Газпромбанка позволит ему наладить связи с госкорпорациями, например «Транснефтью» и «Ростелекомом», в которых работают диспетчерские службы и огромные колл-центры. Именно такие клиенты в конечном счете обеспечивают компании устойчивость развития, как бы ни впечатляла динамика скачиваний приложений в App Store.