Многоэтажная башня из стекла и бетона в стиле хай-тек на самой дорогой улице Тель-Авива, проспекте Ротшильда. Напротив — офис Bloomberg, респектабельные отели. Вроде бы не самое подходящее место для стартапа. Амбиций у основателей сервиса Audio Burst действительно много: «Мы сделали так, что каждое слово, сказанное по радио, теперь не потеряется!» — утверждает Амир Хирш, которому сейчас 41 год.
Audio Burst — платформа распознавания и перевода трансляций радиопередач в текст в режиме реального времени. С помощью сервиса можно организовать поиск ссылок и текстов аудиотрансляций на своем сайте. В числе клиентов Wall Street Journal, New York Times, Dow Jones. Хирш и три его партнера запустили этот проект в июне 2015 года. Технология Audio Burst пока ориентирована на «говорящие» (то есть не музыкальные) радиостанции США: она обрабатывает уже треть из 15 000 таких радиостанций. Покрыв 100% «говорящих» американских станций, израильтяне планируют выходить на другие рынки, в том числе на Россию.
Каковы перспективы? «Проект интересен тем, что обращает внимание на сегмент аудиоконтента, который несправедливо обошла интернет-революция, перешагнув от текстов и картинок напрямую к видео», — говорит исполнительный директор Rambler & Co Рафаэль Абрамян.
Основатели Audio Burst — IT-инженеры Амир Хирш и Гал Кляйн, биоинженер Бен Энош и специалист по промышленному дизайну Йони Силберберг. До Audio Burst трое из них работали над стартапом PLYMedia, SaaS-платформой для управления рекламными сетями. Одновременно все трое занимались и языковыми технологиями, автоматическим переводом и преобразованием аудио в текст – именно этот опыт помог партнерам быстро запустить Audio Burst.
Известно, что на старте предприниматели вложили в проект собственные средства на паритетных началах. В начале 2015 года им удалось привлечь более $1 млн от фонда Flint Capital (фонд, созданный экс-менеджерами «Финама», в России инвестировал в сервис YouDo, платформу для web-конференций Webinar.ru, онлайн сервис моментальных займов Platiza и другие стартапы). «После подписания документов нам вдруг накрыли «поляну» в офисе — соки, печенье, ананасы, груши, — вспоминает глава венчурного фонда Flint Capital Дмитрий Смирнов. — Такое отношение – редкость для венчурного мира».
Вложился в израильтян и глобальный венчурный фонд Greylock IL/83 North, а также один из крупнейших в Израиле IT-инвесторов, компания Elron (общая сумма вложений не раскрывается, но она выше $10 млн).
На эти средства и было доработано ноу-хау проекта — семантическая технология, способная перевести трансляцию голоса в текст. Как это происходит? «Наша технология распознает отдельные, не согласованные между собой слова, преобразуя их в связные предложения, а затем в текст», — разъясняет сооснователь Audio Burst Бен Энош. Звуки распознаются и переводятся в слова, причем из них сначала складывается следующее предложение, и лишь затем, как бы «отматывая» назад, предыдущее. «Никогда не слышал о лингвистическом анализе устной речи, что называется «на лету», — удивляется руководитель пресс-службы «ВКонтакте» Георгий Лобушкин.
Движок, как уверяют основатели, понимает, когда в интервью или рассказе поменялась тема.
«Это нужно для того, чтобы мы могли «нарезать» передачу на короткие куски и разместить их на сайте», — утверждает Амир Хирш. «Никто сегодня не слушает часовую передачу, 2 минуты и все, — добавляет Энош. — Мы делаем правильные короткие куски для современного мира, который постоянно торопится». В итоге получается готовый клип, который можно слушать, делиться им по электронной почте или размещать в соцсетях.
Для пользователя все выглядит просто: небольшая «нарезка» из нескольких предложений, максимально полно передающая ключевой смысл аудиопередачи. Под «конспектом» размещается ссылка на фрагмент передачи с прикрепленной к нему релевантной картинкой.
«Молодые люди сегодня действительно гораздо охотнее воспринимают короткие кусочки информации, и многие стартапы эту особенность восприятия эксплуатируют», — отмечает руководитель аналитического направления в коммерции Mail.ru Group Алексей Беляев, которого проект заинтересовал.
Функционал распознавания смены темы в процессе передачи необходим как воздух и для собственного поискового механизма Audio Burst: он индексирует записанные куски передач по отдельным словам, именам ведущих или названиям, на платформе можно найти любые аудиотрансляции. Как переведенные в текст, так и в форме активных ссылок. Правда, пока только из тех 5000 радиостанций, которые покрывает Audio Burst. «Мы как Google, но только для радио», — улыбается Амир Хирш.
«Звучит вроде бы все просто, но на самом деле текстовая аналитика — дело очень сложное», — утверждает основатель ABBYY Давид Ян. По его словам, компании всего мира работают сегодня над переводом неструктурированных текстовых данных в структурированные, постепенно переходя от анализа текста к анализу смысла, стоящего за словами. Над подобной технологией, что разработали в Audio Burst, трудятся и в ABBYY, признает Ян: «Но про стартап Audio Burst лично я не слышал, какую именно технологию они используют, я не знаю».
Вместе с Амиром и Беном мы сидим в переговорной зоне коворкинга в том самом бизнес-центре Тель-Авива. Бен набирает в поисковике на своем лэптопе важное событие этого дня (UBS обвиняется в манипулировании ценой), а затем показывает мне результаты: в поисковой выдаче сайт Audio Burst третий, выше Bloomberg.
Неплохой результат после полугода работы, но вот с монетизацией пока проблема.
Зарабатывать израильтяне планируют при помощи традиционной рекламной модели, которая понятна инвесторам. Есть ли дополнительные опции? Георгий Лобушкин из «ВКонтакте» подсказывает, что технология Audio Burst могла бы лечь в основу разработки приложений для обучения – записи уроков и лекции, разбивка по темам занятия, для журналистов (например, индексирование прямых трансляций). Российский предприниматель, занимающийся созданием и доставкой персонализированного контента на мобильные устройства, отмечает, что потенциально у Audio Burst много и других рынков начиная от сервисов для издателей — помочь вставить рекламу в нужные места при конверсии радио в digital, сделать автосегментацию передач для сайта или social media, до b2b — анализ записей бизнес-встреч, лекций и т.д. «Другое дело, что многие с удовольствием слушают часовые подкасты, любят ведущих. Резать трансляцию на короткие фрагменты и склеивать в персонализированный канал нужно относительно маленькому сегменту аудитории», — добавляет эксперт на условиях анонимности. Обращает на это внимание и Алексей Беляев из Mail.ru: «По частям штука выглядит задорно: автоконверсия голоса в текст — круто, search радио — хорошо. Но вместе у меня это как-то не складывается. Возможно потому, что модель не предполагает прослушивания исходного текста программы — представьте, что Google не давал бы возможность кликнуть по ссылке, зато показывал бы красивым облаком отрывки и позволял бы их шарить в соцсетях... Умопомрачительное зрелище».
Создатели Audio Burst считают, что спрос будет. Большая часть аудитории сейчас приходит на сайт Audio Burst через поисковики, а также ролики, размещенные в YouTube и My Space. Основатели любят вспоминать про YouTube, где при большом количестве «мусора» пользователи находят интересный контент и делятся им. «При этом аудиофайл легче видео, им проще обмениваться в мессенджере, — говорит Смирнов из Flint Capital. — Те, кому не хватает подобного сервиса, будут мегасчастливы от того, что он появился».
С середины 2016 года стартует подписка: базовый аккаунт бесплатно, премиальный за плату — с лучшим поиском, кастомизированным каналом. На 2017 год запланирован выход на новые рынки. Помочь развернуться должны местные партнеры, они же возьмут на себя маркетинг, позиционирование и оценку спроса, рассчитывают в Audio Burst.
Правда, степень востребованности технологии сильно зависит от качества контента.
«В США и в некоторых странах Западной Европы, в отличие от России, радио до сих пор остается крупным игроком медиарынка. В аудиопоток часто попадают эксклюзивные материалы, исследования, аналитика, а также оригинальные живые интервью и ток-шоу. Только такой контент может вызвать у пользователей желание его переслушать», — отмечает Рафаэль Абрамян из Rambler & Co. Это, впрочем, не смущает Дмитрия Смирнова – венчурный фонд готов участвовать и в следующем раунде. «Уникальный контент в радиоэфире присутствует – минимум 5-10% от общего объема. Audio Burst первой разработала способ его сохранить и search-технологию для рынка радиостанций», — говорит Дмитрий Смирнов.