Диктуй условия: как трое украинцев рассчитывают потеснить Siri и Alexa
Устройства и сервисы для распознавания речи в 2017 году стали одной из самых обсуждаемых тем на мировом технологическом рынке, особенно после презентации Amazon Alexa, ассистента для «умного дома», способного связываться со многими бытовыми приборами, а также все новых анонсов создателей Apple’s Siri, Microsoft’s Cortana и Google Assistant. Подобные технологии существуют еще с середины 1960-х, но лишь несколько лет назад с машинного обучения и нейросетей и за счет резкого падения стоимости вычислительных ресурсов по-настоящему началось проникновение систем распознавания речи в мобильные девайсы. По прогнозам Marketsandmarkets, рынок систем распознавания речи может вырасти с $3,7 млрд в 2015 году почти до $10 млрд в 2020 году. Однако пока большинство устройств ориентируются именно на системы «умный дом» (как стационарные гаджеты-помощники, так и роботы вроде Kuri), а также помощь водителю. Эра специализированных систем с голосовыми командами для промышленности только начинается (пока речь идет об исследованиях для достаточно узких применений — например, для роботов-хирургов). А что если сделать гаджет для распознавания речи полностью мобильным и в версии «всегда с тобой»?
Такую задачу решил взять на себя украинский предприниматель Назар Федорчук, основатель стартапа Senstone. Одноименный девайс, разработанный командой Федорчука, заменяет пользователю ворох стикеров и стопки блокнотов, позволяя оперативно записывать «мысли вслух». Устройство - кулон - конвертирует запись в текст, который записывается в мобильное приложение, даже если пользователь вышел на пробежку, а смартфон остался дома. Впервые украинский стартап Senstone показал свое новое устройство на Kyiv Fashion Week в 2016 году. Девайс можно носить как подвеску, брошь на одежде или же браслет. Стартап из Киева собрал более $300 000 на Kickstarter и надеется в течение года отправить 10 000 устройств. Могут ли основатели стартапа забрать часть аудитории у гигантов вроде Evernote (200 млн пользователей в июле 2016 года) и многих других альтернативных сервисов, счет которых идет на десятки?
Ловец мыслей
Основателю Senstone Назару Федорчуку, за плечами которого юридическое образование и учеба в Оксфордском университете, степень доктора философии и работа по проекту реформ в Департаменте юстиции США идея Senstone пришла в голову в парке. Летом 2014 года Федорчук во время прогулки предположил, что «мысленный конспект», проговоренный вслух, - это хороший способ расправиться с забывчивостью. «У меня на прошлой работе была «галерея» стикеров, to-do листов, просто мейлов и напоминалок в телефоне — и как-то это все не срабатывало, — говорит предприниматель. — Проблема в том, что я никогда не мог держать в голове много разных мелких вещей, идей, заданий, хотя среди них могли быть очень важные. Это бесило не только меня, но и моих бывших сотрудников». Идея Федорчука в чем-то была близка нейрофизиологам, которые предполагают, что могут быть созданы интерфейсы для взаимодействия человека и компьютера — в том числе, для записи важных мыслей. Например, американские ученые из Гановера с 2010 года развивают проект NeuroPhone, в рамках которого рассчитывают научить людей управлять мобильными приложениями с помощью сигналов мозга, считываемых доступными энцефалографами. Но раз нейроинтерфейсы пока только начинают выходить за пределы лабораторий, нужно было сделать более массовый продукт, на основе уже более продвинутых интерфейсов. Поэтому главной специализацией Senstone cтал голос человека. «Вычленив аудио-канал, о человеке можно очень узнать много интересного – распознать его настроение, мысли, выяснить, с кем он общается и даже какой образ жизни ведет», — уверен Федорчук, указывая, что это может пригодиться и для собственного развития, и для повышения продуктивности. Связь успехов в запоминаниями и конспектирования вручную уже подтверждается исследователями. Для «речевого записывания», по предположению основателя Senstone, смогут сработать похожие принципы.
Изначально компания планировала создать «кнопку-напоминаналку», расположенную около лица пользователя. Позже устройство научилось записывать звук, а затем и преобразовывать его в текст. Официально старт проекту был дан в 2015 году. Позже, летом 2016 года, Федорчук познакомился с Маркияном Мацехом, разработчиком одного из первых приложений для Apple Watch под названием Tesla. Федорчук и Мацех поддерживали контакт после первого показа Senstone на Kyiv Fashion Week весной 2016 года, а в начале 2017 года к проекту присоседился Роман Кравченко, основатель киевского фонда IoT Hub — от него стартап получил около $60 000. Сами предприниматели вложили в проект к текущему моменту еще около $65 000.
Сегодня в команде Senstone 10 человек. «Плюс и минус стартапа в том, что это работа преимущественно pro bono (ради общественного блага) или с выгодой для себя когда-то в будущем, — говорит Федорчук. - Из-за этого трудно найти постоянных людей, подрядчиков. В то же время, когда после трех-четырех месяцев люди и подрядчики не покидают проект, он им интересен — они, наверное, с нами надолго».
От краудфандинга к производству
Первый рабочий прототип записывающего устройства появился в феврале 2016 года. Создатель Senstone рассказывает, как тестировал его вместе с женой и тот сумел распознать даже ее редкое имя — Орыся. Несмотря на медлительность, гаджет в первой его версии вдохновил Федорчука: главное было протестировать идею передачи аудиотреков в мобильное приложение с устройства рядом с головой, в виде «кнопки» на воротнике. Дальше дело было за повышением точности без увеличения габаритов устройства — миниатюрность должна была остаться неотъемлемой характеристикой девайса для его повседневного использования.
Сейчас кулон Senstone диаметром около 29 мм и весом 11 г распознает 12 языков и держит заряд батареи до четырех дней среднего использования. Он умеет записывает до двух с половиной часов в офлайн-режиме с точностью расшифровки 95%, утверждает Федорчук. Сегодня у устройства есть два интерфейса: экран девайса и смартфон пользователя. Девайс с помощью экрана сообщает пользователю, находится ли гаджет онлайн или офлайн, записывает ли он данные или передает их, а также состояние аккумулятора и памяти. Обработка данных происходит частично «в облаке», частично - на смартфоне: в приложении все заметки сортируются по категориям, которые пользователь формирует с помощью хештегов. Заметками в аудиоформате или в виде текста можно делиться с друзьями и публиковать в блог или социальные сети. Любую заметку можно также отыскать по времени, дате и локации записи.
В этой версии основатели Senstone представили девайс на Kickstarter в феврале 2017 года. Спустя 36 часов с момента старта краудфандинговой кампании предприниматели собрали требуемую сумму в $50 000. В конечном счете проекту удалось собрать в шесть раз больше средств, чем планировалось, — $302 023. «По инерции» стартап получил более $60 000 на Indiegogo. Теперь украинские предприниматели полностью сосредоточены на запуске производства.
Специализация как конкурентное преимущество
Устройства проектировались в Киеве и во Львове, там же появились первые прототипы. Тестовую линейку прототипов Senstone заказывал через партнеров в Китае. Федорчук и Мацех в поисках нового производителя для более масштабных партий в конце мая объездил площадки в Китае и Малайзии. По словам Федорчука, представители Kickstarter зачастую советуют стартапам качественных производителей и тех, кто поможет управлять цепочками поставок. Однако после визитов в Китай стало ясно, что конструкцию для массового производства придется доработать. Поэтому отсылка первой партии затянулась. Тем не менее она, объемом в 5000 гаджетов (в несколько этапов: сначала изготовление партии из нескольких прототипов, после оценки — партии по 1000 штук), должна выйти в течение года. На Kickstarter проект поддержали более 2700 «бэкеров», большую часть предзаказов потенциальные покупатели оформили на площадке стартапа (стартап продолжает сбор предзаказов, полноценный интернет-магазин не запущен). В рамках краудфандинговых платформ девайс обходился в $109, на собственной интернет-площадке и впоследствии в рознице цена составит $145.
Сейчас компания открыла два офиса: один в Киеве, где сосредоточена разработка, и второй — в Редвуд-Сити в Калифорнии, для развития бизнеса. Senstone использует одну из систем распознавания речи на рынке (предприниматель не раскрывает имен партнеров). В дальнейшем, не исключает Федорчук, компания займется собственной, улучшенной, системой распознавания. Стартап также работает над системой пунктуации в заметках. «Один из интересных кейсов — это записывание снов через секунды после пробуждения. Тут гаджет работает как дневник снов, и для некоторых духовных людей это очень важно», — говорит о планах он. Понятный пользовательский сценарий в копилку — запись идей во время занятий спортом. Конспекты ведут журналисты и блогеры, сообщество которых растет по всему миру. Другая аудитория — студенты. Идея украинских предпринимателей — вовлечь в сообщество покупателей как можно больше пользователей, которые будут использовать Senstone регулярно (например, в конспектах лекций), а не периодически (например, только в путешествиях). Это, очевидно, позволит стартапу в дальнейшем зарабатывать на дополнительных сервисах в приложении, если предприниматели будут искать пути повышения маржинальности.
Параллельно предприниматели строят сеть дистрибьюторов, сейчас переговоры идут с партнерами из Великобритании, Франции, Германии и других стран ЕС, а также из Китая и Японии. С необходимостью достраивать новые языки в устройство для выхода на новые рынки команда готова справиться. Сложнее с требованиями по сертификации, сильно отличающимися в каждой стране.
Возьмут ли на себя роль «организаторов потока мыслей» голосовые помощники и как Senstone может найти нишу? Разработками в области речевых технологий и искусственного интеллекта активно интересуются и все крупные игроки. В мае 2017 года глава Google Сундар Пичаи в ходе ежегодной конференции объявил о переходе от парадигмы Mobile First к парадигме AI First. Google интересуют все области технологий искусственного интеллекта, в том числе и распознавание естественного языка и синтеза речи. Корпорация намерена интегрировать в будущем их во все свои продукты — мобильную платформу, поиск, персонального ассистента и др. Тогда же, например, стало известно, что собственного голосового помощника по имени «Алиса» с системой распознавания голоса также запустил «Яндекс»: вопросы помощнику можно задавать голосом или вводить их с помощью клавиатуры. Компания уже несколько лет развивает также облачную платформу распознавания речи SpeechKit Cloud. Пользователи Siri давно используют ее для надиктовки заметок. Для Alexa для этих задач уже создаются подобные приложения. Нюанс в том, что голосовые помощники универсальны и научатся самостоятельно активировать одно из нужных приложений после той или иной команды пользователя. Специализированный интерфейс с системой преобразования речи в заметку и последующей работы с ней может быть удобнее и обладать более широким набором возможностей. Один из сценариев — социальные сервисы вокруг обмена идеями. «На одном из западных сайтов нас сравнили с бейджем команды «Стартрека», — шутит Федорчук. - Пока мы даем возможность коммуницировать человеку с системой для того, чтобы делать важные записи, но, возможно, уже в ближайшем будущем небольшой девайс на груди позволит общаться с другими людьми».