К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего браузера.

Давид Ян: каждый из нас превращается в информационную микровселенную

Фото Владимира Астапковича / ТАСС
Фото Владимира Астапковича / ТАСС
Основатель компании ABBYY — о том, куда движется рынок искусственного интеллекта и почему каждому из нас вскоре придется обзавестись собственной поисковой системой

Персональный поисковый ассистент Findo, созданный основателем ABBYY Давидом Яном, на днях получил новые инвестиции в размере $4 млн — от фонда Flint Capital и группы неназванных инвесторов из Кремниевой долины. Давид Ян в беседе с Forbes рассказал, почему каждому из нас вскоре придется обзавестись собственной поисковой системой для того, чтобы упорядочить свою личную информацию, куда движется рынок систем искусственного интеллекта, а также о том, почему борьба за частного потребителя между крупнейшими производителями компьютеров, такими как Apple и Microsoft, — уже пройденный этап в развитии отрасли.

Про искусственный интеллект

  • «В Кремниевой долине сейчас наблюдается совершенно беспрецедентный интерес инвесторов к технологиям искусственного интеллекта и всему, что с ним связано: это глубокое обучение, различные технологии так называемых conversational interfaces, по-русски, видимо, можно назвать их разговорными интерфейсами — это ассистенты, чат-боты. Эти термины звучат на всех конференциях, в статьях, при любом обсуждении, связанном с ИТ-индустрией».
  • «Мы в ABBYY давно ведем разработки в области искусственного интеллекта: это технологии распознавания, а также понимания и анализа текстов на естественных языках — наша Compreno. Много лет мы занимались языково-независимой семантической иерархией, то есть описывали устройство мира, создавали дерево понятий. Языки подключаются позже, это листочки нашего дерева. Сейчас у нас листочки на английском и русском, будут и на немецком. Но само ядро знаний не зависит от языка. Такая концепция называется interlingua. По сути мы учим компьютер понимать смысл текста. Для чего это нужно? Например, с нашей помощью банки анализируют информацию о клиентах и сокращают риски при выдаче кредитов, HR-департаменты компаний автоматически извлекают данные о соискателях и быстрее находят нужного кандидата. А службы технической поддержки оперативно отвечают на вопросы клиентов: система анализирует вопросы и сама отправляет их нужному специалисту. Это существенная экономия времени, ведь зачастую речь идет о тысячах вопросов в день. И это лишь некоторые, наиболее бытовые примеры. В свое время, когда мы начинали этим заниматься, было очень много скептиков, которые говорили, что это сделать невозможно. И в какой-то мере они оказались правы. Выяснилось, что возможно, но очень долго и дорого. У нас ушло на это 17 лет и $85 млн. Если бы это делалось в Америке, то стоило бы, наверное, полмиллиарда долларов».
  • «Человек использует язык около 300 000 лет, в качестве главного интерфейса для общения. Человек, собственно, стал Homo Sapiens благодаря языку как средству мышления и общения. И только последние 50-60 лет человек не может использовать язык в общении с технологиями и компьютерами. Он вынужден учить птичий компьютерный язык, использовать разные кнопочки, экраны для общения с телевизором, с компьютером, с часами, с пылесосом и так далее. Но все возвращается на круги своя. Как только технологии стали умнее, тут же прорвало. Теперь холодильники начинают общаться на человеческом языке, более того скоро появятся в продаже модели, которые смогут отправить сообщение в Telegram или Facebook Messenger: «Купи помидоры по дороге, у нас кончились помидоры». Пылесос будет сообщать, что у него кончился картридж, а завтра к тебе придут гости. Я знаю компании, которые разрабатывают видеокамеры, способные в видеопотоке распознать агрессивное поведение, людей с оружием в руках, детей, близко подходящих к бассейну, незнакомых людей, стоящих около входа долгое время. И это только начало процесса».

Про персональных ассистентов

  • «Глубокая нейронная компьютерная сеть откладывает в себе некоторые паттерны, которые она наблюдает. Если говорить о «чистых решениях», где нет модели поведения, это как бы пустой мозг, который накапливает знания. Однако большинство современных систем искусственного интеллекта используют комбинированные решения: они накладывают некоторую заранее предопределенную структуру знаний о предметной области на статистические данные, которым обучается система».
  • «Распознавание звукового сигнала — это одна тема. Это превращение звукового сигнала в последовательность символов, слов и предложений. А распознавание в словах и предложениях семантических, лексических объектов, извлечение смысла — это совершенно другая тема. Настоящий conversational interface — это уже ведение диалога. То есть распознавание не только того, что по факту сказано, но и того, что «на самом деле хотел сказать» пользователь. Кто хотел, чего хотел, когда хотел. А потом еще и ответ ему, чаще всего — с уточняющим вопросом. Проблема в том, что пользователь подразумевает, что некая информация должна быть ясна, исходя из контекста и не проговаривает ее компьютеру. То есть, если я говорю умному кондиционеру: «Когда придут гости сделай похолоднее», то кондиционер должен понять, кто такие гости. И хорошо распределить задачу между всеми умными объектами, которые участвуют в управлении температурой. Может быть нужно просто «сказать» отоплению отключиться или окнам открыться».
  • «И в 1996 году, и сейчас количество данных удваивалось ежегодно. И мы ожидаем, что у каждого из нас через пять лет в личной экосистеме будет больше 10 млн элементов хранения, поиска и обработки (для справки — в 2001 году, через пять лет после 1996 года, в мире было 30 млн сайтов). То есть каждый из нас превращается в информационную микровселенную образца начала 2000 годов. И соответственно, мы уверены, что появится «новый Google», который будет решать задачу каждого из нас для поиска только в нашем личном информационном пространстве. И мы уже более 2 лет создаем такой умный поисковый ассистент».
  • «Поисковый ассистент по персональной информации Findo.io, который мы делаем, позволяет находить письма, файлы, контакты по описанию. Когда ты забыл имя человека, ты можешь сказать: «Найди мне презентацию, которую мне выслал человек, забыл, как его зовут, он приехал из Бостона, или мы встречались с ним в Петербурге». Система интерпретирует такой запрос, и она знает, кто, что, когда, она знает онтологическую структуру твоих данных и позволяет находить один объект по описанию, связанный с другим объектом».
  • «Мы сейчас не хотим мучить пользователя кучей настроек. Мы хотим, чтобы система сама догадывалась, что важнее человеку, а что менее важно. Сейчас Findo ранжирует людей на основе вашей телефонной книги. Система определяет, кто в вашей жизни важнее, делает это на основе того, сколько раз вы отвечали человеку, как быстро, что было в теле письма, то есть она пытается понять, кто в вашей жизни, условно говоря, начальники, важные клиенты и партнеры, родственники, друзья. Сообщения от них она ранжирует выше, чем от тех, с кем вы никогда не общались или кому совсем не отвечали на письма».

Про инвестиции

  • «В Кремниевой долине, как и в любой другой точке мира, инвестируют бизнес-ангелы, венчурные фонды и компании. Это классическая схема инвестирования. Вначале это friends and family — idea stage. Затем prototype stage, у вас раунд business angels — они дают $100 000-300 000, это  характерный размер раунда бизнес-ангела. Потом seed round — это может быть около миллиона долларов. Затем А-раунд — это $3-5 млн. Где-нибудь в конце после раунда B или D может (если повезет) случится IPO, либо продажа бизнеса стратегическому инвестору. Стратеги — это, как правило, крупные компании. Facebook, Google, Microsoft, Apple и сотни других компаний выступают стратегами для технологических стартапов».
  • «Абсолютно все крупные компании скупают таланты в виде компаний. Основной метод привлечения сильных команд, сильных людей вместе с технологиями — это конечно покупка компании — так называемый Acqui-hiring (от слов Acquisition и Hiring). Представьте, если у большой компании, скажем Microsoft, есть задача быстро начать новое продуктовое направление, то есть два пути: нанять отдельных специалистов или привлечь готовую команду. Наем отдельных специалистов это экстенсивный, очень долгий путь, есть очень высокий риск того, что человек не впишется, уйдет, еще что-то. А покупка команды — это готовая единица со своей внутренней химией, которая уже показала свою успешность. Acqui-hiring обычно происходит в Кремниевой долине по цене $250 000-1 000 000 за специалиста. То есть команда из 5-7 сработавшихся и реально сильных ребят может быть куплена за $1-5 млн».
  • «Я не могу сказать, что в России нет подходящего инвестиционного климата для ИТ. Просто российский рынок не такой большой и в этом смысле размер проектов относительно ограничен. И, мне кажется, многие инвесторы, расширившие свой портфель, инвестируют не только в российские, но и в западные команды. Параллельно происходит и следующее: если раньше российские компании были в основном ориентированы только на локальный рынок, то в последние годы они начали активнейшим образом ориентироваться на международные рынки».
  • «Я вижу большой интерес российских инвесторов к области автоматизации потребительских сторон нашей жизни: всевозможные marketplaces, интеграции офлайна и онлайна, Uber для всего. Возможностей огромное количество. Эти компании, как правило, работают не только в России, но и в Европе — в Европе, в отличие от США рынок очень дефрагментирован, и для различных агрегаторов поле огромное».

Про будущее

  • «Персональные ассистенты на базе искусственного интеллекта типа Siri, Cortana, Hound, Amazon Alexa — это новые «операционные системы». Долгое время Microsoft боролся с Apple, а Apple с Google и Android. Параллельно идет борьба между железом — Samsung, Lenovo, Apple, Dell. Но победа будет не за теми или другими, а за ИИ-ассистентами. Борьба переместилась в совершенно другое измерение. Сейчас она идет за то, чтобы получить пользователя как пользователя данного ассистента. Ассистент все понимает, решает ваши проблемы заказа продуктов — от стирального порошка до музыкального контента, продуктов питания. А дальше происходит следующее. Этот ассистент теперь знает все про привычки человека, про его характер потребления. Ему не надо объяснять, что я имею в виду, когда я говорю «помидоры». Я имею в виду те самые помидоры, которые вот такие, а не такие. И когда я буду говорить: «Кстати, у меня закончились носки, я хочу еще дюжину носков, таких, которые я покупал в прошлый раз», система должна знать, какие это были носки, и, если они сняты с производства, она должна подобрать мне похожие. И такой персональный ассистент — это уже домашняя прислуга, с годами эта система уже все знает про болезни, про учебу, про детей, про отдых, про фильмы и музыку. И сменить теперь такого ассистента — это значит всему заново учить систему. Поэтому борьба за потребителя пойдет именно на рынке таких систем. А уже с холодильником какой фирмы он будет интегрироваться — вопрос вторичный».
  • «Мне кажется, что в какой-то момент количество перейдет в качество. Качество интеллекта у всех этих систем будет расти. Считается, что к 2030-2040 годам настольный компьютер сравняется по производительности с производительностью человеческого мозга. Получается, что в какой-то момент будет достигнута точка сингулярности, когда компьютер становится таким же умным, как человек, или умнее, а, значит, начинает создавать и обучать систему такого же класса. И начинается совершенно другая кривая роста. С теоретической точки зрения так должно произойти. Растет производительность? Растет. Если растет, достигнет когда-нибудь человека? Ну вроде, как достигнет (если атомная война не произойдет). А если достигнет, означает ли это, что компьютер начнет создавать новые системы лучше, чем может создавать человек? Вроде как означает».
  • «К сожалению, популяризация — неизбежный виток развития. Фастфуд много лет доминировал и продолжает доминировать, но теперь, когда люди поняли, что есть диабет, есть ожирение и другие смертельные заболевания, связанные с питанием, вдруг появилась органическая еда, появились органические рестораны. Появилось желание, к сожалению, не очень мощное со стороны потребителей, но, тем не менее, тот сегмент, которому это надо, очень лоялен, он готов платить больше, чтобы есть полезную еду. Мы пытались делать рестораны полезной еды, все провалилось. Не получается. В Америке чуть-чуть уже получается, и то только в таких регионах, как Кремниевая долина. Обществу нужно на 70% оказаться в проблеме ожирения, чтобы задуматься над этим. То же самое — ожирение мозгов. Junk food для мозгов, наверно, в какой-то момент приведет к каким-то проблемам в обществе, и тогда общество задумается».

Беседовали Петр Рушайло и Анастасия Горшкова

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+