Ваш маркетинг может работать быстрее, а клиенты – получать предложения, которые им нужны, тогда, когда они нужны.
Компьютер может очень многое, по крайней мере, что касается обработки информации. Однако, научить его естественному языку – крайне нетривиальная задача. Этот вызов лег в основу проекта IBM DeepQA, в результате которого родилась когнитивная технология, получившая название IBM Watson, в честь Томаса Уотсона, стоявшего у истоков образования IBM.
Объяснить, что такое Watson, несложно – это когнитивная система, способная общаться с человеком на естественном языке. То есть понимать письменную речь и отвечать так же. И если бы IBM ограничились этим, Watson остался бы не более чем экспериментальной установкой. Но для него быстро нашлась работа, и для многих компаний он стал поистине незаменимым сотрудником.
Оказалось, применить это ноу-хау можно везде, где требуется обрабатывать большие объемы неструктурированных данных. Для качественной и быстрой аналитики таких данных их требуется обрабатывать, используя весь доступный инструментарий современных компьютерных технологий: машинное обучение, компьютерная лингвистика, онтологические построения и высокопроизводительные вычисления. Именно для этого предназначен IBM Watson.
Ключевые умения IBM Watson можно свести в четыре пункта:
- Понимание естественного языка.
- Построение гипотез на основе обработанных данных.
- Обучение в процессе работы.
- Вынесение рекомендации, сопровождая ее фактами, на которых основан вывод.
Человек не способен за приемлемое время анализировать по-настоящему большой объем данных, и в любом случае ему придется отбросить большую часть информации, выделив, по его мнению, главное. Тут неизбежны ошибки, кроме того, отброшенные данные также имеют значение и должны влиять на результат. И в этом аспекте Watson многократно превосходит человека: он учитывает все, ни один известный факт не останется без оценки.
Первым публичным испытанием системы стало участие в американской игре Jeopardy! (российский аналог – «Своя игра»). Не имея подключения к Интернету, пользуясь открытыми источниками информации, такие как текст всей Википедии, общие энциклопедии и словари, Watson смог победить двух рекордсменов этой игры.
А еще Watson умеет готовить. Возможно, это первый в истории повар, который не способен попробовать свое творчество. Однако предсказать, как будут сочетаться ингредиенты блюда, оказалось вполне возможно и без вкусовых рецепторов – на основе теории сочетаемости компонентов различных продуктов. Watson изучил десятки тысяч проверенных кулинарных рецептов с сайта Bon Appetit, ему были заданы психофизиологическая модель вкуса человека и исчерпывающие сведения о химическом составе и физических свойствах компонентов блюд. Попробовать на вкус прогрессивные технологии можно, приготовив что-нибудь от «шеф-повара Ватсона» на том же Bon Appetit. Приятного аппетита!
«Пообщаться» с IBM Watson может каждый. К примеру, разработчики IBM создали страницу, на которую можно загрузить текст (на английском или испанском языке), и Watson проведет на его основе анализ свойств личности автора. К тексту применяются три различных модели личности, каждая построена на основе текстов из социальных медиа разных типов – блогов, форумов и Twitter. Психологи утверждают, что выбор слов при написании текста по любой теме позволяет весьма точно судить об интеллектуальной и эмоциональной сферах автора.
Коммерческая эксплуатация системы началась в медицинской отрасли, на должности врача-диагноста. Предварительно в течение двух лет IBM Watson изучал медицинские документы, усвоив около 2 миллионов страниц текста, после чего «заступил на службу» в нескольких больницах США.
IBM Watson помогает врачам ставить диагнозы и рекомендует оптимальный курс лечения. Во многих случаях точность его диагностики оказывается выше, чем у опытных врачей. Подтверждением этому стала статистика, собранная WellPoint – крупной американской компанией, оказывающей услуги медицинского страхования. В частности, по их данным, точность назначения оптимального лечения рака легких в американских больницах составляет 50%. Курс, назначенный IBM Watson, оказывается оптимальным в 90% случаев. Причем система дает ответ на любой запрос в течение нескольких секунд.
Конечно, никакая интеллектуальная система не способна полностью заменить человека, по крайней мере, пока. Но она способна помочь принять ему решение на основе взвешенной оценки фактов, а это крайне полезное свойство для многих областей деятельности человека, и не в последнюю очередь для бизнеса.
IBM Watson Content Analytics – решение для обработки больших объемов неструктурированных текстовых данных. Оно способно выделить из входной информации факты, найти между ними взаимосвязи, сделать выводы, и визуализировать их в удобной для заказчика форме. Отметим, что Watson Content Analytics понимает русский язык, в том числе в особенностях русской морфологии и работы с синонимами.
В качестве примера можно взять любую компанию с большим количеством клиентов, присутствующих в социальных сетях. Это может быть банк, оператор сотовой связи, ритейлерская сеть и так далее. Компания хочет знать мнение клиентов об оказываемых ею услугах, и иметь возможность оперативно реагировать на негатив.
Система, получив задание, непрерывно ищет упоминания компании в открытых источниках, автоматически определяя тональность сообщений, географию источников, авторитетность автора. Причем при анализе тональности Watson умеет определять в сообщениях сарказм. Вся эта информация сводится в отчеты, но при необходимости сотрудник компании может просмотреть исходные данные вплоть до отдельных сообщений с метаданными, собранными системой. Ценнейшей возможностью является автоматическое выявление наиболее важных и весомых сообщений, требующих непосредственной реакции компании.
«Однажды в рамках демонстрации технологии для силовой структуры мы настроили Watson Content Analytics на несколько баз данных с информацией по нераскрытым особо тяжким преступлениям, предоставленные заказчиком, – рассказывает Дарья Кобякова, эксперт по программному обеспечению ECM, IBM. – После применения определенных фильтров к этим данным, руководствуясь опытом сотрудников структуры, c помощью Watson Content Analytics была найдена важная зацепка, которая впоследствии сыграла решающую роль в раскрытии серийного преступления».
Отчеты Watson Content Analytics позволяют выявить корреляцию между любыми факторами – географией, типами услуг, биометрическими и социальными данными клиентов, вывести из этого точное заключение и принять решение. И, что важно, нет никакой задержки – система работает в реальном времени. А ведь это то самое свойство, которое в традиционных системах аналитики обходится дороже всего.
«Объемы неструктурированной информации растут колоссальными темпами, – говорит Дарья Кобякова. – В ближайшем будущем аналитики прогнозируют только ускорение темпов роста. Сегодня организации стремятся использовать неструктурированные данные для принятия бизнес-решений, но все сложнее найти действительно ценные сведения среди лавины разнородной информации. Watson Content Analytics поможет помочь превратить эти трудности в новые возможности для бизнеса».
Приглашаем Вас в клиентский центр IBM на семинар «Watson Analytics» и передовые технологии в области аналитики!
Регистрация обязательна: http://ibm.co/1N7uuck