Интервью с Генеральным директором компании Интервью с Генеральным директором компании
ПОДПИСКА НА РАССЫЛКУ



Интервью с Генеральным директором компании "Центр Речевых технологий" Михаилом Хитровым

В 2010 году российский разработчик "Центр Речевых Технологий" отмечает 20-летний юбилей. За минувшие годы компания не только представила ряд выдающихся разработок, используемых в крупных отечественных проектах, но и добилась успеха на международных рынках.

О текущих проектах, планах на будущее и многом другом мы говорим с Генеральным директором компании Михаилом Хитровым.
CCW: Михаил, как Вы оцениваете уровень развития современных речевых технологий?
Михаил Хитров: Прежде всего следует отметить, что речевые технологии — это большая область науки. Она условно делится на два вида технологий — языкозависимые технологии и языконезависимые. Языкозависимые — это технологии, для которых важен контент (содержание) разговора, такие как это синтез речи (воспроизведение компьютером текста) и распознавание речи, (понимание компьютером речи). Что касается языкозависимых технологий, то уровень их развития зависит от уровня технологий, имеющихся для каждого конкретного языка. Например, для английского языка эти технологии и рынок их внедрений чрезвычайно развиты, и представить жизнь в западных странах без речевых технологий практически невозможно. Скажем, при звонке в банк нет необходимости ждать, когда освободится оператор, а можно получить информацию из системы голосового самообслуживания. Также речевые технологии используются в разных областях, это развитая многомиллиардная индустрия.

В России эта индустрия развита не так сильно. Технологии синтеза русского языка вышли на промышленный уровень только в прошлом году. На сегодняшний день на рынке существует всего несколько компаний, которые способны на качественном уровне предоставлять услуги по организации систем голосового самообслуживания на русском языке. ЦРТ - единственная компания, которая разработала свои технологии синтеза и распознавания русской речи и предлагает их как комплексное решение для систем голосового самообслуживания. То есть если на Западе нет ни одного крупного банка, в котором не было бы такой системы, то в России на сегодняшний день их единицы. Кстати, представители одного из банков, оснащенных нашей системой VoiceNavigator, рассказывая на презентации Call Center Expo Forum о внедрении системы СГС, заявили, что они не обманулись в своих ожиданиях. Здесь существует понятный расчет ROI, и это очень выгодное вложение для клиентов, потому что расходы на СГС быстро окупаются, позволяя не только сократить расходы, но и повысить управляемость процессов, повысить управляемость систем CRM, повысить качество обслуживания клиентов.

Внедрения на рынке СГС только-только начинаются, Вспомните, когда появился DTMF, люди начали учиться работать с тоновым набором. Так и сейчас потребуется время, чтобы люди привыкли общаться голосом с машиной. От разработчиков будет необходимо и определенное искусство разработки голосовых меню, так, чтобы людям было приятно и комфортно общаться с системой, а система спрашивала их так, чтобы пользователь правильно отвечал на поставленный вопрос. В ближайшие годы мы ожидаем рост рынка систем голосового самообслуживания в России. И понятно, что ЦРТ будет продолжать занимать на нем лидирующие позиции.

Что касается языконезависимых технологий, то к ним относятся речевая аналитика и речевая верификация и идентификация, которыми мы тоже активно занимаемся. Очень важная тема исследований — это верификация по голосу, хотя она не так пока распространена в мире, как IVR, Если говорить о ЦРТ, то мы специализируемся на сложных системах, в частности, на системах голосовой идентификации, где нужно сравнивать не один образец с одним образцом, а один образец с миллионами. Мы делаем и внедряем такие сложные системы, в частности, сейчас мы завершили установку первой в мире системы голосовой идентификации национального масштаба в Мексике. Это крупнейшее в мире внедрение, которое по отзывам специалистов должно дать толчок развитию этого сегмента во всем мире. Фактически, ЦРТ своими руками создает новый сегмент мирового рынка.
CCW: Перечень применения речевых технологий очень широк, какие сферы освоены ЦРТ на сегодняшний день?

Михаил Хитров: Помимо систем голосового самообслуживания, о которых уже было сказано, можно упомянуть технологию Data Mining — поиск ключевых слов, которая очень важна в тех же контакт-центрах, где необходимо контролировать качество работы операторов. Скажем, оператор должен поприветствовать человека, попрощаться с ним, обязательно предложить ему какой-то набор услуг. Используя нашу технологию поиска ключевых слов VoiceDigger, мы можем построить систему, которая будет отслеживать в реальном времени качество работы операторов: она может в потоке речи определять, сделал ли оператор те или иные определенные регламентом действия. Также мы сейчас заканчиваем работу над модулем определения эмоционального состояния звонящего. Это очень интересная разработка, можно сказать, уникальное решение, которое позволит контакт-центрам собирать статистику того, в каком эмоциональном состоянии им звонят люди. Для анализа рынка, для маркетинговой работы это очень полезная информация. И таких разработок у ЦРТ будет все больше и больше, потому что у компании есть крупный научный центр, и мы способны делать разработки как в целом для рынка, так и под конкретного клиента.

Среди сфер применения речевых технологий можно отметить диспетчерский рынок. Сейчас мы выполняем проект для крупнейшей в России транспортной компании. Также внедрение систем голосового самообслуживания в государственных органах позволит более качественно и быстро предоставлять информацию населению. Можно сказать, что нами освоены практически все области применения наших технологий. Тот пре-сейл, который мы сейчас проводим, охватывает все сферы — от органов государственной власти до служб вызова такси. Что важно, есть встречный интерес со стороны рынка, и для каждого обращающегося клиента мы всегда находим точку применения речевых технологий конкретно для его бизнеса.
CCW: И все таки, действительно ли внедрения речевых технологий в инфраструктуру контакт-центров способны приносить деньги вашим клиентам, или же это скорее дань моде на инновации?

Михаил Хитров: Если говорить о речевых технологиях вообще, то здесь главное отметить, что спрос на них обусловлен потребностью в эффективном интерфейсе управления всевозможными автоматизированными процессами: будь то некий мобильный пользовательский девайс – телефон, смартфон, КПК, сложный комплекс устройств вроде "умного дома", сетевой терминал, банкомат, система управления складами WMS, веб-портал или же, наконец, система голосового самообслуживания контакт-центра. В то время как клавиатуры и прочие устройства ввода команд в таких системах достаточно разнородны (для разных типов систем) и порой требуют определенной сноровки и мастерства, речь – универсальна. А голосовые диалоги с автоматизированными системами не требуют от пользователя исключительных способностей вроде ловкости использования 107-кнопочной клавиатуры или способности разглядеть на солнце с миниатюрного экрана логическое меню управления, зачастую написанное достаточно мелким шрифтом.

Если же говорить конкретно о контакт-центрах, то в них речевые технологии играют особую роль. Бизнес контакт-центра построен на способности в короткие сроки качественно обслуживать большой поток входящих и исходящих вызовов. В этом смысле речевые технологии исполняют роль системы оптимизации и стандартизации качества обслуживания. Оптимизация происходит за счет замены операторов первого уровня обслуживания на рабочие серверы, не требующие заработной платы. (Первый уровень предназначен для классификации проблемы и маршрутизации звонка компетентному лицу второго уровня или же предоставления справочной информации). В то же время на базе СГС возможно построить дополнительные сервисы вроде авторизованного доступа к балансу лицевого счета или текущему статусу заказанной предварительно услуги. Стандартизация качества обслуживания происходит за счет возможности заранее предсказать поведение системы в зависимости от различных факторов обслуживания, чего нельзя сказать о людях, которым свойственны колебания настроений, каких-то внешних факторов, мешающих работе и т.д.
CCW: Система голосового самообслуживания для контакт-центров VoiceNavigator была удостоена премии "Продукт года" в рамках CCWF 2010. Какие основные преимущества дает использование этой системы?

Михаил Хитров: Если говорить о продуктах-заменителях, традиционных системах IVR, построенных на тональном наборе, то главным преимуществом VoiceNavigator является нелинейность логики. Клиент, общаясь с СГС может строить диалог по наиболее релевантному для него сценарию. Данный факт, несомненно, отражается на имидже компании и росте лояльности ее клиентов.

С точки зрения прямых конкурентов – западных вендоров речевых технологий, несомненным преимуществом является тот факт, что русский язык является родным для сотрудников компании. Вряд ли хоть одна западная компания может похвастать наличием в своем штате такого количества лингвистов, алгоритмистов, специалистов по VUI (voice user interface), специалистов по внедрению и технической поддержке таких систем (не говоря уже о продавцах и маркетологах), говорящих и думающих по-русски. Все это отражается на качестве синтеза и распознавания, на возможностях тонкой настройки диалоговых меню под конкретного клиента.
CCW: Как было написано в одной из публикаций, ЦРТ удается добиться успеха не только в разработке, но и в продаже собственных решений. На Ваш взгляд статус отечественной разработки скорее помогает или мешает?

Михаил Хитров: Действительно на сегодняшний день наши решения внедрены более чем в 64 странах мира, и по этому показателю мы одни из мировых лидеров. На самом деле, те технологии, которыми мы занимаемся, уникальны и очень сложны, и поэтому у них нет большого числа конкурентов. В мире существует всего несколько компаний, способных разрабатывать подобные технологии. Конечно, нам иногда бывает трудно на международных рынках, потому что, скажем, наши европейские конкуренты имеют хорошую поддержку от государства, а ЦРТ - независимая компания. Те не менее, мы действуем очень успешно, проводим крупные внедрения по всему миру, и в Центральной Америке, и в Европе, и в Азии. Сейчас мы планируем активно выходить на американский рынок. Здесь нас очень выручает то, что у нас диверсифицированный продуктовый портфель, и мы способны выходить именно с тем предложением, которое интересно на данном географическом рынке. Мы стараемся, чтобы тот факт, что мы из России помогал нам, и есть регионы, где это действительно так.
CCW: Ваша компания реализует проект "Единый голосовой портал Санкт-Петербурга", значимость которого трудно переоценить. Расскажите, пожалуйста, на какой стадии развития находится проект в настоящее время, каковы трудности и перспективы?

Михаил Хитров: Еще в 2009 году, когда "Единый голосовой портал Санкт-Петербурга" был представлен на конкурс проектов для нужд городского хозяйства, на него было обращено внимание правительства Санкт-Петербурга, и он занял почетное третье место. В 2010 году компании ЦРТ было предложено поработать с двумя государственными структурами для понимания перспектив внедрения инновационного решения VoiceNavigator для обслуживания обращений граждан. В первую очередь это Комитет по здравоохранению Правительства Санкт-Петербурга, медицинский информационно-аналитический центр. Основной задачей системы является предоставление информации о расположении мед. организаций, наличии лекарств в аптеках, о приеме врачей в городских мед. центрах и т.д. Также систему планируется "обкатать" в Многофункциональном центре предоставления государственных услуг для выдачи различных справок, назначения соц. пособий, выдачи субсидий и т.д. К концу 2010 года компания ЦРТ планирует представить рабочую версию системы голосового самообслуживания для одного из представленных ведомств для демонстрации потенциальных возможностей системы.

Если говорить о сложности проекта, то в первую очередь хочется упомянуть об огромном количестве государственных услуг и названий различных лекарств, которые наша система должна распознавать и синтезировать естественным голосом, при общении с гражданами. Также, построение такое масштабной системы голосового самообслуживания влечет за собой новую систематизацию информации и представление ее жителям Санкт-Петербурга в виде "единого окна". При этом, то, каким образом поступил запрос в систему – через Единый голосовой портал Санкт-Петербурга или через Web-портал соответствующего ведомства, уже не должно влиять на процедуру его обработки.
CCW: Действительно ли применяемые компанией технологии позволяют рассчитывать на использование портала теми категориями граждан, которые обычно далеки от технических новинок? Или же пользователи просто не замечают ничего необычного?

Михаил Хитров: Наша основная задача – сделать общение с системой простым и естественным для всех социальных слоев нашего общества. Мы заметили, что люди, впервые звонящие в компании, где развернута система голосового самообслуживания не всегда сразу замечают, что они путешествуют по меню и управляют навигацией только с помощью своего голоса. Ведь это и есть естественный язык общения для человека.

Стоит также заметить, что не во всех пригородах Санкт-Петербурга доступ в Интернет есть у всех граждан, а телефонные аппараты обладают функцией тонального набора. Наша система VoiceNavigator способна принимать обращения граждан даже из самых отдаленных уголков нашего региона и страны.
CCW: Расскажите, пожалуйста, немного о других значительных проектах, например, об использовании решений ЦРТ в библиотеке им. Ельцина и РЖД

Михаил Хитров: Библиотека президента – по-настоящему инновационный проект. Он буквально напичкан новыми технологиями, и в частности речевыми. В данном проекте мы смогли решить целый ряд задач с помощью наших разработок.

Например, с помощью системы поиска в медиа архивах можно быстро найти записи определенных людей, имея образец их голоса (речь президента или выступление артиста). Более того, запись можно очистить от шума и улучшить ее качество, а затем, если нужно, перевести в текст с помощью специальной программы-транскрайбера. Поиск в медиа архивах может осуществляться и по ключевым словам и словосочетаниям. Работать с текстовой информацией помогает технология синтеза речи, которая естественным голосом может озвучить любой текст. Для доступа к закрытой информации применяется биометрическая система верификации по голосу. Мы рады, что нам удалось осуществить столь масштабный инновационный проект, к тому же еще и социально значимый. Что касается РЖД, то для них мы разработали систему "Регламент", основанную на технологиях распознавания и синтеза речи. Система применяется для обучения машинистов поездов на специальных тренажерах, моделируя различные варианты типовых переговоров машиниста с другими служащими. "Регламент" распознает речь машиниста во время переговоров и сверяет ее с заданным шаблоном, а потом с помощью синтеза речи моделирует ответ. Если в ходе переговоров были допущены ошибки, система сразу сообщит об этом.

Надо заметить, что необходимость такой системы была продиктована жизнью. Любая работа на железной дороге предполагает наличие повышенной ответственности за безопасность людей. При этом зачастую халатность персонала и незнание регламента переговоров приводит к плачевным или даже трагическим последствиям. Наша система помогает обучить машинистов и оценить качество их работы, а значит содействует повышению безопасности на железной дороге. Идея оказалась по-настоящему востребованной и сейчас мы ведем ряд переговоров о внедрении подобных систем для других заказчиков.
CCW: Вы могли бы вспомнить какой-либо курьезный случай из своей практики, связанный с речевыми технологиями?

Михаил Хитров: Например, был случай связанный с технологией установления личности по голосу. в конце 90х годов к нам обратился один коллекционер с якобы неизвестной концертной записью песни Высоцкого. От нас требовалось установить подлинность. К сожалению, коллекционера пришлось разочаровать. Хотя на слух исполнение было очень похоже на голос Высоцкого, экспертиза показала, что пел Никита Джигурда.
CCW: Михаил, ЦРТ был основан Вами 20 лет назад. Вы не могли бы поделиться с читателями CCW предысторией - как Вы пришли к мысли о создании отдельной компании, какие основные трудности пришлось преодолеть?

Михаил Хитров: Компания была создана мной в 1990 году совместно с командой единомышленников, профессионалов в области электроники, программирования, большинство из которых, раньше работали в отделе спецакустики НПО "Дальняя связь". Было решено работать только в области высоких технологий, ни при каких обстоятельствах не отклоняясь в сторону пусть выгодных, но неинтересных проектов. Этой идее нам удается следовать и по сей день. Понимание того, как нужно работать в условиях нового времени, приходило постепенно. Трудностью в являлось и то, что многие продукты и технологии ЦРТ были новаторскими для своего времени. Изначально разработчикам требовалось и самим понять, какие программы нужны, и объяснить это своим клиентам. Тем не менее, на фоне бедственного положения науки в стране, нам удалось собирать под свое крыло высококвалифицированные кадры. Благодаря этим специалистам сейчас компания имеет гигантский научный потенциал и намного опережает своих конкурентов, в частности, по технологиям распознавания и синтеза речи.
CCW: За эти годы пройден огромный путь от небольшой команды разработчиков до крупного коллектива, завоевавшего лидерство как на отечественном, так и на зарубежных рынках. Какими достижениями компании Вы более всего гордитесь, каковы дальнейшие планы развития?

Михаил Хитров: ЦРТ — это пример успешной инновационной компании в России. Мы одна из немногих российских компаний, которая является в своей сфере одним из мировых лидеров, предлагая лучшие в мире решения. Часто получается так, что в своей области сотрудники Центра речевых технологий являются и представителями России за рубежом. Потребители не говорят "ЦРТ приехал", а говорят — "русские приехали". И по тому, какой продукт эти русские привезли, какие люди приехали, как они умеют общаться, судят о всей стране. Мы - те самые люди, по которым судят о современной России. ЦРТ — это ученые, которые создают передовые технологии, это продавцы, которые легко говорят на разных языках, смело рассуждают о сложных научных понятиях. Можно сказать, что это элемент патриотизма в работе компании. Мы представляем Россию за рубежом, и мы это делаем достойно!
CCW: Михаил, позвольте поздравить Вашу компанию с юбилеем и пожелать новых побед!
 27-06-2010Версия для печати
Пресс-центр  ::  Предложение и спрос  ::  Проекты и решения   ::  Анализ и синтез  ::   Наш спонсор   ::   Советы специалиста   ::   Форум   ::   Карта сайта
© 2002 Все права и материалы принадлежат "BELTEL"
    RSS     Rambler's Top100
191025 Санкт-Петербург, ул. Маяковского, 3Б лит. А.
тел. 7 (812) 303 9120 факс 7 (812) 303 9121
e-mail: callcentre@beltel.ru