• Марина Камертон

К 2022 году рынок речевых технологий вырастет до 12 миллиардов долларов США


Вектор развития технологии речевого управления. От слов к действию.


Компания MarketsandMarkets, ведущая исследования глобального финансового рынка, прогнозирует в ближайшие пять лет рост мирового рынка речевых технологий более чем на 300%. С 3,7 миллиардов долларов США в 2016 году до 12 миллиардов долларов США к 2022 году. По мнению экспертов компании, основным катализатором процесса роста речевых технологий стал спрос на голосовую аутентификацию в банковском и финансовом секторе, в правительственных организациях, учреждениях здравоохранения, а, также, в телекоммуникациях и B2C секторе. В 2016 году в Великобритании банк HSBC предложил 15 миллионам своих клиентов использовать голосовую идентификацию для доступа к онлайн-сервисам банка, что уменьшило время идентификации клиентов в 9 раз.

Разработки в области распознавания речи ведутся с середины 20 века, но широкое распространение получили лишь в последние годы. По оценкам экспертов компании Techcrunch за последние полтора года скачок развития в сфере голосоречевых технологий существенно превышает разработки в этой сфере за последние полтора десятилетия. Связывают это, прежде всего, со снижением стоимости внедрения и использования высокотехнологичных ресурсов.

Всё более активно развиваются технологии распознавания речи B2C-секторе в виде виртуальных помощников. Siri, Cortana, Google Now, Dragon Mobile Assistant, ANDY, Amazon Alexa, Robin, EVA Voice Assistant - это далеко неполный список голосовых ассистентов появившихся за последние пару лет. Скорость управления голосом в разы увеличивает скорость обработки и получения информации. По данным компании Google на май 2016 года голосовые запросы составили 20% от общего количества запросов на мобильных. По прогнозам компании ComScore, специализирующейся на анализе рынка интернет-технологий, к 2020 году голосовые запросы составят половину всех запросов поиска.


Большим прорывом среди голосовых ассистентов стал выпуск на рынок небольшой аудиосистемы со встроенным голосовым управлением Amazon Echo, связанным с облачным хранилищем. Воспринимая голосовые команды, гаджет реагирует на них, отвечает голосом на запросы пользователя, управляет календарём Google, воспроизводит аудио, управляет системами «умного дома» и другими связанными с облачным хранилищем и гаджетом приложениями. На данный момент гаджет можно приобрести не более чем за 180 долларов США.

Один из резидентов «Сколково» компания «ЦРТ-инновации» в 2016 году представила разработку, основанную на акустических моделях, связанных с глубокими нейронными сетями (Deep neural networks, DNN). Программа позволяет управлять голосом промышленным и строительным оборудованием, менять настройки и режим работы вентиляционных систем. Особенностью данной технологии является способность адаптироваться к конкретным сотрудникам на производстве и распознавать речевые особенности пользователя в условиях высокого производственного шума. По оценке специалистов компании «ЦРТ-инновации», данная технология в разы увеличит производительность труда и уменьшить случаи производственных травм.


Особое внимание речевым технологиям уделяется в автомобильной промышленности. Начиная от управления голосом навигатором и мультимедийными системами и заканчивая управлением при помощи голосовых команд беспилотным автомобилем. В 2018 году Камаз обещает представить беспилотный грузовик с внедрённой системой искусственного интеллекта и голосового управления от Яндекс.

Стоит отметить, что компания Яндекс активно ведёт исследования в области распознавания речи и активно разрабатывает системы голосоречевого распознавания. Система Yandex SpeechKit была использована для разработки «Елена 2.0» - виртуального консультанта компании Мегафон, помогающего клиентам компании разобраться с подключением и отключением тарифов и услуг, биллингом, переводом денег от одного абонента другому и прочими услугами. Возможно, «Елена 2.0» сейчас не может полностью заменить оператора колл-центра, но благодаря машинному обучению виртуальный консультант «Елена 2.0» в скором времени сможет в год принимать и отвечать на несколько сотен миллионов запросов и звонков, что существенно снизит нагрузку в колл-центрах.

Социально значимая разработка представлена компанией AVA. Стартап представил на конференциях Google и Apple мобильное приложение, преобразующее звуковые сигналы в визуальные образы. При помощи приложения с технологией голосоречевого распознавания слабослышащие и глухие люди могут видеть о чём говорят вокруг. Стоит отметить высокий потенциал технологии распознавания речи в помощи людям с ограниченными возможностями в социализации и взаимодействии с окружающей средой. Одним из первых приложений в этом сегменте было мобильное приложение SayShopping, разработанное для iPhone, позволяющее слепым и слабовидящим людям делать покупки в интернет-магазине исключительно посредствам голосовых команд.

С развитием технологий распознавания речи открылся новый огромный пласт рынка, с обширным полем деятельности.


© 2012-2020 Системный интегратор «Камертон Про»

  • Телеграм Камертон Про
  • Black Vkontakte Icon
  • Black YouTube Icon
  • Black Instagram Icon
  • Black Facebook Icon