1. 首页
  2. 资讯

佰联旅行网

2014年亚马逊首先发明了首个智能音箱Amazon Echo,此后智能音箱火遍全球,在美国大约有3600万用户每月会用到一次语音操控的音箱,巨大商机引来无数模仿者入局。根据2017年Voice L

2014年亚马逊首先发明了首个智能音箱Amazon Echo,此后智能音箱火遍全球,在美国大约有3600万用户每月会用到一次语音操控的音箱,巨大商机引来无数模仿者入局。根据2017年Voice Labs的报告,2015年发布的语音优先设备达170万台,2016年将达到650万台,2017年将有2450万台设备发货,市场总流通设备数达到3300万台。美国本土的战场上,根据第三方研究机构的数据,亚马逊占据76%的市场份额,总销量超过了1500万个,模仿亚马逊进入市场的谷歌,则获得了24%的份额。

除了谷歌,还有一大群跟风模仿者正在路上。比如索尼的LF-S50G内置了Google助手;苹果将在12月推出的Home pod,Facebook宣布将推出带触摸屏的智能扬声器,除了这些,还有 Anker的Zolo Mojo,Mobvoi的Tic Home Mini和松下的GA10等。

在国内,竞争同样激烈,天猫精灵、出门问问、京东的叮咚智能音箱A1、小米的小爱同学、喜马拉雅小雅等各路厂商竞相入局,甚至有了“深圳市南山区一公里内有112家智能音箱方案提供商”的说法,智能音箱无疑成为今年智能硬件市场的一大热点。

智能音箱为何成为新的移动端入口,它可以为我们做什么?

智能音箱并不仅仅是一个音乐播放装置,而是家庭消费者用语音进行上网的一个工具,语音功能的接入成为了想象力的关键。以亚马逊的Echo为例,除了播放音乐以外,还能通过Alexa控制其它家居设备,比如打开窗帘、设置冰箱温度、提前打开空调、提前让热水器升温等,另外还能为用户提供资讯查询,甚至能够使用语音创建购物清单、点餐等,这些功能成为了智能音箱背后想象力的源泉。

人工智能管家贾维斯

如果你看过《钢铁侠》,那么你应该对托尼•斯塔克的智能管家贾维斯印象深刻,一句口令甚至不需口令,贾维斯就能帮助钢铁侠处理好几乎所有的事情。而如今的智能音箱就可以视为低配版的贾维斯,其未来的发展方向是成为真正的贾维斯。

智能音箱的幕后英雄--语音识别技术

智能音箱的成功离不开其幕后英雄“语音识别技术”,这项技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术可以追溯到上世纪50年代,进入到2000以后语音识别技术飞速发展,近几年取了的巨大技术进步。

智能语音技术是人工智能应用最成熟的技术之一,显然随着语音识别技术发展成熟,语音优先应用的潜力将会越来越大,而语音应用和智能硬件将催生更多以语音为入口的场景,具有巨大的市场空间。根据中国语音产业联盟《2015中国智能语音产业发展白皮书》数据显示,2017年全球智能语音产业规模将首次超过百亿美元,达到105亿美元。中国2017年智能语音产业规模也将首次突破百亿元,五年复合增长率超过60%。

语音识别还能用再更多一些的场景中吗?

智能音箱让大众认识到语音识别技术更多的可能性,视美泰认为IoT物联网这个市场才是语音应用最重要的市场。IoT物联网将涵盖更多不同产品的层面,智能家居只是物联网的一个较小的应用领域。随着语音技术、人工智能的发展,所有联网的东西基本上都可能会有加上语音的这个需求。

视美泰智慧自助终端解决方案已启用人工智能+语音识别

以服务型智能自助终端为例,随着社会老龄化、劳动力短缺的情况日益严峻,无人化服务已成大势所趋,对智能自助服务终端的需求进入快速增长期,已陆续进入银行、电信、教育、医疗、交通、零售等多个领域。语音识别技术具备天然的自然、友好特质,在应用到智能自助终端后,人机交互更简单,进一步降低智能自助服务终端的使用门槛,进一步扩大使用人群,让包括银发一族的用户也能享受智能带来的便捷。

从使用场景来说,人工智能+语音识别将在家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等多个领域为人们带来更为便利的服务。

物联网时代语音识别要广泛应用还有这些问题待解决

1、口音和噪音

语音识别中最明显的缺陷之一是处理口音和背景噪声,尤其是很多物联网智能终端设备的使用场景是户外,对技术上的挑战更大。

口音和背景噪声是影响语音识别器识别效果的两个重要的因素,除此之外还有这些因素:

• 混响声音环境变化

• 来自硬件的artefacts

• 用于音频和压缩的artefacts

• 采样率

• 说话人的年龄

2、语义错误

在语音识别系统中,语义错误率是我们需要关注的重点。语义是否正确将关系到智能终端对他人话语的理解程度以及后续给出的反应是否正确。当将模型与人类进行比较时,检查错误的本质是非常重要的,而不仅仅是将答案视为一个确定的数字。从经验上来看,人类的转录要比语音识别器正确率更高。

本文来自投稿,不代表本站立场,如若转载,请注明出处。