零售亚美娱乐>零售>其他>正文

亚美娱乐电商热点秒更新

叮咚魏强:智能音箱出货量破100万是个门槛

作者: 亚美娱乐来源: 亚美娱乐2017-08-02 06:01:46

【亚美娱乐讯】智能音箱虚火很旺,BAT巨头高调的发布会与深圳华强北惨淡的出货量形成强烈对比。承载着家庭消费场景入口和语音交互颠覆式革命两大重任,智能音箱似乎显得心有余而力不足。目前,市场上的智能音箱出货量真相很惨淡,很多智能音箱在产品介绍里号称可以实现购物等几十项功能,但实际上能成熟应用的功能主要限定在语音点歌、语音播报天气、百科信息检索等,并没有想象中的那样智能。

灵隆科技CEO魏强预测,智能音箱市场从探索期到成长期,100万台是一个关键点。这是决定这个市场能够走向成熟的关键一步。

作为国内最早一批智能音箱的实践者,灵隆科技由京东商城和科大讯飞合资成立,京东方面负责叮咚音箱的全面运营和产品,科大讯飞则提供语音交互技术。对于智能音箱当前面临的尴尬,技术上的瓶颈,未来的方向,魏强从一个资深的从业者角度深入浅出的拨开了笼罩在智能音箱头上的那些迷雾。

图注:灵隆科技CEO魏强

以下是亚美娱乐注册动力与灵隆科技CEO魏强对话内容整理:

亚美娱乐注册动力:从苹果的siri到今年百度、阿里都发布了自己的智能音箱,市场看上去很火。但现实生活场景中,语音这种交互技术似乎还离我们期待的替代遥控器成为交互手段的目标还很远。您怎么看现阶段语音交互技术的发展阶段?

魏强:人工智能自2006年提出深度学习神经网络,到2012年开始商业化,带来了一波巨大的飞跃。总体来说,语音识别比图像识别略微成熟一点。语音是一维的,图像是二维的,信息量更大,基本人类获得信息的80%都来自于图像。

语音现在面临的问题是,它可能在一个领域或者一个应用场景下基本够用,比方点歌、问天气预报。但如果一旦把领域扩展,又可以预报天气又可以买东西的话,要对应的句式就特别多,准确率就会一下子降低。

一句话的话到底是控制家电还是点歌,还是查一个信息?智能音箱能否准确判断?放在一个细分的知识背景里,准确率会很高,一旦植入的场景越多,准确率是急速下滑的。

例如,你直接对叮咚说刘德华三个字,到底是想听刘德华的歌还是了解这个人的介绍?很难区分。现在的做法是根据用户的使用记录推荐使用率高的场景,比如通常听音乐占比比较高,优先推荐歌曲。

目前技术上,将声音识别成文字不是门槛,但对文字识别理解再反馈回来就比较难一些,主要困难在这一块。另外,各种噪声环境、中英文混杂、普通话不标准等都会影响听不准。此外,如何让音箱反馈的声音听得舒服,也是一个体力活,需要找到好的音色语音合成。

亚美娱乐注册动力:您刚才提到在一些场景下语音识别相对比较成熟了,可以举一些目前来说在您心中比较成熟的应用吗?

魏强:叮咚音箱主要在三个领域做的不错:一个是点歌,我们拿到所有歌曲的可检索信息,训练后已经做的比较好了;第二个领域是百科信息类查询,像天气预报、问个地名、名人介绍等等,我们用的是百度的信息源,训练后识别也很好;第三是智能家居控制,打开灯、打开电视等控制。

这三块我们整句的识别准确率能达到95%。

亚美娱乐注册动力:95%的准确率感觉好像挺高的,但实际我用过科大讯飞的语音转文字听过录音,语音转录文本跟人工速记还是很有差距。

魏强:这个就是我刚才说的那个最大问题,语音识别包括声学模型和语言模型,如果完全在自由开放领域里,比如开放式聊天的时候,机器就没有背景去抓住你这个模型是什么。但如果系统事先知道你可能是在点播歌曲,领域就能够限制到非常小,识别率就会提高。

所以现在我们不做全开放的领域,主要集中在点播歌曲、控制家电和问一些最基本的信息。在大多数情况下,这些已经能够提高用户使用这个产品的体验。

我觉得泛领域的语音识别准确率应该能到80%以上,如果在比较安静的情况下,保持比较低的语速,普通话比较标准,准确率会有很大提升。语音识别涉及到很多因素,因为它都是数字信号处理,识别的准确率有时候跟每个人的音调和音色都有关系。我们还遇到一个情况,有个用户有点口吃,他对我们的音箱怎么叫都唤不醒,这都是很现实的问题。

亚美娱乐注册动力:除了京东的叮咚,天猫、百度都进入了智能音箱战局,市场很热,但作为一个目标用户,我似乎还没有感受到买的必要性,语音识别似乎还没有到当年苹果推出触控屏幕替代键盘的商业化爆发点。

魏强:目前我觉得是还没有。我们对这个问题是这样看的,技术的层面永远不可能达到百分之百,达到苹果应用屏幕触控那样的准确率。毕竟人在互相交流的时候信息传递也不是百分之百的,也有听不清,它是一个不断交互的过程。其实我们也是沿着这条路走,在技术上达不到的情况下,通过产品之类去弥补,比如通过限定领域。

如果要达到很多人向往的那种随意的自然交互,需要技术的发展,但技术发展又依赖于大量的数据、大量的场景支撑。

亚美娱乐注册动力:在语音识别技术层面,都是大公司在玩,除了科大飞讯这样纯技术背景的已经有规模的公司,BAT也都押宝人工智能,推出了各自的人工智能系统,百度的DuerOS、天猫的AliGenie,对这些大公司来说,拼的到底是什么?

魏强:前两年大家拼算法,拼有几个大牛人。如果把时间轴拉长话,最终实际上是数据,比如大家很快都能够投入足够多的技术人员能够达到90%的准确率,但再往上提升就要不停的用数据来训练,这个就涉及到要采集足够多的数据。

从长期的角度来说,搞综合性系统,像语音识别一整套系统的公司更有竞争力,但这并不意味着小公司没有机会,小公司可能在把某一个领域做精做专,比如把出行领域里的语义理解做到最好,这一块的数据做到准确率最高,就可以介入其他系统。

亚美娱乐注册动力:国内智能音箱没能像亚马逊Echo一样快速起来的原因是什么?

魏强:亚马逊的成绩来自几个方面:第一,从市场环境来看,相对美国是全民对新产品新技术热度比较高,国内在行业内好像很热,但其实你跨个行业可能就完全不关注。第二,和音乐市场的整体局势相关。国内听音乐是免费,美国的音乐收费体系很完整。第三,亚马逊可以快速起来,有一些推广补贴,比如亚马逊的Prime会员购买echo只要99美元,是市场价的一半,购买了音箱还能用亚马逊的很多免费内容。

国内用户仍然有听音乐的需求,但可能主要通过手机来听。智能音箱对市场的教育还不够,产品包括生态还不够完备,体验做得不是非常好。

亚美娱乐注册动力:感觉除了苹果在强调音质效果,目前智能音箱对于音质本身的强调并不多,这是不是背离了音箱的核心定位?

魏强:智能音箱这四个字更多是一个代名词,现在直接给普通用户说语音助手或者交互产品,可能理解不够形象,只能靠智能音箱来传递。实际上智能音箱和音箱是完全不一样的东西,亚马逊的Echo也没说是智能音箱,它的产品介绍是语音助手。

我们想做的是以音乐这样一个最基本的功能去触达用户,让用户知道语音交互,但在触达用户的时候,强调的并不是这个音箱可以放音乐,而是可以通过语音的方式和它交互来放音乐。

这是一个引子,通过音乐话题引到新型交互方式上,同时把这种新型的交互方式向外进行扩展。走的是一个迂回的路线。

亚美娱乐注册动力:走了两年你觉得这条路通了吗?

魏强:至少从亚马逊Echo走的结果看证明是可行的。从它后台的活跃度来看,用户播放音乐只占60%,其他像闹钟、百科信息类的使用已经占到40%的水平。

国内的话,需要一个教育过程,目前为止内容还没有搞得特别清楚,所以功能往外扩展的时候也需要时间。现在真正认认真真做智能音箱的并不多,涉及到后台很多规范,比如光一个购物,要和后台的各种数据完全交互,是一个需要不断测试完善的过程。

未来还要看大家投入资源和干这个事情的决心,特别是巨头干这个事情的决心,如果真像Echo这样推,可能很快就会促进市场的成熟,但如果大家都试试水的态度,很有可能跟谷歌眼镜似的热闹一下就过去了。

亚美娱乐注册动力:大家都在说智能音箱是智能家居的入口,但我个人感觉家庭场景不一定如手机一样就一个入口,更可能是一个分布式入口形态。

魏强:是这样的,但这是一个过程,你说是未来趋势,用户终极的体验肯定是随处说一句话,相应的家电产品就能识别指令。但在短期内,要达到分布式的系统,无论从技术层面还是在整体的系统层面,都存在瓶颈和门槛。所以大家的做法刚开始是由一个中心,然后慢慢的往多个中心去做。

亚美娱乐注册动力:如果国内的音箱市场本身不像国外那么好,为什么不直接通过电视、冰箱等其他的产品直接来测试推动语音交互,而非要选择音箱。

魏强:当时选择音箱考虑的主要还是一个存量问题,空调、电视这些产品的更换成本更高,市场普及率也已经很高,价格竞争已经很激烈,让用户为了体验一个语音交互功能更换这些产品很难。而音箱的市场占有率在国内不高,成本也相对更便宜,用户买来尝试一个新功能更容易。

现在很多电视也有打开灯光开关的语音控制功能,但每个设备植入语音交互都需要单独去适配。比如植入空调里,空调开机的时候会有噪音,就需要解决噪音问题。植入电视,电视播放的时候节目本身有声音会干扰,怎么解决?

亚美娱乐注册动力:京东叮咚音箱上市也两年了,产品有哪些重要的迭代?

魏强:第一,对家庭各种各样的噪音环境下,我们的唤醒率得到了很高的提升。第一批产品的唤醒率大概85%,经过几次迭代,我们现在能够达到90%以上;第二,交互层面,一开始我们有很多提示音,用户反馈太啰嗦,在这个层面进行了不少优化;第三,为了增加产品使用活跃度,我们增加了一些服务,比如英语教育的内容。叮咚刚开始推出来的时候很多小孩使用,但我们后台的内容不适合小孩,后来我们就增加了很多适合小孩的内容。

亚美娱乐注册动力:今年叮咚目标出货量是多少?您判断整个市场会到什么量级?

魏强:我们有一个非常大的目标,增长是去年的十倍以上。中国市场的智能音箱出货量达到100万是一个门槛,说明这个事情走向了一个成长阶段,今年大家加起来有可能实现。

智能音箱还处于一个萌芽阶段,要靠最初的这一拨人去打造各种使用场景,比如洗澡的时候听音乐、厨房的场景。而打造这些场景需要企业之间或者各个生态链上的企业互相联合,这个非常关键,如果大家没有形成联合,很有可能就会重蹈以前很多类似产品的覆辙。最后技术很好,但没有解决用户痛点,导致产品不被消费者买单

亚美娱乐电商资讯第一入口

亚美娱乐注册年度新闻榜单,等你来揭秘!




打开微信“扫一扫”,分享给朋友和朋友圈

头条推荐

专题 更多

回顾|2017亚美娱乐注册未来零售大会
简阳农产品亚美娱乐电商宣传专题
回顾|2017亚美娱乐注册社交亚美娱乐电商峰会
回顾|2017中国移动亚美娱乐电商年会

亚美娱乐电商会议 更多 商学院 思路汇

服务罗盘

提升汽车养护服务品质 途虎养车推出“马上装”服务

行业视点

一款农产品小程序家里美味,使订单量提升50%的秘籍

行业视点 2018-01-17

从“跳一跳”来看微信小程序的未来

服务资讯 2018-01-18

一款农产品小程序家里美味,使订单量提升50%的秘籍

服务资讯 2018-01-18

为你揭露2018微信公开课pro的12个重点

服务资讯 2018-01-17

亚美娱乐电商服务推荐

更多>
  • 海外推广

  • B2C商城

  • 服务器托管

  • 跨境出口代运营

干货 更多

马蹄社
  1. 新浪微博
  2. RSS订阅
亚美娱乐注册官方app
亚美娱乐注册
亚美娱乐注册官方微信
“亚美娱乐”

下载亚美娱乐注册App使用独家功能

  • 一线实战高手-解答问题
  • 热门亚美娱乐电商峰会-随时报名
  • 亚美娱乐电商创投资讯-实时直播