侵权投诉
订阅
纠错
加入自媒体

语音交互智能化加速 思必驰出击智能语音市场四大杀手锏

2015-08-03 11:19
冷血の爱
关注

  思必驰,这家曾经专注于 2B 业务的创业公司在转型 2C 业务后,选择通过构建智能硬件语音交互平台的形式开始了新的长征。你可能没听过思必驰的名字,但你应该对小智音箱、inWatch 智能手表、索尼智能手环以及欧瑞博智能家居产品有所耳闻,而这些智能硬件明星产品的语音交互均采用思必驰的系统。

  在 7 月 29 日举行的发布会上,思必驰也首次对外公布了自家颇引以为傲的智能语音交互新技术,其核心要点包括:

  1.远场、抗噪技术上的突破,可以从根本上解决智能语音交互在应用场景上的限制,从而让人不受外界环境,更加畅快地使用智能硬件上的这种新交互。

  例如你想在车上通过语音来拨号,这时 90% 的语音识别率是没有意义的,因为外界环境的噪杂已经严重干扰到了设备的正常录入。诸如此类的环境下,没有对周围噪音的过滤机制,智能硬件是没办法通过语音来进行交互的。

  2.更好的回声消除算法和麦克风阵列算法结合,可以在降低硬件条件的同时,实现更高质量的语音识别,提升识别速度与准确率。

  3.基于统计的参数化语音合成方法,可以实现语音模型规模的压缩以及语音连贯性的提升,而且能够更加自由地合成个性化的语音。

  4.多轮交互和根据上下文的语义解析,可以对用户体验进行系统设计和优化。

  前 3 点都是在对语音识别、合成进行技术突破,第 4 点则涉及到更为高阶的机器认知能力的培养上。要让语音交互在智能硬件上发挥更大作用,机器本身就一定要能理解用户的自然语言,而不只是在“刻意配合”的理想稳态下才能进行“沟通”。例如在用户语言打断等非流畅表述情况下,智能语音交互系统就要有自我的适应和纠错机制来保证录入信息的相对准确性,而不是让用户一而再再而三地去纠正和复述。

  所以,要让语音交互真正在智能硬件上发挥作用,除了语音识别和合成,就一定涉及到智能语音系统的认知能力,要让机器能够理解人的自然语言,明白主人的真正意图。俞凯表示:

  思必驰的目标是打造一个真正具有认知能力的人机交互界面。通过获取、理解、学习,从而进行语义计算,通过识别适配以及上下文和情境的理解,并且可以在打断、容错、纠错的情况下,完成用户的意图。

  思必驰公布的这四大核心技术解决了语音交互在智能硬件应用上的几大痛点。按照官方说法,思必驰在这些技术方面均处于世界领先地位。作为思必驰这家技术公司出击智能语音市场的杀手锏,这四大核心技术将在智能家居、智能车载、智能穿戴以及机器人等智能硬件产品上帮助消费者更好地进行语音交互。

  相比百度、科大讯飞等巨头公司的大战略,思必驰专注于智能硬件语音技术平台的提供,不做终端产品。值得注意的是,思必驰不仅可以为硬件合作伙伴提供人机交互的能力,还可以将云端人机语音交互的数据提供给合作伙伴来共同进行用户行为的分析和用户体验的提升。

  “当务之急是先把这块蛋糕共同做大”

  国内智能语音市场愈加热闹,科大讯飞联手京东推出了可语音控制的叮咚智能音箱,百度语音开放平台正在与百度的海量内容进行深度融合,出门问问的语音智能借由自家手表 Ticwatch 的推出实现了软硬件的高度一体化。名头更小的思必驰怕不怕这些大牌友商呢?

  思必驰 CEO 高始兴表示,智能语音市场很大,而思必驰只想做好智能硬件上的语音交互系统这一个小点,其他诸如面向企业提供技术支持、搭建语音服务生态等大方面还是留给大公司去做吧。

  智能硬件产业处于发展早期,语音交互技术和生态也不完善,没有一家公司能够独食,包括巨头公司,智能语音市场还远远没到竞争的阶段。高始兴认为,业界同行当务之急是先把(智能语音)这块蛋糕共同做大,来共同推动智能语音新技术的全面落地。

<上一页  1  2  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号