侵权投诉
订阅
纠错
加入自媒体

对话黄伟:解读中国智能语音技术未来

2015-04-06 00:33
龙凰
关注

  逆势而上,他赌一个语音交互的无先例;顺势而为,他搏一把智能愿景的新未来。

  说来奇怪,语音交互这个由人类语言延展出来的物种,总因为技术高深和市场边缘被束之高阁。

  黄伟和他的团队,是迷雾中的那盏灯,即便摇曳,却能从罅隙中拽出一团光亮。

  难说语音交互的基础普及,但就其深入浅出之势,是谓解语。

  ——编者按

  黄伟,2004年毕业于中国科学技术大学电子科学技术系,专攻信号与信息处理,获博士学位。2006年获得上海交通大学生命科学技术学院博士后。毕业后任职摩托罗拉中国研究中心资深研究员,开发出世界第一款手机声纹认证系统。在盛大任职期间担任创新院核心高管,创建语音分院。2013年加入北京云知声信息技术有限公司,出任CEO。

  Q=记者

  A=黄伟

  大而全不是做语音的正确姿势

  Q:一提到语音技术,我们首先想到的是科大讯飞、Nuance,和他们相比,云知声有什么特色?

  A:我们三家各有优势。Nuance是一个很专业的全球化公司,它的产品最大的亮点是多国语言的知识体系做的非常好。支持60个国家的语言,非常适合全球化厂商。他的缺点就是除了英文其他国的语音做的不是特别好,用一套引擎适应所有国家的语言,英文能做到95%,法语只能做到80%多,中文只能做到80%多,当他在中国市场遇到科大讯飞,遇到我们的时候,性能劣势就暴露无遗了。

  科大讯飞最早是做TTS(text to speech)的,让机器去发声,在这个技术领域里面,包括在全球来说它都是做得最好的。

  云知声做语音识别是最早的,我们团队基本上都是来自于中科院,还有一些以前专业从事这方面的研发机构。我在摩托罗拉的时候,开发的语音识别引擎全球出货量累计超过两亿台,美国专利拿了八个左右,国内专利陆陆续续有三四十个,我带团队参加NIST国际语音技术评测蝉联了三次第一,我本人连续两次受邀请做主演讲人,除了我之外大陆的圈子里没有一个人上过那个讲台。所以就语音识别这个技术领域来说,我们的积累各方面比他们还要深厚。

  Q:对于消费者而言,最熟悉的语音交互工具是苹果Siri,但是使用频率并不高,这是为什么?

  A:Siri没有想象中的普及开来,我个人认为有几方面,第一故事太大了,大家都把Siri想象语音助理,助理应该什么都会做,什么都能做,但实际上它都做不好,希望用一个相对来说有限的人工智能解决非常开放的需求,这本身很难做到。

  第二回到本原来讲,大家用这个东西不是想调侃它,而是希望接受服务,但是其实很多服务不在苹果手里。我订餐馆,你真的能帮我订到一个餐馆某个位置,帮我下菜单吗?显然做不到,那个东西反而不是技术问题,是资源整合能力,当这些都不具备的情况下,就意味着你想做的满足不了用户的需要。无论从技术还是需要两个角度,我们认为理想的方式是什么?不要大而全,垂直领域切入。

1  2  3  4  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号