语音的未来:终端标配,能听会说

何玺 原创 | 2012-03-26 08:06 | 收藏 | 投票

 

322日,何玺受邀参加了科大讯飞在国家会议中心举办的新一代“语音云”发布暨语音开发者大会,聆听了柳传志、李开复、科大讯飞董事长、总裁刘庆峰等语音先驱对语音知识的分享,学了不少东西,这里和大家一起分享一下。

发布会开始,科大讯飞董事长刘庆峰对科大讯飞的技术和取得的成绩向与会者做了介绍。

据科大讯飞董事长刘庆峰介绍,科大讯飞经过一年多的发展,目前开发伙伴数超3100家,终端用户数已达3000万,日在线用户超120万,总请求量超700万次。刘总表示,语音技术未来将成为每一台终端设备的标配功能,使得终端具备能听会说能力,这些设备包括手机、家电、轿车,甚至玩具。

据刘庆峰介绍,科大讯飞的语音识别准确率已经达到90%以上,在合成语音发音的自然度以及语音语义理解方面都达到了实用水平,并且支持中、英、俄、日、法等多语种。

另外,刘庆峰还介绍了科大讯飞语音技术在安全、教育、音乐、电信等方面的应用。比如口语评测技术已经达到了国家语委鉴定达到的使用水平,目前已经有5000万师生在使用;而基于音乐评测技术,科大讯飞推出了爱吼网,供用户进行演唱测试。

刘庆峰如是介绍新一代科大讯飞“语音云”:“在已有的语音合成、语音搜索、语音听写能力的基础上,进一步增加了自然语言理解、个性化语音识别、个性化语音合成等新能力特性。”。

在发布会互动环节,柳传志和李开复跟主持人和大家一起分享了对语音发展的看法。

作为讯飞产品的投资者和使用者,柳传志现场给讯飞语音输入法做起了广告,不过他也认为,虽然讯飞目前做得已经很不错了,但还需要继续改进。他指出了讯飞目前存在的一些不足,比如在向讯飞口讯发出口令时,生僻词与发出口令者的口音讯飞识别不是很好。

作为语音技术的研究者,李开复对讯飞现今的语音技术表示还不错。但他认为,语音理解想对较容易。但是语义理解才是语音技术的难点。他认为讯飞语音平台非常好,随着越来越多开发者的参与,越来越多用户的使用,语义理解能力将会越来越准确。

李开复认为,语义理解技术仍然面临一些挑战。 “假如能做到一定程度的语义的理解,需要投入多少,怎么样让开发者很好的介入,这是一个问号。”另外,语音的交流会带来用户期望值的提高,“人们一旦开使用语音跟机器交流了,就会把它当做一个人,这个带来的超级高的期望值会给语音带来很大的挑战。”

 李开建议开发者先从对语义理解要求相对简单的应用入手开发,或者没有语义的应用,比如输入法;娱乐应用,比如游戏、Siri,出错不伤大雅;眼忙手忙时会使用到的,比如驾驶助手;触屏输入太慢的或等不急的,如驾车路线,记事簿;本地商务和地图,如找餐馆等。

李开复在会后在微博继续阐述了自己对语音发展的看法。“【手机语音识别应用的挑战和机会】1)精准度:讯飞这样的平台,利用了大量语料和服务器,可以做得不错,2)语义:语义要比语音更困难,而且不是标准API用上就可以解决的,3)应用:挑选真的需要语音的应用(比如说眼忙手忙应用),4)用户体验和期望:深度结合语音语义和应用,才能做出优质的应用。”
   
会后,何玺下载了讯飞的新产品—讯飞语点,使用了它的拨号服务、点歌服务、发短信服务,应用打开服务,感觉不错。建议android用户下载一个试试。

所有的智能终端都能听会说?那将会对我们的生活有什么样的改变呢?令人期待的科技啊!

个人简介
艾瑞专栏专家,Techweb专栏作者,易观国际观察家,万瑞数据特邀专家,移动研究院特邀外部专家,拥有超过6年的网络公关实战经验。
每日关注 更多
何玺 的日志归档
[查看更多]
赞助商广告