据报道,百度CEO李彦宏最近说,在语音识别准确率方面,2012年一年的进展就超过了过去15年进展的总和。确实如此,在过去一年里,从语音产品越来越丰富以及语音产品易用性的大幅提高方面看来,语音识别产业确实是爆发式的态势,同时,也明显感觉到各家语音识别的准确度得到了大幅的提高。
语音识别结果准不准无疑是所有语音类应用最受关注的地方之一,如果用户的话都不能正确识别,那么怎么指望该应用能够理解用户的意图并且提供相应的服务呢?2011年某语音输入法刚推出来的时候,笔者就是第一批试用的用户之一,虽然曾经被语音识别的易用性所震撼,但仍然觉得每句话总是会有一两个错字。对于用户而言,这仍然给用户带来一种“不太放心”的体验,生怕一句话识别不对还要重新讲一遍。但随着时间的推移,明显感觉语音识别的错字越来越少,现在笔者使用语音输入时基本上已经很少修改了!
总而言之,在过去的2012年,尽管在口音、方言以及中英文混读方面还有待加强,但就普通话而言,困扰人们多年的自动语音识别问题基本上可以说已经解决了。这一点也可以从过去一年互联网大佬们对语音助手应用的投入即可看出来。先是去年3月份,科大讯飞率先推出了Android版本的国产SIRI——讯飞语点,然后搜狗推出了搜狗语音助手获得大量关注,继而百度厚积薄发,在年底推出自己的百度语音助手。进入2013年,连腾讯也推出了自己的YIYA,语音助手的市场一下子就从百家争鸣直接过渡到了大佬火拼的态势。现在的语音助手不仅仅可以打电话发短信,还可以查询股票、火车票、百科、酒店等生活信息,甚至无聊的时候还可以跟它聊天。
我们可能很快就会发现,除了手机的语音助手,语音识别还会出现在越来越多的设备上,比如汽车、电视上。2012年荣威汽车就推出了iVoka语音驾驶技术,改变了传统汽车生活。同样是2012年,三星推出了带语音识别功能的智能电视,并宣布在以后上市的智能电视新品上将配备语音识别的触摸遥控器。可以想象,在不远的将来,语音识别技术与物联网结合,不光是机器人,连一个茶壶都会具有语音对话功能,你跟它说“烧水”,它就自动接电烧水,过会儿就报告“水开了,主人!”。