新年展望 平板行业未来的5个趋势走向
分享
iPhone 4S 成功的捧红了Siri语音助理服务,发短信、找数据、查地图还有卖萌。人们津津有味的调戏这个看上去能够自主思考的程序。
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。包括特征提取技术、模式匹配准则及模型训练技术三个方面。
说到Siri,还要提一下Android系统中的Voice Actions,这也是一项伟大的语音控制技术,并已经被许多Android用户所熟知和使用。但是它和Siri完全不是一个级别的产品。
Voice Actions提供了非常坚实可靠的声音识别引擎,它的高识别度令人称奇。不过,和过去的所有语音命令系统一样,它要求你说的话要具备严格的语法结构和格式,否则系统将无法识别。
然而Siri和Voice Actions就有本质的不同了。你可以抛弃繁琐的语法结构,甚至思维模式也可以混乱,Siri会结合上下文结构去理解,它还会从人类语言史的角度出发,利用人工智能系统去分析,并在绝大多数情况下领会你的意思。
而更加人性化的特点是,一旦你开始和Siri进入一段对话,它甚至能理解许多含义模糊或者引申的语义。而Voice Actions做不到这样的事情,因为它只是一个声控命令软件,而并非人工智能。
语音识别不是革命性的。多年前, IBM 的语音识别软件在 PC 上就有不错的识别率了,但识别精度还有待提高。预计在将来,语音控制技术能够让我们与移动设备进行无障碍的“交流”。
0人已赞