泡泡网软件频道 PCPOP首页      /      软件频道     /      新闻    /    正文

云知声亿元融资后发力计算机语义理解

  近日,Facebook单独组建了一个新的人工智能部门,其研究目的是将人们分享的内容联系起来,从而使得Facebook可以对用户提出的问题做出更深入的回答。往前追溯,2012年5月,Google推出知识图谱(Knowledge Graph),可以将搜索结果进行知识系统化,任何一个关键词都能获得完整的知识体系;2012年9月份,国内搜索公司搜狗和百度分别推出知立方和实体搜索,意图构建中文的互联网知识图谱;2011年,IBM推出知识问答系统Watson,并在智力问答比赛中成功战胜了两位人类选手;2010年10月苹果随iPhone 4S的发布推出了智能语音助手Siri。

  这些巨头的意图,是对互联网大量无序数据做结构化重组,目的是更好的理解用户的自然语言和行为,并且其背后都使用了一个共同的技术:语义理解技术。

  你不可不知的语义理解

  语义就是自然语言文本的涵义。对计算机来说,就是当计算机遇到这个文本输入的时候,应该进行的回答或响应。例如,当用户问“北京明天什么天气”,计算机能够理解这句话的意图是问天气信息,且城市是北京,时间是明天,从而执行的操作是从特定数据源中查询到北京明天的天气信息并呈现给用户。语义理解让计算机听懂用户说了什么,并进一步回答用户的问题或与用户对话。语义技术可以让搜索引擎通过推理获得答案,已经被业界公认为是搜索的未来,也同时是人机交互的未来。语义技术的重要性已经在工业界得到了广泛的认可。今年3月份,Gartner就发布了一份报告,认为语义技术在2013年及以后的信息管理领域十大重要技术中列第三位。

  对普通用户来说,语义技术会给我们的日常生活带来什么新的体验呢。最为常见的方式是语义技术和语音技术的结合,它创造了一种更为自然和智能的交互方式。以今年11月1日“去哪儿”推出的新版移动客户端为例,它包含了一个语音搜索的新功能,用户可以直接用自然语音来查询机票酒店,不需要通过文字输入或下拉选择等交互方式来输入查询获取信息,确实很方便。这是最近语义技术在移动互联网应用中一个非常有代表性的尝试。

  语义技术比较适合的应用类型至少有两种:一是操控类的应用,通过语音可以直接发出指令,如语音拨号,发短信等;二是信息查询类的应用,特别是查询条件比较多的情况,传统的交互方式需要用户用文字输入很多查询条件,这对用户来说很繁琐。而语义的交互方式可以让用户通过一句话或者多回合的对话方式获取其所要的信息。从应用场景来说,语义技术与语音识别相结合在下面三种场景是可以非常有效地解决用户交互的问题:1)不方便使用双手的车载设备;2)在环境相对私密的家庭中的智能家电家居,如乐视的超级电视语音助手; 3)只有小尺寸屏幕或没有屏幕的可穿戴设备中,如智能手表、智能手环。

  语音时代,没语义,不智能

  语义技术因其专业性和复杂性,目前主要掌握在一些专业公司手中。对普通开发者来说,要想利用语义技术简化操作和提升用户体验,从头开始学习和开发语义技术,并不是一件容易的事情。所幸的是,国内一些公司陆续以公有服务的方式提供语义解析服务,一般称之为“语义云”,这大大降低了开发者使用语义技术的门槛。目前,科大讯飞和北京云知声先后推出了各自的公有语义服务。

  科大讯飞是国内著名的语音技术公司。其语义服务主要是把语音助手中需要的一些语义理解功能开放成API,主要功能是对某些领域的输入文本,返回经语义解析后的结果,解析结果是XML格式。科大讯飞的语义服务开放了16个领域,开发者能选择最多5个领域测试。如果需要使用更多领域,是否免费还未知。

  北京云知声是最近崛起的新兴语音技术公司,定位为B2B2C,用互联网的方式切入市场。其语义服务总体设计和科大讯飞的语义云类似,提供了一些常见领域的语义解析功能,解析结果是JSON格式。云知声的语义服务目前支持30多个领域,且全部领域都可以自由选择。另外,云知声语义服务的一个特点是,其部分领域不仅仅只是返回语义解析结果,还能返回该问题对应的结果数据,如天气和股票等;同时部分领域还支持上下文理解和对话,如航班等生活信息领域。

  开发者尽享语义技术红利

  对开发者来说,以上两家公司的语义服务都可以尝试,但开发者在选择语义服务时,需要更多的权衡。因为语义解析是和业务领域相关的,而且各个语义服务返回的数据格式都不一致,所以选定了一家服务商,今后如果要更换,并不像语音云那么容易。笔者认为在选择时有两个因素是需要重点考察的,一是语义解析的准确率,由于语义与领域相关性很大,公共服务是否与开发者的应用场景契合,会比较大的影响准确率,所以需要由开发者自己来比较。另外,在准确率方面,同时能提供语音云和语义服务的公司会更有优势。因为语义理解要处理的大部分文本是语音识别的结果,没有语音识别技术则无法对特定领域做语音识别的优化,而如果语音识别结果错误率在特定领域变高的话,必然会导致语义理解结果变差。 二是开放程度,供应商面向自己和面向其他开发者提供的是否是一致的服务。如果供应商自己的应用与开发者有竞争关系,那语义服务的开放程度肯定会有所保留。

  总的来说,语义技术的出现,特别是语义技术和语音技术的结合为移动互联网应用提供了一种全新的交互方式。同时公有语义服务的推出大大降低了移动开发者使用语义技术的门槛。移动开发者可以抓住这个机会,在交互方式上进行新的尝试和突破,快人一步,也就意味着更快的成功。■

0人已赞

关注我们

泡泡网

手机扫码关注