人工智能平台将成互联网新蓝海
正在北京召开的“两会”期间,政协委员、百度掌门人李彦宏继去年提出互联网在线教育之后,再度提案中国大脑计划,将人工智能普及中国大地,为以后的科研、教育、创业和医疗等提供帮助。而于此同时,教育界大佬俞敏洪也抛出通过互联网解决教育信息化的相关提案,重点阐述了关于确立“网络学习空间”在线教育新模式。其核心也是以人工智能为基础,带动整个互联网教育平台的创新和协同发展。
两会委员们纷纷关注人工智能和互联网发展,一方面体现了我国综合国力和科技水平的进步,另一方面也体现了互联网技术对于教育、医疗等民生行业的巨大推动和市场变革。
互联网时代的发展也让公司脱颖而出,产品体验和速度,往往是容易看到的。而核心技术带来的体验差异和长远发展基础则更加隐蔽。人工智能技术作为未来互联网公司的核心竞争力,也越来越被资本所理解。百度李彦宏不惜让股价下降也要发展人工智能技术,谷歌自称:我们不是搜索公司,我们是人工智能公司,Facebook在海量用户挖掘有用信息的能力也是依靠人工智能和深度学习。
同时,国内教育领域新兴生力军“口语100”就是国内在线教育领域少有的拥有核心人工智能技术的企业。 在虚拟校园教室的平台内,坐着美丽的人工智能教练Aryn,独特的一对一音节层次纠错技术,带来的是全世界少有的体验,并创造了用户认可的价值。其发明人朱奇峰博士是人工智能领域的知名专家,在2004年因为在神经网络在语音识别领域的世界领先成果被美国政府认可为超凡人才(Extraordinary Ability)。
教育从实体校园空间向互联网空间的转向,既是当下技术的进程,同时也是全球教育发展大趋势,是提升国家竞争力的战略制高点。早在2013年,教育部科技司就提出把“三通工程”作为“十二五”期间全国教育信息化工作的核心目标和标志工程。到2015年,基本实现“宽带网络校校通”;优质资源班班通;“网络学习空间人人通”——所有教师和初中以上学生都拥有实名的网络学习空间,教与学、教与教、学与学全面互动,真正把技术与教学实践的融合落实到每个教师与学生的日常教学活动与学习活动中。
华大学蒋东兴教授表示:“(很多地方)是错误理解了人人通,以为只要搭建一个平台给每个师生开设一个帐号就认为达标了”。华南师范大学焦建利教授指出:“尤其不能将其简单理解为在资源网站开通实名注册的个人空间”。因此,俞洪敏提议,“加强对信息化教育企业科技和应用创新的支持。而且,政府应改变重硬件轻软件的采购方式,适应“软件即服务”的发展潮流。”他表示,在过去的教育信息化推进工作中,存在过于注重购买硬件设备,而缺乏对软件系统的投入的问题。软件系统的概念在不断的发展,网络学习空间甚至已经不是传统软件,它是一个基于云技术的软件服务。政府采购政策要适应软件行业的发展。口语100所着力的,便是有效网络学习空间的搭建和实现,是软件服务的整体搭建和运营。
朱奇峰博士介绍到:传统的语音技术是基于统计模型,在2003年起,他和伯克利的科学家一起研究使用神经网络进行语音识别,这个工作在2004DARPA组织的评估中和IBM排名并列第一,错误率相比统计模型降低了10%,让行业瞩目。2005年是个分水岭,朱奇峰博士开始研究多层神经网络的学习并提交了NSF研究申请。但在2005年美国语音识别研究项目从EARS改名为GALES后开始将识别语种包括中文和阿拉伯文。因此朱博士年离开研究所,决心投身工业界把语音技术用于推动民用福祉的教育事业。在2006年多层神经网络的有效训练方法—分层逐渐学习被广泛推动,并在2010年后被微软,谷歌,Facebook, Twitter内广泛使用,并带动了人工智能的新的热潮。
基于这个理念,在统计模型和深度学习之外,朱博士发明了第三条技术道路:基于感知心理声学的发音分析模型。这是不同于统计模型和神经网络的另一个方向,直接对人类已知的听觉感知能力建模并优化。
这个技术更重要一点的是解决了外语语音教学中的标准问题。这对教学格外有意义。其他方法中,根本没有也无法建立“标准”这个概念。简单说:存在的仅仅是百万人读的分布,而一个学生到底读成什么样是100分没人能知道。而标准是教学所必需的。其他技术是对特征分布建模,口语100模型的是特征之间的感知差异,也就是和标准发音之间的感知差异。新技术不仅解决了标准问题,而且在反馈的准确度上也大大提高。 目前,口语100技术是世界上唯一能进行音节层次智能语音纠错的技术,带来的学习体验媲美真人听说教练,也得到了用户真金白银的认可。
口语100不仅使用自己的独创技术,也首先把基于统计的语音识别技术和发音分析技术结合使用,创造了双引擎评委团技术。在行业内是很少有的。即便如此,朱博士说,人工智能和人类相比,尤其在智能感知和判断领域还有很大差别,科技发展还有很长路要走。
在2015年,朱奇峰博士在口语100内部重新开始了神经网络深度学习的研究,目标布局未来更精确的数据分析和针对性推荐。 “我期待在口语100内部建立可以至少赶上百度深度学习实验室的研究组,并率先用于在线教育领域,运用到虚拟校园中,运用到千万学生的日常学习行为上。这对构建一个虚拟学习世界和学习平台是至关重要的。平台的本质不是各类资源大杂烩,而是理解用户并更好地针对性地咨询服务。我们一直认为自己是初创公司,需要一步一步来。但这也许是个大错误,所以,我们现在就要开始,我们已经有足够的基础。”