百度助开发者享受最前沿技术
(余凯在大会现场做主题演讲)
余凯在大会现场表示,在移动互联网时代,智能可穿戴设备将会是未来的一大热点。这其中人机交互的效率和质量,是设备“智能成色”高低的关键。“所有的交互方式中,最自然的人机交互方式之一是语音。”余凯强调。因此,无论是国外还是国内,语音技术如今都成为了最顶尖的科技公司的一大投入点。余凯颇有信心地表示,“百度是在移动搜索中文语音识别里面做得最出色的公司,在准确率上百度跟国际同行比起来可以说是毫不逊色。”
余凯介绍说,对于这一领先的语音技术,百度并没有“独享”,而是把其完全开放。实际上,在此之前百度就已经宣布向开发者免费开放百度整个语音生态系统。这样的开放包括直接安装百度语音助手、调用百度语音助手SDK以及开放最底层的语音识别技术API等由浅入深的三个层次。由此不同层次的开发者都可以方便快捷地使用、嫁接百度的语音服务。
除了语音技术之外,在现场余凯还通过生动的案例,详细介绍了百度在图像技术方面所取得的成就,包括以图搜图、图片翻译、人脸识别、为你写诗等基于图像技术的创新功能。针对一个例子,余凯表示,“百度图像技术不但可以识别出这幅图的内容是街头艺人,把其洒脱的心境用中国诗歌描述出来,这说明百度对图像识别的理解和语言模型的建模都达到了一个相当的高度。”
当百度把自身领先的图像技术能力,植入具体产品时,就给产品带去了不一样的创新和独特的卖点。百度魔图,就是这样的受益者。通过“PK大咖”、“夫妻脸”等功能,百度魔图一度在 App Store 所有免费应用的综合排名中夺得冠军宝座,用户数也快速地突破了1亿。
实际上能够有望创造这样奇迹的,并不仅仅局限于“百度系”的产品。因为百度图像技术同样向广大开发者进行了开放。余凯介绍说,通过人脸服务SDK、人脸服务API、图像处理SDK等各种方式,百度可以向开发者开放人脸验证、人脸检索、人脸属性识别、图像处理四种技术能力。从而使得开发者可以低成本高效率地,开发出优质的产品,为用户提供更为良好的使用体验。
在余凯看来,百度之所以能够在语音、图像等领域取得如此巨大的成绩,与百度在技术领域的底层建设——百度深度学习研究院的建立息息相关。余凯介绍说,深度学习是机器学习研究中的一个新的领域,核心在于以人脑复杂神经网络的方式,模仿人脑的机制来解读文本、语音、图像等大数据。余凯表示,“用户所有的浏览和使用行为,都需要复杂的机器学习模型做预测。深度学习可以站在使用者的角度去分析所有的问题,使我们的搜索引擎更加的智能。”
余凯透露,在深度学习技术的驱动下,百度在各方面都取得了长足的进步,可谓影响深远。语音技术方面,相对错误率降低了25%以上,移动搜索中文语音识别率突破了90%;图像技术方面,人脸识别技术世界领先,同时快速推出了世界上首个全网人脸搜索引擎;在相似图像搜索方面,效果远远超过了国际上搜索引擎同类产品;此外,在全流量上线广告CTR的预估方面,也提升显著。“深度学习之于百度,还在显示出厚积薄发的威力。”余凯强调。
据了解,此次2013国际创新峰会由TechCrunch中国官方战略合作伙伴动点科技主办。作为全球最重要的创新峰会之一,本次峰会云集了众多颠覆性的创业公司,同时包括TechCrunch全球COO内德?德斯蒙德、联合创始人凯斯?提尔等业界大佬也悉数到场,和中国互联网行业的从业者一起,共同见证当下中国的创造与创新。
余凯最后表示,创新是中国互联网行业发展的最大推动力,开放共享是互联网最重要的精神内核之一,百度希望通过开放不断地输出自身的领先技术,帮助广大开发者和创业者站在世界互联网的前沿,和百度一起书写更多神奇的中国创新故事。■