微软推PC版Kinect 开启人机互动新篇章
电脑是人类的伟大发明,而人与电脑之间互动沟通的方式也一直伴随着电脑的迅速发展而不断进化着。起初我们不得不迁就电脑,要去学习以命令行为基础的机器语言,所幸Windows的图形界面把我们解放了出来,鼠标和键盘成了后来几十年间人们最熟悉的输入工具,而用途越来越广泛的触摸屏则是人机互动的最新潮流。我们清楚地看到,在人与电脑沟通方式的变革中,技术的发展正在帮助人类取得“优势”地位,让电脑积极适应人类习惯的NUI自然用户界面代表着未来,而微软推出的Kinect for Windows则是开拓未来的先行者。
当2009年Kinect首次面世时,曾有业内分析师认为:“Kinect或将成为第三次人机交互革命的原点,不仅因为其全新的操作方式,更因为其背后所蕴含的创新精神。“事实印证了这个预言,而Kinect在彻底地颠覆了人们的游戏体验之后,又面向更广阔的Windows生态系统卖出了一大步,在2012年推出了Kinect for Windows以及SDK软件开发工具包,并于同年10月进入中国。
Kinect让电脑学会了如何去读懂人类的动作,其中的奥妙在于以一系列灵敏物理传感器为基础的硬件设备与先进的软件功能应用的有机整合。在硬件方面,这神秘黑盒子里暗藏了RGB可见光摄像头、红外线发射器和接收器、麦克风阵列、加速度传感器以及倾角控制马达等组件,配合Windows 电脑以及由微软提供的SDK软件开发工具开发的应用,就能实现令人耳目一新的人机互动新应用。
具体说来,Kinect for Windows实现体感操控在硬件上主要基于三大核心功能:
● 3D影像侦测:Kinect for Windows的传感器可以通过将红外激光点阵反馈到两个红外摄像头中,对用户的空间立体坐标进行3D扫描定位;通过RGB可见光摄像头捕捉可视图像,再配合声音数据对人物身份进行识别;在完成影像和声音数据采集后,数据直接通过USB线传输到PC上,由PC上的Kinect for Windows数据采集库对传感器3D立体影像、彩色可视影像和立体声音频信号进行处理和融合,再将数据流传输到与Kinect for Windows软件接口相连的SDK或应用程序中。
● 人体骨骼追踪:Kinect for Windows的骨骼追踪系统能检测出包括躯干、四肢、手部在内的20个人体重要骨骼关节,可以同时侦测出6人,并对其中2人的动作进行追踪。通过对关节点的追踪,就能实现全身的体感操作。为了让电脑看懂使用者的动作,微软利用机器学习手段建立了庞大的图像资料库,形成智慧辨识能力,尽可能理解使用者的肢体动作所代表的涵义。Kinect for Windows还特别提供了近距离模式,能探测到最近40厘米范围内的物体,大大扩展了体感系统的应用前景
● 音频处理:Kinect的音频系统采用性能更强的麦克风阵列技术、先进的噪音抑制、回声消除以及用于识别当前声源的波束形成技术,让Kinect for Windows在应用中能更精准辨识出用户音频,保证人体交互精度。
除了硬件基础,为Kinect for Windows赋予灵魂、令其能够胜任各种应用场景的,是Kinect for Windows SDK软件开发工具包,从最初的1.0版本到目前最新的1.8版本,SDK包为开发者提供了应用开发的极大便利、不断增加的新功能,以及实现更多创新应用的可能。Kinect for Windows SDK软件开发工具包让开发者能够通过C++、C#或Visual Basic语言编写支持手势和语音识别的程序,令其调动Kinect for Windows的硬件潜力创造更多新应用。
目前,Kinect for Windows已经在零售、医疗保健、教育等多个行业改变了人机交互的方式。在杭州,Kinect for Windows已经被用于患者的物理康复治疗,设备通过检测患者的身体运动幅度判定出患者的康复水平并提出进一步的锻炼建议。在上海,Kinect for Windows已经被服装店采用,帮助消费者“凌空换衣”,减少了反复试穿的时间和麻烦。在北京,Kinect for Windows成了幼儿园小朋友的好伙伴,孩子们在蹦蹦跳跳的互动中一边游戏一边学习知识。Kinect for Windows只是我们探索NUI自然用户界面的一个开始,随着技术的进步与发展,我们必将看到更加自由、顺畅,甚至在今天看来是不可思议的人机交互方式,而这些新技术带来的创新应用,或许将彻底改变我们未来的生活。■
注:本文观点仅代表作者本人观点,与本网站无关,本网站亦不对其真实性负责。