一步一脚印,无人机视觉跟踪技术的前世今生
近几年突然兴起的无人机,因为其是成本和技术门槛最低的可悬停飞行器,所以可以被广泛应用于专业摄影、农业植保、房地产、建筑勘探、灾难救助等多种领域。无人机的变革性在于它有能力在人类无法直接触及的三维世界飞行。一旦得到普及,将会大幅提高生产效率并拓展人类的视野和体验。
无人机必须克服的视觉跟踪难题
但无人机和自动驾驶汽车等无人驾驶设备不同,现在的无人机其实并不具备自主飞行能力,它们除了根据预设的飞行路线飞行外,主要还是靠操控者进行遥控操作。
现实的操控方式因为要靠操作者目视,或由无线图像传输系统传送实时画面,使用中可能会遇上视野阻挡或无线信号受阻的问题,从而影响无人机飞行的安全性和适用范围。
另外,在人力成本越来越高的时代,如果无人机需要经过专业训练的操控者才能使用的话,这等于变相增加了无人机的使用成本,并直接限制其向其他领域的应用和拓展。
毫无疑问,让无人机具备自主飞行能力会是无人机发展过程中必定会经历的阶段,而对后者而言,最重要的技术则是视觉跟踪技术。为了让无人机实现视觉跟踪,无人机先后经历ADS-B与雷达定位、信号点跟踪、视觉/超声波定位、人工智能式的目标识别等多个技术阶段。
沿用传统思路的ADS-B与雷达定位
无人机是从军用和民用飞机演变而来的,早期的大型无人机很自然地沿用了民/军用飞机上的“ADS-B广播式自动相关监视系统+扫描雷达系统”的思路。
前者通过GPS卫星确定飞机自身位置,并会定期向外广播自身的位置和航向。而谷歌公司此前也宣布开始着手研发小型化、轻量化的ADS-B模块,而且美国华盛顿的Echodyne公司则正在尝试用特殊合成材料,将战斗机使用的扫描雷达系统“移植”到普通的四轴飞行器上。
但即便如此,这两者的成本依旧在2000和1000美元左右,对于消费级无人机来说,这个成本和技术门槛依旧太高了。
信号点跟踪技术
既然通过视觉或声呐跟踪普通物体还有难度,那就先让无人机能够跟踪发出特定信号的物体。之前在国外众筹网站上一夜爆红的Lily Camera,利用的就是类似的技术。
Lily Camera是一部便携型的中型无人机,用户需要佩戴无人机能“看见”的GPS跟踪器,将飞行器“扔出去”,其能自动以 360 度环绕的方式跟随GPS跟踪器进行航拍。
让前者可以跟随佩戴者进行飞行。这项技术虽然受到了额外GPS跟踪器的限制,但门槛和成本要远比上面所说的技术要低,所以它的量产时间估计会更早。
视觉和超声波定位技术
这同样是一种曲线救国的方案,毕竟视觉跟踪之前得让无人机“看到或听到”周围的世界。通过使用额外的摄像头和超声波接发装置,无人机能用光学或声学的方式扫描周围的空间。
无论是光学还是声学扫描的方式,都会产生巨大的数据量和运算需求,得益于智能机和相关计算芯片的飞速发展,可以在无人机飞控系统中可以加入运算能力更强大而且更加省电的处理芯片,让机器能快速判断空间情况。
而这项技术已经被搭载在大疆的高端无人机“悟”,以及其最新的入门机精灵3之上。凭借这个技术,它们甚至可以在没有GPS的室内进行简单的悬停。
但无论是光学摄像头还是超声波,它们都要依靠信号差进行判断,所以无力应对反差小或者消声/吸光的地面状况。
人工智能式的目标识别技术
在上面说的视觉定位的基础上更进一步,就是光学型的目标识别,这也是最贴近无人机实际使用状况的跟踪技术。通过光学/声学等形式,在搜集周边环境信息后,无人机无需特定的GPS或信号点,即可根据算法和实时数据判断和识别目标,从而进行视觉跟踪。
但它对无人机摄像头、处理器运算能力以及厂家识别算法,都提出了和很高的要求。暂时世界上只有两个厂商有类似的视觉识别技术。一个是由德国公司Ascending和英特尔合作的研发的自动驾驶系统,一个是由国内厂商零度研发的Follow snap视觉跟踪技术。
前者需要英特尔定制的RealSense 3D摄像头才能工作,主要用途是进行自主避障,而零度无人机上的Follow snap视觉跟踪技术,更多的是依靠运算能力和识别,通过无人机自主提取和识别跟踪目标的特征,再去主动跟踪。
一步一个脚印的技术突破
科学技术没有捷径,更加不可能一蹴而就,在巨大资本投入之后,无人机的视觉跟踪技术才得以一步一个脚印地前进。
(上图无人机为技术验证机)
在技术层面上说,零度的Follow snap视觉跟踪技术是现时视觉跟踪技术的顶峰,其暂时主要被应用于航拍的自动跟踪上。在此前举行的极客公园新飞行时代活动中,零度的演示机可以在不用操控的前提下自动维持良好的拍摄角度,可以对无人机的航拍进行最大程度的应用。
无论零度是有意还是无意,它的Follow snap视觉跟踪技术,是立在无人机自主飞行和大规模民用化进程中的重要里程碑,无论之后的无人机应用向哪个领域开始,都将从这里延伸。这项技术可以改变无人机在各领域的应用,进一步向大众推广。