深度学习改变世界!Deep learning简析
本次GTC大会上最热的无疑就是deep learning这个词了,NVIDIA所有新发布的产品都围绕着它展开,而百度阿里甚至奥迪特斯拉这样的公司也都对它产生了浓厚的兴趣,似乎一夜之间,deep learning成了高新技术的代名词,那么它究竟是什么来头呢?
简单来说,deep learning是一种机器学习的演进,可以说是大数据分析的进化版,人工智能的前提或者说一部分。它可以解决电脑和现实的交互,也能为人工智能提供数据支持。
deep learning的概念比较早,但真正快速发展是从2006年开始的
研究发现,人类认知过程本身就是逐层进行,逐步抽象的过程。人类首先学习简单的概念,然后用他们去表示更抽象的,这本身就是一种层次化的组织思想和概念。
图像声音等等数据,电脑本身是无法理解的,所以工程师将任务分解成多个抽象层次去处理。深度学习的核心思想是把学习结构看作一个网络,它的核心思路如下:
①无监督学习用于每一层网络的pre-train;
②每次用无监督学习只训练一层,将其训练结果作为其高一层的输入;
③用自顶而下的监督算法去调整所有层
最简单的一种方法是利用人工神经网络的特点,人工神经网络(ANN)本身就是具有层次结构的系统,如果给定一个神经网络,我们假设其输出与输入是相同的,然后训练调整其参数,得到每一层中的权重,自然地,我们就得到了输入I的几种不同表示(每一层代表一种表示),这些表示就是特征,在研究中可以发现,如果在原有的特征中加入这些自动学习得到的特征可以大大提高精确度,甚至在分类问题中比目前最好的分类算法效果还要好!这种方法称为AutoEncoder。当然,我们还可以继续加上一些约束条件得到新的Deep Learning方法,如如果在AutoEncoder的基础上加上L1的Regularity限制(L1主要是约束每一层中的节点中大部分都要为0,只有少数不为0,这就是Sparse名字的来源),我们就可以得到Sparse AutoEncoder方法。
当然,还有其它的一些Deep Learning 方法。总之,Deep Learning能够自动地学习出数据的另外一种表示方法,这种表示可以作为特征加入原有问题的特征集合中,从而可以提高学习方法的效果。
TITAN X强大的并行运算能力让deep learning变得更加容易
每个数据样本要拆成十几二十层来分析,所以deep learning虽然很美,却需要强大的算力保证,据悉目前包括百度谷歌微软在内的很多公司都花了大力气投入deep learning的研发,而传统经营超算的公司如曙光和浪潮他们的服务器已经有很多时间开始deep learning的运算了。因为有了deep learning,智能驾驶,智能人机交互在不远的未来都将成为现实,但前者的用途显然不止于此,未来前景不可估量。■