当机器学会了学习 人类该怎么玩?
泡泡网资讯频道8月19日 如果今年你没看过《她(her)》 这部电影,那你就out了。作为豆瓣高达8.4分评分的电影,女主角斯嘉丽?约翰逊竟然完全没露脸,整部电影只有她性感迷人的声线,因为她是个人工智能。电影中男主角爱上人工智能中的她——OS1,原因很简单,她知道他的性格,知道他的需要,知道和他怎么相处,知道他在难过时给他安慰……归结两个字“知心”, 这样的完美情人,现实中太少。
但是现实中并非没有,在互联网里的诸多服务中,也越来越让人感觉到“知心”。从个性化新闻的推荐、广告推荐、搜索的结果展示、商品的推荐、优惠的推送等,越来越让人感到,咦,它怎么知道我想要的?这背后其实和《她(her)》里所描绘的技术是一样的,即互联网会随根据我们过去的行为以及新的事件而不断改变服务策略,例如我们浏览什么内容、下载什么应用、看过什么视频、停留了多长时间等等,这些数据在互联网为用户展示内容时会进行收录、分析,并在下一步的服务中加入这些反馈分析结果,进行推荐。
这个技术就是Online Learning,即机器自主的在线不断学习,不断的在与用户交互的过程中调整策略。
Online Learning目前主要还是存在于学术界研究状态,Yahoo和Google也主要停留在实验、调研或论文层面,不过百度近期已率先在旗下产品中规模应用了。对于Online Learning的定义,学术界也都不一,比较明确的有三个特征:
1) 根据环境不同,自动选择非常好的策略。当经验不足或者表现不佳时,没有办法确切知道这个时候“做什么正确”,这时则通过尝试去发现正确。
2) 实时真实反馈。比如骑车的时候,骑车“策略”不同,会直接反馈到车是往前走,还是拐弯,还是停下来失去平衡。
3) 增量特性。学习是不断在过去经验上的积累,而不是接收到新的反馈时就清掉过去的经验。
以上的说法还比较抽象,举几个更容易理解的应用场景:
1)在电子竞技领域,如魔兽争霸,DOTA等电子竞技,中间包括很多策略和战术的使用。 Online Learning可以让人工智能(AI)通过不断与人对战,或者学习人之间对战过程提升竞技策略,以至于可以战胜最厉害的人类。
2)在机器人自主学习领域,在人们没有给任何指示的情况下机器人自动给出方案,例如控制机器人的步态和平衡,控制理论太过复杂,机器人通过自己去尝试走路,跌倒再爬起,调整方案继续,最终学出了走路的方法。
3)编好程序的做菜的机器人,原来只会做中规中矩的青椒肉丝,但是经过Online Learning之后,不断尝试新用料来看主人的喜爱程度,由此而不断了解主人口味后逐渐学会做鱼香肉丝。
4)学习新的语言、新的词语甚至学习编程。开始时对于新语言、新名词不了解,但逐步通过外界的反馈,理解一门新的语言,或者学会一个新生代名词的分类。
实际上,人脑本身就是一个基于反馈的在线学习系统,通过不断研究在线学习技术,也是在做能够适应外界不断变化的更加智能的系统。
以搜索巨头百度为例,这些智能化的系统已经在百度各在线应用有实际的使用,效果很惊人:
百度搜索结果的排序:机器将不断“读懂”用户需求,不断“学习”而进行推荐有价值的内容,例如搜索“双层床”,这背后潜在的需求是因为空间小、或者有儿童房的需求,那么读懂这个背后需求后可以将这类优质结果给予展示。根据百度在线的试验,将搜索的第四位结果提供在线学习后的推荐内容,第四位点击率增加了8.6%,满意率监控指标增加10%。
百度右侧栏知心推荐:也同样会挖掘关键词背后的需要,展开关联内容。比如搜索“爸爸去哪儿”,右侧栏会把相关的嘉宾以及更多类似的综艺节目做推荐。根据百度的试验结果,其点击率有10%甚至20%的提升。
百度手机助手“发现”和91助手的“猜你喜欢”:在“发现”中应用online learning技术后,下载率增加了32.13%,点击率增加42.9%。
百度视频“随心看”和“类似推荐”:针对用户的喜好进行视频推荐后,点击量上升90.98%。
这些应用数据可见,通过获取用户的反馈而进行更智能化的推荐,对于用户而言确实获得了更多“知心“的感觉,也就带来越多使用。这些技术不断升级之后能给我们更多,未来的搜索将不仅仅是智能化推荐,将更成为一种个性化的贴心助理,在搜索更了解每个人的个性和需要之后,给出更直接的建议。
比如你想看什么书,不再需要输入书名,机器将根据你的喜好以及当前的热点为你选择,你想听什么音乐,机器将根据你所处的场景、心情自动播放应时应景的歌,你想买什么样的房子,甚至你和Ta是否般配,机器都能给出靠谱的答案。
最近《彭博商业周刊》报道RoboEarth项目,就是利用机器人不断学习后并将学习经验上传云,其他机器人也获得知识,这对未来的世界将影响重大,这将逐步真正的实现《她》里所描绘的世界。
当机器学会了学习,我们人类还需要什么?