首页 »

大咖谈人工智能(4)马少平:互联网拯救了人工智能

2019/10/22 7:39:32

大咖谈人工智能(4)马少平:互联网拯救了人工智能

【大咖简介】马少平,清华大学博士生导师、中国人工智能学会副理事长。可以说他本人就是中国人工智能的“黄埔军校”,散布在各个企业里很多做人工智能的科学家都是马少平老师的学生。

 


两年前难以预见计算机下赢围棋

 

两三年有一次在微博上讨论,我说如果有大的公司肯投入人力物力来做这件事情,十年之内计算机围棋有可能跟人的九段抗衡。当时微博上大多数人是反对的,因为说这话的人大多是自己会下点围棋,知道围棋多难,计算机根本不可能做到。去年还提到这件事情,也是很多人反对。

 

在AlphaGo出来之前,计算机围棋最好水平也就是业余五段左右,现在应该是到九段了。因为从业余五段到职业棋手就是很大的飞跃,从职业初段再到九段又是很大的飞跃。所以不仅在下棋这方面是里程碑,在人工智能方面也是一个里程碑。

 

人工智能60年几经波折

 

人工智能这个概念的提出,到今年为止已经60年了。但是,早在提出“人工智能“这个概念之前,有关事情已经在做了。

 

上世纪40年代开始有人研究神经网络,当时人们提出了一些模型,例如50年代前后提出感知机模型。当时也挺热的,觉得可以做的事很多。由于各种原因和计算条件、硬件条件的限制,当时的网络只有输入方和输出方,我输入相同的时候是0,输入不同的时候是1,人们发现这么一个简单的问题当时的模型解决不了,研究就遇到了困难。60年代有一本书全面分析了当时各种神经网络模型,得出一个悲观的结论,一个输入,一个输出的模型是不可能解决疑惑问题的,如果多层这件事情也是很难的。从那以后十几年,美国、前苏联、欧洲国家政府没给研究神经网络一分钱的投资。

 

提出人工智能以后,那时候正好是计算机从1946年到1956年那十年,计算机为研究人工智能提供了一个很好的工具。人们提出了符号主义,神经网络叫做连接主义,符号主义就是说人的思维过程是符号处理的过程。比如说这条线和那条线平行还是交叉,这完全可以靠符号处理,计算机控制符号相对比较容易。如果说神经网络走到了羊肠小路,那么符号主义出现了一条大马路,刚开始大家很乐观。

 

但是,每次高潮之后都会陷入低谷。当时觉得有了计算机以后可以做一个通用的求解程序,解决很多问题。比如做机器翻译,通过计算机建一个大的词典,把世界翻译问题都解决了,其实不是那么回事。在这个过程中人们发现了一些知识,之所以做不了翻译,是因为有知识在里面。

 

我跟学生说你们的英语水平肯定不如外语大学学生的强,但是我要翻译一本计算机方面的书,我肯定找你们,不找他们。

 

于是当时进一步提出知识工程概念,建立强大的知识库。但这很快也遇到了瓶颈,知识获取不是那么容易的。

 

一个难题是专家不一定愿意把知识告诉你,即便愿意告诉你,他也不知道怎么说。即便说出来,机器怎么用,也是一个问题。我给学生上课举例子,假定我学骑自行车,你到底怎么骑不摔,为什么我骑会摔,你说不出来,你只能说你练出来就好了。

 

在这种情况下,以符号主义为首的大路,突然没有了。另一方面,世界上还有屈指可数的几个人在研究神经网络,他们在得不到资助、论文也发不出来的情况下,仍在坚持,有了突破。上世纪80年代,英国人杰夫·辛顿提出了“深度学习“,他提出机器学习算法,解决了神经网络的学习问题。

 

还用骑自行车打比方,你就骑吧,我采集你的数据,然后我就能训练你怎么骑了。

 

神经网络再次成为热门后不久,再次落入低谷。原因是计算能力还解决不了大型的问题,另外神经网络到现在都一直缺乏理论,得依靠经验和数据获取。

 

上世纪90年代后期,甚至于有人说人工智能是伪科学,那时候很多人都不说自己是搞人工智能的,包括IBM“深蓝“的设计者,他在书中说深蓝不是人工智能。

 

后来随着互联网的发展,人工智能又逐渐热起来了,我上课的时候就说,互联网拯救了人工智能。原因就是随着互联网的数据多了,虽然人工智能的处理能力还是很差,但是没有它就不能用。

 

举一个简单的例子,互联网上有很多信息,如果没有搜索引擎你也找不着。最初搜索引擎并不一定能直接给我最好的结果,但是我翻三四页可以找到我需要的。互联网给人工智能提供了很好的应用场景。随着数据获取方便,人工智能的水平也逐渐提高,再随着计算平台的增加,逐渐又火了。

 

前面提到的辛顿老先生,仍在孜孜不倦。有一个图像检索国际比赛,他去参加一下子就拿了第一,这下大家认识到,深度学习真能解决问题。有十几年历史的语音识别研究,引入深度学习以后,错误率一下子降低了30%。这些引起了大家的注意,深度学习逐渐成为热门。这次AlphaGo也是很大程度上得益于深度学习。

 

不要对“人工智能”概念想入非非

 

人工智能这个词现在来看可能取得有点问题。在60年前提出这个词的时候,也是有争议的。当时还有另一个提法叫做“复杂信息处理”,经过讨论,大家还是更认可人工智能。

 

这个词容易望文生义,给人无限的遐想。我遇到非这个行内的人,谈到我做什么工作,我解释大概这么做的时候,对方说得最多的一句话是:你做的不是真正的人工智能。

 

实际上现在说人工智能,有一定的限定含义。现在一般是指用计算机的技术实现某种技能。如果将来通过生物可能是另外一回事。

 

现在人工智能可以在某些方面做得很好,甚至超过人。比如说下围棋。但是从方法上来说,它还是在一定的限度内,它的模型实际上是限定了它的解的空间。好比我们在一个房间里唱歌,找一个唱得最好的,唱得再好也是在这个房间里最好的。深度学习看起来很神奇,但是它学习的东西也是在一定范围内找。比如说AlphaGo本身就是学下棋,它不可能在棋谱中学发怒。它的目的就是赢棋,他也不讲究下棋是不是漂亮,反正我赢了就行了。

 

强人工智能还没见到曙光

 

目前的人工智能,可以在很多方面超过人,但是综合起来它又没有这种能力,至少到目前为止还看不到任何希望。还是在弱人工智能阶段,真正全面超过人的强人工智能,至少我还没有看到这样的话。

 

目前的人工智能在很多方面得到了应用,但是还有很多方面应用得不好。AlphaGo的成功很大程度上可以给我们一个信心,在某个我们认为挺难的方面,利用我们已有的技术使用极致以后,可能会达到很高的水平。

 

但是现在基本上应用好的都跟数据有关系,无论是机器统计的学习,还是经常说的深度学习,都是基于大量的数据,综合出一个规律性的东西。数据少了这件事就不行。

 

现实中小样本学习是很常见的。小样本更多需要的能力是举一反三,比如教小孩认字,写一个“马“字,我今天写大点,明天写小点,他都认识,不需要多少个样本。现在的机器学习,每个字可能得采集几百个,甚至是上千、上万个样本。

 

前几天《科学》上发表了一篇论文,靠人的方式总结了一点规律,把一个字的笔划拆开变形,机器能认出来。但是这还只是在很小范围内的进展,小样本学习的研究还远远不够。

 

另外,人类的思维很多方面是靠推理,而现在深度学习从某种程度上还只解决了感知的问题,至少现在推理还没有成功的应用。

 

所以,强人工智能至少现在还没有看到什么曙光,至少从我这个角度,也许我的目光比较短浅,没有看清楚。