李飞飞:人工智能下一个春天是情绪和情感计算

本文中的预测,是基于 2012 年以来学术界和科技巨头实验室的研究思路的演变。

 
六十年前初识计算机的时候,人们就在想:是否有一天我们可以创造出一种人工智能,达到甚至超越我们人类的智能水平。
 
几十年过去了,AI 经过了几个寒冬。我们仍然没有了却几十年前的心愿。
 
今天,人工智能再一次火爆全球,我们似乎看到了人类科学正在加速冲向那个奇点。产业界和学术界都在不遗余力地进行 AI 研究,甚至流行的美剧《西部世界》也在讨论人工智能。
 
站在今天的时点上,人工智能到底有什么突破,未来的人工智能会向什么方向前进呢?
 
未来论坛2017年会的圆桌对话上四位人工智能界的泰斗大牛发表了自己的看法。
 
他们分别是:
 
李飞飞  美国斯坦福大学计算机科学系终身教授、人工智能实验室主任
李凯  普林斯顿大学 Paul & Marcia Wythes 讲席教授,美国工程院院士,未来论坛科学委员会委员
沈向洋  微软全球执行副总裁,微软人工智能及微软研究事业部负责人,未来论坛理事
张钹  清华大学计算机系教授、中国科学院院士、清华大学智能技术与系统国家重点实验室学术委员会名誉主任
 
李飞飞:人工智能下一个春天是情绪和情感计算-DVBCN
 
【画面从左至右分别为:主持人洪小文、李飞飞、李凯、沈向洋、张钹】
 
四位大牛似如山巅上的先知,通过他们的预言,似乎可以窥见人工智能的下一个春天。
 
Part1:对于目前人工智能的理解
 
张钹:举一百反一的人工智能和人类背道而驰。
 
大家都说人工智能可以做很多事情,我想先说说人工智能目前还不能做什么。人工智能学科从创立到现在,只往前走了两步。
 
第一步,是符号表示和推理模型。以前人工智能只是建立在数学模型的基础上。而推理模型在数学模型的基础上,把问题变成:如果可以把这个问题清晰地表述出来,用陈述性或过程性的语言,那么计算机就能解决它。当这个模型被提出来,人工智能解决问题的能力提高了一大步。这样,可解的问题就远比用数学表达的问题多得多。实际上,当时对人工智能的估计过高。因为人们发现,能“清楚表达”的问题很少。及时是理性思考,有很多问题都不能表述。
 
第二步,就是深度学习、数据驱动的方法。这又让人工智能向前迈了一步,而且这一步比前一步大得多。之前,我们可以用计算机解决的问题是“知其然又知其所以然”的问题。而有了深度学习,我们也可以解决“知其然而不知其所以然”的问题。特别是可以解决感知、视觉、听觉等方面的问题,例如:张三长什么样子,这个实在是不好表述。我们身边充满“说不清道不明”的问题,用新的深度学习技术可以解决很多这类问题。但是,我们的人工智能还没有到顶峰。目前的人工智能有三个限制条件。1、确定性;2、完全的知识和信息;3、封闭化、特定化的问题。
 
一个典型的人工智能可以解决的问题就是:阿法狗下围棋。
 
围棋有着确定的规则和目标;对方如何下子,盘面的信息,完全可以知道;而所有答案的可能性是一个封闭的。
 
处理带有这三个限制条件的问题,计算机肯定比人类好。但是如果缺一个条件,计算机就非常难完成了。例如打桥牌,答案不是封闭的,计算机就很难做了。
 
一年以前,如果我和微软小冰聊天。我说我叫张钹,小冰就会傻眼了。因为他没有我的信息。我如果说我是章子怡,小冰应该可以聊下去。所以,尽管小冰很厉害,但是和人的智能还是差得多。
 
深度学习目前有两个很难克服的重要缺点:
 
1、鲁棒性差。机器学习过的内容,和没学习过的内容,在识别效果方面差距太大。例如一个模式识别系统,经过训练可以很好地识别马、牛、羊。你给它一块石头,它有可能认为是马。
2、机器数据输入和输出结果差距太大。人的智能是举一反三,而机器是举一百反一。给几百万的数据,识别几万个目标。这和人类是背道而驰的。
 
所以,现在的人工智能还有很长的路要走。
 
李飞飞:人类的认知学,是人工智能下一步发展的突破口
 
很多朋友都知道我刚刚生了我们家的老二,还不到一岁大。作为人工智能研究者,我很高兴能体会当妈妈的感觉。之前张钹老师说感知代表了很多“不知其所以然”的问题,在现在大规模数据标注的情况下,都可以解决。
 
我觉得人工智能的下一步应该是认知。认知包括很多我们还不太清楚怎么用数学和人工智能表达的。比如:知识系统的建立、情感的产生和交流、好奇心和创造力驱动的学习,还有 learning to learn。这些都是认知的范畴。
 
确实,我们人工智能又迎来了春天,但下面确实还有很长的路要走。我认为下一步人工智能的发展,需要加强对情感,情绪的了解,要走进认知学,心理学。我说的不仅是脑科学,而是认知学。因为我们目前对人的情感理解非常少,而这对于人工智能来说是很重要的。
 
作为人工智能学者,能够得到这么多关注,我很高兴。但是我也担心这样的“泡沫”会带来什么。如果是更多的机会和研发投入,当然是好事;如果是过度承诺或者不切实际的产品研究工作,可能会对这个领域有些不好的影响。
 
李凯:人工智能发展,人的智能也在发展
 
我参加过很多论坛,大家都在问:人工智能什么时候能超过人?一般专家都会推断通用人工智能超过人的时间,一定在他去世之后的某个时点,例如:五十年后。到了要验证正确与否的时候,他已经不在了,也就不会有人追究他了。(笑)
 
但人们提出这个问题的时候,有一个假设条件,那就是:假定人自身的智能不再往前走了。但是,实际上人的智能还是往前发展的。如果现在我们对人的大脑有了新的了解,就可以很快帮助我们提高自己的智能。而人堆大脑的了解,也可以帮助提高人工智能的水平。
 
深度学习,实际上是把我们对人脑神经网络非常简单的理解变成算法。然后加之以数据,发现智能效果很好。但是,这些人脑神经的只是都是三四十年以前的知识。而我们在期待脑科学有新的突破,这些新的知识一定可以推进人工智能的一大步。所以说,智能这条路是很长很长的。无论对于机器,还是对人。
 
沈向洋:十年之内的人工智能可以想象
 
我在工业界工作,对人工智能的发展还是持非常乐观的态度的。虽然张钹老师讲人工智能存在种种问题,但是我们现在有数据,有新的算法。我很相信,五年之内,语音识别技术一定可以超过人;十年之内,机器视觉一定比人好。可以据此我们可以想象未来是怎样的图景。
 
站在今天来看,我们所有的商业应用都被颠覆了。从销售市场,到人事招聘,到用户服务,所有的商业环节都被 AI 改变了,所以从商业角度来看,我看到的是更多的机会。
 
Part2:深度学习到底是什么,未来可以看到它怎样的发展?为了人工智能的终极目标,除了深度学习意外,我们还需要哪些其他的研究方向?
 
张钹:人工智能到了秋天
 
五十年后的事情可能我说不清楚,但是我可以说说三五年之后的事情。很多人说究竟现在是人工智能的春天还是夏天?有人说春天,因为正在蓬勃发展。有人说夏天,因为有点热过头了。但是我说现在是人工智能的秋天。
秋天有两个含义。
 
一:秋天是收获的季节,我们有很多成果。人工智能现在有果实可摘。为什么我觉得很乐观?因为我觉得人工智能所需的三个资源都是无限的。1、大数据2、算法3、计算力。未来相当一部分人都会往这个方向去做,会在包括语音、图像方面取得很好的成果。
 
二、说秋天,是因为冬天就在前头。做科学研究,我们要知道冬天要来了。这意味着我们要考虑下一个春天要播种什么种子。也就是说,后深度学习时代,我们要搞什么事。第一点是脑科学。说到脑科学。人脑有很多层次。其中的智能分布还有大量内容我们并不了解,这些从顶下下,侧向连接等等模式,我们都还不了解。目前,我们对脑科学只学了一点,就有了这么多成果。如果我们研究更多,一定会有更多的成果。基于对人脑的深度研究,结合神经科学和脑科学,我们要发展新的计算模型。第二点是理性思考和感性。这两个能力对于现在的人工智能是很重要的。现在为止驱动人工智能就有两招:数据驱动和知识驱动。下面的发展就要把两招结合起来。特别是自然语言处理,离不开知识驱动,只靠数据是不够的。如果这两个能做好,人工智能就会迎来下一个春天。
 
李飞飞:情绪、情感是人工智能未来的方向
 
说到深度学习,“深度学习”大概在2006年被提出来,但是在2006年之前,“神经网络”这个概念已经存在了二三十年。神经网络领域里,很重要的里程碑是back-propagation。在九十年代,计算机视觉方面做出了 Convolutinal neuron networks,今年的 Deeplearning 基本是这个结构。
 
现在大部分成功的深度学习是神经网络是有监督学习。有完全的数据标注以后做的。很多人都在思考如何做无监督的学习,之前也有很多工具。深度学习革命性的一点是取代了对特征的加工。像之前的 SVM,都是“Engineering Feature”,而深度学习是直接学习数据。
 
深度学习不操作数据本身,而是对结构本身进行操作。这就造成了一种感受,深度学习本身结构太复杂了,例如152层,1001层。这里有巨大的空间,可以突破结构的层面。我认同张钹老师说的,数据和知识的结合。
 
现在我们的 AI 都是用逻辑的方法来判断情感。因为逻辑代表 IQ,而情感代表 EQ。人类的情感是非常丰富的。未来,从情绪到情感,最是人工智能未来前进的方向。
 
李凯:人工智能最需要“教科书”
 
任何工作都有近期和远期。近期人工智能的发展,我很认同李飞飞讲的,和深度学习有关。机器学习和以前的专家系统有一个非常不同的地方。专家系统是用软件把人的知识写到系统里。机器学习输入的是算法+知识,输出的是程序。
 
我和李飞飞和做的时候,我们两个是比较另类的的研究者。大多数人在算法上做,我们觉得应该发展知识。知识就相当于上学的时候的教科书。总要有人写教科书。如果没有人写教科书的话,学习方法再好,老师再好,你学的是一年级的教科书,也不可能成为博士。所以我觉得很多领域都需要有人写教科书。
 
学术界很多人的目标不是产生巨大的贡献和影响力。需要写很多文章,这样可以拿到很多资金。我们做的时候没有资金——申请的时候被拒绝了。
 
近期人工智能要想发展,一定需要有人做知识的积累和总结。
 
长远来看,我认同两位的意见,对人的大脑,人的智力是怎么工作的,要有更多的了解。这样才会帮助整个 AI 向前走。
 
沈向洋:先定个小目标:用人工智能治愈脑疾病
 
我很赞同各位的说法。在商业上,接下来三五年毫无疑问 AI 可以帮助我们解决很多问题。但是秋天过了,冬天我们要做什么呢?
 
我觉得有两点。
 
第一点,我觉得数据很多、算法互通,确实是取之不尽的。但是在计算能力这件事上,我们应该更加重视。几十年下来的摩尔定律,让我们可以把人工智能做到了今天,这是非常了不起的飞速增长的五十年。但是工业界普遍会认为,计算能力会慢慢降下来。这也是大家为什么都在非常认真地去做量子计算,也要到十年、十五年才能看到突破。今天我们 AI 向前走必须要考虑的问题是:计算能力的瓶颈。
 
第二点,我们要考虑为什么做 AI。是不是计算能力的增强,就一定会产生智能。从人脑的结构来看,我们应该定义一个小目标:利用符号学和深度学习做一些结合,希望在脑科学和人工智能结合上,解决几个了不起的问题。我自己想要解决三个和人脑息息相关的病。儿童孤独症、中年忧郁症、老年痴呆症。人工智能如果能解决这三个问题,就是相当了不起的成就。
 
张钹:计算机的空间结构极其简单,大脑的空间结构极其复杂
 
有关计算能力方面我想做一下补充。
 
同样的一个题目,在我们脑里解决一点不费劲,为什么在计算机里面就要这么多的计算资源来弄?我们要思考的是这个问题,而不是拼命加快计算机。
 
我觉得,正是因为我们过去走的这条路,迫使我们必须加快计算力。我的观点是,我们过去做的计算机,从空间结构来讲是最简单的,冯·诺依曼结构。而大脑的空间结构最复杂。你想用一个空间结构最简单的东西去做空间结构复杂的工作,它花去的代价就是计算时间的增加。世界上没有免费的午餐。
 
过去我们使用大量的计算时间来换取同样的结果,现在能不能改变思路。把计算机做一下改变,例如 IBM 公司正在做,让神经网络的复杂度提高,换来能耗和时间的降低。
 
至于量子计算,我觉得不要指望,量子计算不可能代替现在的计算机。我们要在现在的计算机基础上进行改造,也就是研究是不是能够加快计算机的运行。
 
中国已经实现从情绪分析到人心识别的转换
 
有专家认为,自然语言处理(NLP)是一座难以逾越的山峰。而李飞飞前文提到的情绪计算则是NLP中的珠穆朗玛峰!
 
人心难测,这是一道困扰人类千年的痛点,无数仁人志士都在苦苦寻求解决之道!
 
情绪计算和人心难测是否有某种关联?!沃民高新科技(北京)股份有限公司的研发人员给出了答案。经过多年的不懈努力,他们提出了人类社会活动四循环模型,依据对“心理——情绪——认知——行为”四种社会活动辩证关系的深刻洞察,在利用人工智能技术解决情绪分析的基础上,开创性的提出了计算情绪、测量人心的技术路径,从而获得了人心识别技术突破性的进展!
 
2015年,该公司技术研发团队参加国际情绪分类大赛,一举包揽了一半的冠军(6个数据集获得3个冠军)。依托情绪分析技术开发的选情监测系统成功预测了包括美国、韩国、法国、德国、英国等全球多个国家或地区的大选;满意度在线计算模型更是颠覆了传统满意度调查的方法;沃德股市情绪指数已经被中央电视台财经频道、第一财经等多家权威财经媒体广泛使用;基于情绪和行情数据建模的上证指数预测模型符合率在70%左右;其开发的沃德股市气象站APP已经上线运行,更是实现了天天抓涨停的惊人效果。
 
沃民公司已经服务了党政军警、商业机构、传媒机构、个人和机构投资者等多个领域客户,开发出舆情监测、选情监测、满意度在线智能计算、竞争情报、广告效果监测、网络水军监测、网络影响力评估、情报分析、炒股机器人、股票自动打新助手等一系列产品或服务。
 
从这个意义上说,面对即将到来的人工智能下一个春天,中国自主创新的科技企业又抢占了一个非常有利的制高点!
相关文章
四川省:2027年算力总规模达到40EFLOPS,5G基站总数达32万个
四川省:2027年算力总规模达到40EFLOPS…
【破局】这家广电有线省网将率先成立人工智能(AIGC)实验室?
【破局】这家广电有线省网将率先成立人…
中国电影电视技术学会发布《AIGC媒体应用产业图谱(1.0版)》
中国电影电视技术学会发布《AIGC媒体应…
以数实融合创新未来,探访泉城看得见的数智化新进展
以数实融合创新未来,探访泉城看得见的…
工信部陶青:5G行业应用覆盖到76个行业大类,间接带动总产出约14万亿元
工信部陶青:5G行业应用覆盖到76个行业…
工信部赵志国:全国已累计建成207个千兆城市,GAI服务大模型注册用户超6亿
工信部赵志国:全国已累计建成207个千兆…
我还没有学会写个人说明!