真正的AI和深度学习是什么?

2018-08-07 10:49:25 199

在科技行业中,人工智能已经越来越普及了。目前,我们所知道的是,人工智能主要被应用于Gmail里回复邮件、无人驾驶汽车、以及帮助我们处理节假日的照片。Mark Zuckerberg (马克·扎克伯格)甚至还打算建立一个人工智能管家。问题是,大家心中的人工智能还停留在科幻电影中,而不是自动的垃圾邮件屏蔽器。众所周知,人们担心的事情是AI(人工智能)将会伤害人类。

高科技公司也只是在某些程度上,鼓励人们忽略人工智能和科幻电影里的AI之间的区别,但是当你努力去理解我们的计算机正在做什么时,你就会非常容易了解到它们之间的差别。考虑到这一点,这篇文章旨在解释人工智能在消费类应用中最常见的方向,以及我们技术目前的局限性,以及为什么我们不应该担心机器人会起义。

“神经网络”,“机器学习”以及“深度学习”真正意味着什么呢?

这三个术语最近可能频繁出现在你的耳边。神经网络位于最底层——它们是构建人工智能的计算机结构。机器学习是下一个层面——这是在神经网络上运行的一个程序,训练电脑在众多数据中,寻找正确答案;深度学习位于顶层 ——它是一种机器学习的特别类型,在过去十年中,也只有它普及起来了,很大程度上要归功于廉价的处理能力和丰富的互联数据。

神经网络的概念可以追溯到上世纪50年代,这还是AI(人工智能)的起源阶段。总而言之,这些网络是构建计算机的一种方式,它看起来像大脑中的一部动画片,由像神经元一样的节点连接在一起,然后展示在网页上。如果这些节点是独立的,它们发挥的作用就非常有限,只能回答一些非常基本的问题,但是,如果它们聚集在一起,就能够解决困难的问题。更重要的是,只要算法正确,它们还拥有学习的能力。

例如,正如纽约大学计算机科学系的教授Ernest Davis(欧内斯特·戴维斯)所说,你希望一台计算机能够知道如何过马路。如果是传统的编程,你就会给它定制出一套非常精确的规则,告诉它如何分辨左右、等待汽车、使用人行横道等等,然后才能过马路。如果使用机器学习,你只需要给它播放1万人安全过马路的影片(以及1万人被车撞的影片),它就知道如何过马路了。

最棘手的问题,就是如何使计算机从影片中获取信息。在过去的几十年中,人们已经尝试了各种不同的方法,来试图教计算机获取信息。这些方法包括,例如:强化学习,当它做的事情是你所想要的,你就给予这台计算机一个“奖励”,逐步优化形成最佳解决方案;以及遗传算法,类似于物竞天择。今天在使用电脑的教室里,有一个教学方法非常有用:深度学习——机器学习的一种,在一个神经网络中,以不同的抽象方式,使用大量的层来分析数据。所以,如果一个深度学习系统正在看一张图片,每一层基本上可以对其进行不同程度的放大。底层可能看到的只是一个5×5像素网格,只需回答“是”或“否”,只需要判断一些东西是否呈现在网格上。如果回答“是”,那么上一层将查看该如何把网格融入一个更大的模型中。例如,是以一条线开始,还是以一个角落开始?这个过程逐渐优化,允许软件通过逐步分解的方式,甚至去了解最复杂的数据。

“随着这些层检测到的东西越来越多,越来越抽象,然后,顶层就有一个探测器可以告诉你看到的是一个人还是一条狗,或是一架滑翔机,等等,”Yann LeCun说,他是Facebook人工智能研究小组的负责人。

接下来,让我们想象一下,我们要教计算机使用深度学习来识别一只猫。首先,我们会选择一个神经网络,并且编程为不同的层,去识别猫不同的元素:爪子,脚掌,胡须等(每一层都事先设定好,使其能够识别特定的元素,这就是为什么称它为深度学习。)然后,网络展现出很多猫和其他动物的图片,并且告诉它哪个是哪个。随着神经网络看到大量各式各样的图片,使用不同的层和节点,它就会认识爪子,脚掌,胡须等。随着时间的推移,它就会记住和猫有联系的元素,无视没有关系的元素。例如,它可能会发现爪子和猫是强烈相关的,但是要判定是一只猫,它还要学会识别必须胡须和爪子同时出现才可以。

由于系统会不断的自我优化,它需要一个长期的过程。要么人类给它定义正确的答案,使其朝人们想要的方向发展。要么,计算机通过不断的自我完善,筛选出人们最理想的答案。现在,你可以想象识别这个物体是否是一只猫,需要多少步骤,因此这些系统必须认识存在于这个世界上的一切东西,这确实非常复杂。

就像微软非常骄傲的狗类识别软件“Fetch”一样,可以识别不同品种的狗。杜宾犬和雪纳瑞之间的区别对于我们来说,是一眼就可以知道的,但是,计算机就没有那么简单了,在此之前计算机需要事先被大量定义。

这真的是谷歌、Facebook和其他搜索引擎正在使用的东西吗?

对于大部分搜索引擎来说,是的。

现在深学习技术被广泛用于日常的各种任务。许多大型高科技公司都有自己的AI(人工智能)部门,而且Facebook和谷歌都已经通过他们的一些软件open-sourcing,努力推出开放式的研究。甚至在上个月,谷歌推出了为期三个月免费的深度学习在线课程。这些企业机构每星期都会推出对于这项技术新的应用:一切从微软的“emotional recognition(情感识别)”网页APP到谷歌的Deep Dream图像。这就是为什么深度学习频繁出现在我们耳边的另一个原因:一些面向消费者的大型公司,都是这样玩的,他们会分享他们正在研究项目的过程中,出现的一些怪异事情。

然而,虽然深度学习已经被证明善于执行语音和图像识别任务,并且已经大量应用于商业中,但是,它仍有很多的局限性。深学习技术不仅仅需要大量的数据和微调工作,而且它们的智力也是狭窄而脆弱的。正如认知心理学家Gary Marcus(加里·马库斯),在《纽约人》中写道,目前流行的这个方法缺乏代表因果关系的方式(如疾病及其症状之间),并很可能面临缺乏抽象思维的挑战。他们没有逻辑推理的方法,并且它们整合抽象知识的能力也有待提高,比如关于这些信息:这个是什么,该如何使用它”。换句话说,它们没有任何常识。

例如,谷歌研究的一个项目中,一个神经网络在进行样本图像训练后,被用来产生一个哑铃的图象。它产生的哑铃图片是相当不错的:两个灰色圆圈连接水平管。但是,在每个水平管的中间是一个健美的肌肉手臂轮廓。这是因为网络在训练时,常常呈现给它的图片是一个健美运动员手持哑铃。深度学习也许能制定出哑铃图片,但是它永远不会有认知的飞跃,不会想到哑铃没有手臂。这些各种各样的问题并不只是由于它们没有常识。主要因为它们检查数据的方式,深度学习网络也许会被像素的随机模式所愚弄。

这些局限性虽然可以很巧妙地隐藏起来。例如,数字助理Siri表现的似乎能够理解我们 ——回答问题、设置报警,并告诉我们几个预编的笑话。但是,正如计算机科学家Hector Levesque(赫克托)所指出的,这些怪癖就显示了AI和真正智能之间的差距有多大。 Hector Levesque(赫克托)使用图灵测试的例子,在这个挑战中,有技巧的机器人是表现最好的,让人们觉得它们真的在和人类谈话。它们使用笑话、询问、情绪爆发、误导等所有方式来迷惑和分散提问者的注意力。如果这不是人工智能,那这是什么?

使用人工智能术语的难点之一:它太难以去定义了。事实上,在行业内,这是不言自明的,那就是机器不久就能够完成所有人类可以胜任的工作,不论是下棋还是面部识别,但是,它们还是无法取代人类的智慧。

正如计算机科学家Larry Tesler(拉里·泰斯勒)说的那样:“智慧是任何机器都还无法拥有的。”即使是计算机可以胜任的任务,它们也只是复制人类的智慧来完成它。“当我们说神经网络像我们的大脑时,是不正确的,”LeCun说。“这和飞机并不是鸟一样的。它们无法扇动翅膀,它们没有羽毛或肌肉。”如果我们确实创造了智慧,他说,这“也不会像人类智力或动物智慧那样。”

很多从事人工智能领域工作的人都不屑这种想法:我们将可以创造有真正想法的人工智能。“一个程序无法在同一时刻,执行很多灵活和复杂的任务,”Andrei Barbu(安德烈·巴尔布)教授说,他是麻省理工学院大脑、思想与机器研究的核心人物。他补充道,有效的人工智能研究仅仅是创造系统,可以微调来解决特定的问题。

他说,虽然已经有人进军监督学习领域,系统不需要以任何方式如贴上标签来处理数据,但是,这项工作还处于起步阶段。其中一个广为人知的例子,是由谷歌创建的一个神经网络,它可以同时观看1000万个视频,随机读取YouTube的缩略图。最终,它教会了自己识别一只猫,但它的创造者没有对它的能力有过多要求。正如去年,LeCun在奥兰治研究所活动上说:“我们不知道监督学习怎样去工作,这是最大的障碍。”

人工智能作为一个研究领域,也具有炒作的倾向。经常看到有这种那种新方法被发现,进展迅速,评论员(通常是计算机科学家)大胆声称,这一比率的提高将继续下去,直到我们创造出机器人管家。

自从1958年,就可以从纽约时报看到类似的文章,例如,描述AI非常早期的形式——一台计算机能够区别左和右——作为一个电子的“胚胎”,有一天将能够“走路、说话、看、写、复制自身,并意识到自己的存在。”当这些种种承诺都没有兑现时,该领域往往陷入被称为AI的冬天——悲观和资金减少的一个时期。(历史上曾经出现过轻微的AI冬天,主要在70年代末和90年代初)。虽然这是真的,科学研究的各个领域都会经历休耕期,值得一提的是,很少有学科像这样辜负自己的粉丝,他们为后者想出一个特殊的名字。

难道说:人工智能只是噱头吗?

其实,也不完全是。这取决于你想要AI成为什么样。我们的机器确实是越来越智能,但不是我们所认为的那样。以自驾车软件应用于Tesla(特斯拉)汽车为例。该公司的首席执行官Elon Musk(伊隆·马斯克)将其描述为一个“蜂巢学习网”,有一池的数据,以便“当一辆车学会某项技能时,很多车子都开始学。”这项研究的终点不会只是一个只会回答问题的AI,人工智能将会越来越智能化——正如LeCun所说的“隐藏的智能”。

试想一下,在未来,您拥有一个完美的自动驾驶汽车,配备了先进的数字助理——也许是Siri的后代之一。这可能是Levesque瞧不上的某种骗人的聊天机器人,但很多人却把它当作人来看待。在早晨上班时,互相开玩笑,聊新闻消息,在您的日历安排日程,自主驾驶汽车不仅仅学会交通规则,而且也要知道如何去理解其他司机不一致的行为。当我们真的走到这一步时(这是几乎肯定可以实现的目标),我们还会真正关心我们没有“真正的”人工智能吗?

电话咨询
课程大纲
精英导师
QQ客服