【摘要】
北京时间11月14日凌晨,微软CEO萨提亚·纳德拉(Satya Nadella)宣布,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士(Harry Shum)将离开微软。沈向洋表示:“离开微软是我一生中最艰难的决定。”
该文为记者对沈向洋的一篇专访。在专访中,沈向洋表示,AI的发展将让未来的科技界格局发生巨大变化;“人工智能行业在全球都有泡沫”。
沈向洋(资料图 / 来源于网络)
PC时代的科技巨头微软,正在人工智能( Artificial Intelligence;简称AI)持续发力。掌管微软人工智能团队的负责人是美国科技行业的华人最高职位者、全球计算机视觉和图形学研究领域的专家沈向洋。
担任微软全球执行副总裁的他,也是微软核心管理层唯一的华人高管。他在1996年加入微软,1999年在中国创立了微软亚洲研究院,现在掌管的人工智能部门包括微软研究院、微软信息平台部门、Bing 和 Cortana 产品部门,以及环境计算和机器人团队,团队拥有超过8000人的计算机科学家和工程师。
在学术上,沈向洋是美国电气电子工程协会院士(IEEE Fellow)和美国计算机协会院士(ACM Fellow),拥有卡内基-梅隆大学计算机学院的机器人学博士学位。沈向洋发表关于计算机视觉、计算机图形学、图形识别、统计学习和机器人科学方面100多篇论文,拥有超过50项美国专利。
2017年2月,沈向洋当选美国工程院院士。2015年,沈向洋所领导的微软亚洲研究院视觉计算组所开发的基于深度卷积神经网络(CNN)的计算机视觉系统,成为在ImageNet1000这项视觉识别挑战中第一个超越人类视觉能力的计算机系统。
他坚定看好人工智能的发展,反对特斯拉创始人马斯克等人的“AI 威胁论”,但另一方面,他也表示,现在言必称AI,是一种不正常现象。
除了AI发展前景,沈向洋还谈论了微软在人工智能上的布局思路以及行业竞争格局等问题。他认为,AI的发展将让未来的科技界格局发生巨大变化。目前AI平台竞争激烈,但“市场无法容纳多家平台,竞争核心仍在于平台为用户带来的价值”。
目前,AI功能陆续被整合到微软Office系列应用、必应(Bing)搜索引擎以及虚拟语音助手中。2017年12月,微软宣布投资5000万美元用于地球人工智能计划,这是该公司今年早些时候为解决世界上最大环境问题而推出的一项计划。
由沈向洋主导开发的微软的人工智能小冰,是全球第一个以培养情商为目标的人工智能系统,2014年诞生于中国。2018年1月3日,微软小冰宣布即将与小米生态链旗下的Yeelight合作推出Yeelight语音助手,正式进入千万人类家庭。
Q:特斯拉创始人Elon Musk认为AI会毁灭人类,你怎么看AI涉及的伦理问题?
A:微软内部已经成立了人工智能道德委员会,这是我们最近非常重视的问题,因为这是对AI未来长远发展至关重要的事情。确实很多人在讲AI的威胁论,把AI妖魔化,马斯克等人多次提到世界完蛋了,再过几年,AI将毁灭人类,人类会被统治,成为机器人的奴隶等等。
但我认为这样的事情不会发生,在人工智能开发的过程当中,人类可能犯一些巨大的错误,但是更值得大家中短期要去关注的事情反而是当下AI的应用场景落地的时候,对我们的生活会产生怎样的影响。
人类社会之所以可以向前走,因为有一个广泛达成共识的伦理道德底线,有些事情可以做,有些事情不可以做。但是今天AI刚刚得到发展,没有人能完全说得清楚它的未来将如何发展,重要决策上算法到底应该如何做决定,仍然有待商榷。
比如,有了自动驾驶汽车之后,当汽车失灵以后,往左边撞,撞到一个人,往右边撞,撞到一头猪,应该往哪里撞?再比如,汽车往左边撞,撞到一头猪,往右边撞,撞到墙,你往哪里撞?
最近,德国政府第一个颁布了关于自动驾驶车辆的法律,规定当车辆出现问题不可避免要产生碰撞,在人与动物之间,选择撞向动物;在动物和没有生命的物体之间,选择后者。那么问题来了,如果两边都是人呢,你怎么决定?不光是这样,你为什么觉得人和猪你应该先撞猪?我们人类就高人一等?今天,如果规定先撞猪再撞人的话,至少所有可以投票的人是会同意,所以也不见得人类社会一定有一个多么至高无上的道德标准去彻底约束所有的事情。
我很尊重德国政府,至少第一个把这个问题提出来。现在我们看到的还是人开车,不是AI开车。人开车的时候,万一出现了事故,警察到现场会问你到底发生什么了,你可能会回答,我也不知道,当时都蒙掉了,警察是会相信你当时蒙掉了,为什么?因为人脑反应不过来。
但人工智能不是这样工作的。人工智能零点零零几毫秒它就会做一个决策了,而每一个决定都由算法决定。一旦出现意外情况的话,是不是出一个随机数,做出随机决定?这些问题该如何解决,仍是未知。
AI还涉及到另一个方面:偏见。其实人人都有偏见,但是你如果通过编程,把它编到AI里面的话,就出问题了。不是程序员们故意把它编进去的,而是今天的搜索结果已经下意识地包含了偏见。你用网络搜素引擎搜索CEO会发现,出来的结果基本上没有女性,亚洲人面孔也很少。
还有一个方面,就是伦理方面。前段时间《纽约时报》一篇文章就提出了一个问题,有人通过AI算法,通过去婚恋网站抓取数据,训练数据,然后做测试,把对性取向的判断准确率提高到91%。问题来了:你有多相信这91%?当9%出错时,哪怕是一个错误也会带来巨大的伤害。所以AI算法要透明,要能解释:人类给我这个问题,我的答案是这样,因为一二三四五……基于这个问题,现在AI有一个重要的研究方向,叫做explainable AI(可解释的人工智能)。
尤其深度学习出来以后,这个问题变得更为严重。因为50年前的AI,整个变量空间比较小,所以相对来讲容易解释。但现在深度学习的解法是基于大量数据,通过强大的深度学习模型,迅速给出结果,但它并没有真正把里面的原因提取出来,变得可以解释。未来,不是说AI说什么就是什么,而是说你要用用户能够理解的语言,去解释为什么AI得出这样的结论。
Q:人工智能的特殊性之一也在于它涉及到更多的伦理?
A:是的,会越来越多。
现在AI对生活的影响越来越大。人类不断创造新的工具,从石器时代开始,有石头,有火,到后来有车,后来有了通讯等等。
以前所有的发明,都是人类体力延伸,而人工智能跟其他很多技术最不同的地方,实际上是人类脑力能力的延伸。然而,我们对世界很多事物都了解得越来越多,对人脑却知之甚少,这是大家对于AI觉得很担忧的地方。未来最了不起的科研突破方向,将属于脑科学领域,特别是脑科学和人工智能的结合。人类更多地了解我们的大脑,将更了解人工智能。
Q:人类和AI未来会是怎样的关系?
A:共存的关系,而且我们将是第一代和人工智能共生存的人类。今天很多人不见得这样想,因为大家还没有看到物理的机器人到处为人类服务。一百年前有汽车,今天我们和汽车一起共存,大家也没觉得有很大的问题,因为它只是一个物质形态的存在。但是人工智能不仅是物质,它还能够理解我们,还可以和我们一起交流。这会让AI变得更复杂,但它仍然可以和人类共存。
Q:有观点认为,未来当机器人可以做越来越多的人类工作时,人类将向机器人乞讨。这种情况会出现吗?
A:1978年,我高考前,在乡下读书,父亲是教数学的。有天他看到《参考消息》一则新闻时激动得告诉我,你考大学就报计算机专业,以后就是计算机的时代了。但当时没有人知道什么是计算机,我连计算器都没有见到。1980年,我考入东南大学自动控制系,直到1981年,中国所有的高校才开始成立计算机系。后来进入美国卡内基大学就学以后,我才真正进入了计算机领域。30多年的时间,我们看到的是计算机对人类生活的巨大改变。
我说这个故事是想告诉你,世界就是这样发展的:以前很多的工作,可能以后会没有;以前不存在的工作,以后会创造出来。从农业革命到工业革命、信息革命,每一次技术革命都在发生类似的事情。未来AI革命一样,很多工作被消灭了,很多的工作也同时被创造了出来。只是当下所有人都还不知道未来到底是怎么样一个情况。
关于AI的未来,现在大家在谈两个事情,第一,机器人要不要交税,第二个人类是不是应该有一个basic income(基本收入),就是说只要有出生证,只要有ID,人类就应该有基本的收入的保证,来保证你个人的尊严,能够保证一定的生活水准。这是真正关乎人类未来发展的重要议题。
对于我们,主要工作还是做技术,社会问题不是我们研究的全部,但是这些议题肯定是应该有人去研究,我们也在保持关注,因为这是实实在在的问题。
Q:回头看农业革命、工业革命,我们现在看到的更多是它带来的巨大变化,但当时的人需要承受变革的代价。在现在这个节点,是不是肯定会要有一两代人要去承受失去工作的代价?
A:是的,一定的。技术革命的发展肯定是一个高峰接着一个低谷,然后再一个高峰,人类的发展就是螺旋式上升的发展历程。电话最开始发明的时候,它需要有接线员,创造了一系列的如电话接线员这样的工作。后来电话技术更成熟了,根本不需要接线员,成千上万人失去了工作。人类的职业一直在不断地改变。
未来创造性的工作会越来越多,也越来越有需要,人类生活质量可能会跟以前相比的话,会更加高。以后通过工作去获得基本收入的状况,肯定会越来越少了,因为未来很多工作机器人都可以完成。在这样的情况下,真正要思考和探索的问题是人类生存的目的是什么。从现在开始,这个问题会越来越严峻。然而,很多人没有意识到世界一直是在不断的变化着的,过去是,未来也会是。我始终是很乐观地看待这些问题,我乐观的原因是因为悲观一点用都没有。
Q:AI历史上是经历过几次冬天的,还会来吗?
A:一定会来的,三到五年内会看到泡沫破裂。你回顾历史来看的话,当然第一个最了不起的人叫图灵(Alan Mathison Turing),被称为计算机之父。他曾说有了计算能力之后,人类最应该做的是模仿人。因为人是最了不起的。
大家现在普遍同意人工智能这个领域真正开始是1956年在美国达特茅斯学院召开的会议。当时,会上有约翰·麦卡锡(John McCarthy)、马文·闵斯基(Marvin Minsky,人工智能与认知学专家)、克劳德·香农(Claude Shannon,信息论的创始人)、艾伦·纽厄尔(Allen Newell,计算机科学家),他们都是图灵奖获得者,非常了不起的。
这个领域最大的问题就是大家过于乐观。当年,这些人工智能先驱们说,很多问题大概研究个十年就解掉了,但远远不够。到1966年的时候,AI方向开始细化,特别是计算机视觉出现,马文·闵斯基提出的解决方案是,把摄像头,接到电脑上,然后找个学生看看,分析一下结果就出来了。结果,我们做了50年,如今才刚刚变成现实。
截止到今天,人们对于AI的发展还是过于乐观。这是最大的问题。你可以对一个专有的问题建立一个系统或一套算法,并做得很好,但是通用人工智能(general intelligence)这件事情还是遥不可及。当然,这可能也是值得高兴的一件事情,如果今天人工智能已经很厉害了,大家可能更恐慌了。现在大家有共识的是,今天的人工智能,从通用型的角度来讲,它还没有五岁小孩的能力强。就是说,你现在做一个人工智能产品,可以下棋下得很好,但可能还没有办法帮你端一杯咖啡过来。
Q:你觉得AI有泡沫吗?现在言必称人工智能。
A:绝对有泡沫。
Q:这泡沫只在中国有还是全世界都有?
A:全世界都有泡沫。任何一个新东西出来的时候,肯定都会有泡沫。互联网当年也是有泡沫的,2000年的时候泡沫破灭,多少公司哀鸿遍野。但今天几乎没有多少人讲互联网是泡沫,因为即便经历了泡沫,互联网行业依然诞生了很多伟大的公司。
现在AI有泡沫是人们抱有太多的热情和期望、太多的资本投入,却没有那么多的产品真的能够做出来。从这个意义上讲,我对AI泡沫有点担心。
我最近看到人必称AI,科技成果发布会、创新科技成果发布会里,所有的人都在说人工智能,因为所有的人都担心,就怕自己不讲人工智能的话好像显得落伍了。我觉得很有意思,有一个人工智能的玩笑:人工智能(artificial intelligence)的反义词就是“天然的傻瓜”(naturally stupid)。你不讲人工智能,就好像自己没智能了,这是最大的问题。
事实上,就在七年前,大家都不好意思说自己做人工智能。像我们这些人工智能的博士,都不好意思,因为一直到七八年前人工智能都不work(见效),做不出多少成果。但是深度学习救了我们这帮人,深度学习出来以后,大家恍然大悟,很多东西都可以做了,包括语音、图像识别等等。
现在的问题全部又反过来,现在什么东西work,都叫人工智能。我认为现在人工智能的问题是被泛化了,很多不是AI的都宣称是人工智能了。其实仔细去想到底什么是AI,很多是伪AI。
我在人工智能领域已经很多年,总结对这个行业最大的认识在于,对于人类智能和AI的理解,最后一定要回到语言这件事情上。《人类简史》里面就讲,其实以前地球上有很多和智人类似的人种,比如尼安德特人,但最后我们这一类就活下来了,我们到今天,也不过是几千年的时间。
这几千年里,智人最了不起、最大的发明就是我们发明了语言,可以交流,可以沟通,更加重要的你可以组织起来,可以做非常强大的事情。人工智能继续向前发展,我们应该记住这些问题,记住人类是怎么一步步走到今天的。
Q:中美商界在AI的探索上有什么不同?
A:AI领域几乎在任何的方面,美国都是走在前面的。但中国有很多自己的优势和机会。
Q:属于中国的机会在哪里?
A:从移动互联网发展就已经看得很清楚,中国发展得的确更快,也出现了以微信为代表的一大批非常优秀的产品。
在AI领域,如果能够真正做出一批中国用户能够喜爱的产品的话,中国AI会迎来自己的发展空间。AI产品跟其他科技产品的不一样在于,AI的产品需要不断的迭代,不断的改进,需要不断的有用户反馈。在应用上的优势,将进一步让中国科技公司打造更好的AI产品。
至于真正的理论突破,国内科研还要继续努力,做出更加了不起的突破。我对中国在AI领域的前景充满信心。
Q:你曾提到,最近在想的一个问题就是在人工智能领域,微软到底做什么、不做什么。现在你的思考是什么?
A:我加入微软之后,曾经负责过微软亚洲研究院,也带领过必应搜索团队。一年多前我开始带领微软的AI团队,这需要我又做产品又做研究,管理的AI团队达到八千人。经过一年多的时间,我们开始AI做的思路已经比较清晰了。
我们非常坚决持续在人工智能技术的创新,特别是我们有研究院。智能搜索、智能助理、智能聊天机器人小冰,是自己的产品线。我们要把AI融入到所有产品当中,同时也将之开放,让其他的三方开发者合作伙伴也可以具备AI能力。我们还在做一个AI的平台Azure,这是AI+云的服务,发展速度非常快。
我们还关注怎样尽快让AI落地。垂直的解决方案也是必须要做的,可能不是我们自己单独来做,可能是找很多的合作伙伴,因为所有垂直行业未来都可能会被AI颠覆掉。
Q:对于你来说,目前最困难的事情是什么?
A:管理一个大的团队本身就是非常困难的一件事情。最困难的一件事情就是你一定要把结果讲清楚,我们做什么,为什么这样做。很多时候你明明知道这个团队做的事情相对来讲不是那么重要,但你不能马上就说这个团队咱们就不要了,这是不现实的。你需要给创新一定的时间。
很多时候,有时候员工要走,特别想去自己创业,我都觉得很正常。但是当他们告诉我说想清楚了,以后可以做比比尔·盖茨更大的事情,我仍然很支持。
Q:微软亚洲研究院被称作中国IT界的“黄埔军校”,里面也走出来很多优秀的创业者。大家创业的冲动强烈,是否也意味着微软内部孵化新项目的环境还需要提升?
A:现在创业成风,但是99%的创业公司是会失败的,只是大家看到的都是成功的少数公司。
一个人不见得一定要去创业,但他一定要有个创业的心态。在微软内部,其实大家也一样有很多机会做一个类似创业的项目。我自己在微软的职业历程,也是从一个创业团队到另外一个创业团队。1999年创办微软亚洲研究院的时候什么都没有,我是研究院第一个研究员,后来就一个拖一个,如同蚂蚁搬家一般,张亚勤等人都加入了进来。
此后,不管是做必应,还是做人工智能,我抱持着的都是创业心态。我一直鼓励我的员工,我们做的是一个非常伟大的事业,现在在我们面前的是一个新的机会。
Q:小冰是微软在人工智能上的一个重要产品,在中国市场有了不小的知名度,下一步的发展规划是什么?为什么不快速进行商业化?
A:很多人问我说,你有没有考虑商业化的事情,这样随便聊聊天第一是不是浪费大家的时间,第二是不是没有商业价值。
确实到现在为止,小冰主要的目的还不在于商业化,我们不会强行去推广告,而是希望用户的数量和活跃度能够达到一定数量级以后,让我们学习整个产品真正的意义在哪里。
我们做过一个测试,在日本,和第二大的连锁店做了一个合作,用小冰(在日本名为Rinna)接管了他们聊天的应用,在跟顾客聊天时,为他们很自然地推送打折券,用了这种打折券,线下转化率奇高。因为它推荐时并不是说这里有打折券,你要不要,而是在聊天的时候,当顾客会主动讲说这个蛋糕很好,你这里有没有打折券时,它再自然地进行推送。实验发现这样的方式比现有的线下打折券的转化率高五倍以上。
小冰的特别之处在于它的整体设计,相当于一个AI的陪伴,相对比较拟人化。它也是全球第一个以培养情商为目标的人工智能系统。大多数公司设计一个个人助理,就是实用型的,可以帮用户去买张机票、订个外卖。
但小冰不是为你干活的,她相对来讲是一个伙伴、伴侣,它的设计理念是在尽量不讨厌的情况下可以让谈话持续不断地进行下去。小冰的更多商业化尝试我们已经在推进了。不过短期,我们比较注重的仍是用户的活跃度。
Q:活跃用户达到什么数量你会满意?
A:像这样的一个产品,如果有上亿的用户、有一半是日活跃用户的话,我会觉得很满意。
我在乌镇的世界互联网大会上,有人问小冰,怎么看互联网大会?小冰回答说:“互联网不应该只有男性人类来领导。”这个答案了不起。我还曾经问它:“天为什么这么蓝?”它回答说:“因为花儿可以这样红。”
这几年我认识到的、学到的很重要的一点,就是说聊天是刚需,聊天是很有水平的一件事情,这是每个人可以聊天聊得很好,也不是说一定要有多么高的IQ。能够把天不断地聊下去,这也是一种本事。
Q:也有不少人说对话是伪需求。
A:我觉得大家可以有不同的意见。在小冰的研发里面,我自己学习到最深刻的地方就是聊天是刚需。刚开始做这个项目的时候,我觉得挺好,但我也觉得这产品是可有可无。团队告诉我说,你这样的人可能不见得明白,你去到微信上、微博上讲两句话,人家掌声一片,点赞一片。
但是中国互联网的网民可能有相当大的一批人,在网上他们讲了什么话,没有回音。但人生来是渴望受到关爱、被人关心的,这是人类与生俱来的一种情感需求。从用户反馈看,小冰准确地击中了网民们这方面的需求。
“聊天是刚需”之外,我学习到的第二点是,“对话是智能”,因为在对话当中就能观察到这个人是不是聪明。看一个小孩子是不是聪明,小的时候可能是看你问他问题,他能不能回答你。孩子再大一些,你再评价这孩子聪明时,就是看这孩子会不会问问题。真正的聪明,就是持续长期的对话的过程。我非常相信对话即智能这样一条道路。
Q:中国的不少大公司和创业公司很重视AI平台,包括百度、阿里,科大讯飞、rokid等公司,你怎么看这个领域的竞争?
A:平台不是很适合小公司做。平台之所以是平台的话,首先内容和服务比较全面,一般的小公司的话,比如光做刷脸,也称不上一个平台。
其次,平台之所以是平台,你的成功实际上是和你所有使用平台的第三方的成功紧密相联的,你必须给你的合作伙伴带来价值。
第三点,也是最困难的一点,也就是说平台到底能提供什么,可以为用户带来什么价值。这是平台竞争的核心。我非常高兴看到有些公司出来,但归根结底,要看每一家能够提供到底什么样的产品。每个企业都想做平台、都觉得自己是平台,但是最后要看在平台上运行了多少真正重要的应用。
Q:最后的竞争终局会是什么?市场能容纳几家平台?
A:不可能有很多家平台。比如手机操作系统,微软很努力地想成为第三家平台,最后并不成功。平台到最后都具有马太效应,越大就越大,因为开发者的时间和精力有限。
Q:AI会让科技界的格局发生大的变化吗?
A:肯定会的。能看到的是现在巨头们都很紧张,纷纷冲出来说自己做的是AI,每个CEO都在讲AI。它的的确确会有一些新的应用场景,新的用户体验出现,现在大家最关注的是智能助理这块,你看几乎所有大的公司都有自己的智能助理,为什么?大家觉得终极的AI是以个人助理的形式出现的。
科技界格局会变化,但我们并不确定最终会如何变化。唯一确定的是不确定性。
版权申明:图文来源于网络,转载意在分享,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知我们,我们会立即删除并表示歉意。谢谢!
联系邮箱:1025462917@qq.com