算力说
人工智能已经可以自动生(shēng)成以(yǐ)假乱真的人像(xiàng)照(zhào)片“忽悠”人(rén)类了。凭借“对抗神(shén)经(jīng)网络”,人工智能从(cóng)“学习”和“识别”进化(huà)到了“创造(zào)”。清华大学(xué)计(jì)算(suàn)机系(xì)教授、博士生导师邓志(zhì)东将此技术与深(shēn)度卷(juàn)积(jī)神经(jīng)网络、AlphaGo并称为人工智能的三(sān)大发展。当然,基于(yú)大数(shù)据和大计算的人工智(zhì)能也存在着“先天不(bú)足”,至(zhì)少在理解和“举一反三(sān)”方面还有很长的路要(yào)走。
一个颇为无聊的国外网站(zhàn)最近火了。
这一名(míng)为(wéi)“此人(rén)不存(cún)在(zài)”(ThisPersonDoesNotExist)的(de)网站没有任何界面设计,输入网(wǎng)址后显示的只有一(yī)张人(rén)像大头照。新(xīn)奇之(zhī)处就在于,每(měi)次打开或刷新页面,显示(shì)的照片(piàn)都不同,并且都不是真实存在的人物照片。
换言之,所有照片都(dōu)是随机“生成”的,而其(qí)背后正是人工智能的(de)支撑。可以看出,人工智能已经从“学习(xí)”和“识别”,开(kāi)始(shǐ)进化到“想象”和“创造”。从(cóng)网(wǎng)站上的照片来看,不(bú)仅实现(xiàn)了无(wú)限(xiàn)“生成”,而且(qiě)还生成(chéng)得不(bú)错——人物有男有女,有老(lǎo)有少,不同人种、不同角度、不同表情,甚至还有眼镜和佩饰,可谓以假乱真(zhēn)。
事实上,赋予(yǔ)人工智能(néng)想(xiǎng)象力和创造力的,正是被《MIT科技评论》评为2018十大科技突破之一的“对抗神经网络”。
据《MIT科技评论》介绍(shào),“对抗”是指两个神经网络使(shǐ)用同一个数(shù)据集进行训练。其(qí)中一个神经网络叫生成(chéng)网络(the generator),它(tā)的任务就是(shì)依照所见过的图片来生(shēng)成(chéng)新的图片,而另(lìng)外那个神经网络叫(jiào)判别网(wǎng)络(the discriminator),它的任务则是(shì)判断它所见得图片是否与(yǔ)训练时的图片相似。
慢慢地,生成网络(luò)创造图片的能力会强到无法被判(pàn)别网络识破的程度。经过训练的生成网络学会了(le)识别并创造看起来(lái)十分(fèn)真实的图片。这项技术(shù)已成为过(guò)去10年最具潜力(lì)的人工智能突破,帮助机(jī)器产生可(kě)以(yǐ)“忽悠(yōu)”人(rén)类的成果。
portant;" width="469" height="469" align="" />
生(shēng)成(chéng)式对抗网络“创造”出的人像(现实中不存在此人)具有十足“迷惑(huò)性(xìng)”
更令人惊叹的是,这样的“生成”还不限于图像。清华(huá)大学计算机系教授、博士生导师邓(dèng)志东近日(rì)在(zài)上海“张江(jiāng)·2019未来产业峰会”上提到:“两个卷积神经网络(luò)通过相互(hù)对抗,生成超分辨(biàn)率真实感的原创图像、声音、3D物体(tǐ)或自然时序数据(jù),这给AI带来一种类似于(yú)人类的(de)想象力。”
AI的(de)三大(dà)主(zhǔ)义与三(sān)大发展
令人叹为观止的人像“创造”背后,必然是对海量原(yuán)始照片的(de)学习。
邓志东认为,生物智能的(de)一个(gè)主要特征就是学(xué)习,而新一轮人工智能的鲜(xiān)明特点就是学(xué)习能力。无论是生物智能(néng)还是人工(gōng)智能,智能(néng)的主要特(tè)点就(jiù)是(shì)感知(zhī)能力(lì)、认知能力和(hé)行动能力。
追本(běn)溯源,智能的这三大(dà)特(tè)点源自连接主(zhǔ)义(yì)、行为主义和(hé)符号主义。连接主义是生物智能的解剖学基础(chǔ),即生物(wù)神经(jīng)系统所包含的神经元、神经元的活(huó)性及其相互(hù)作用。在此之上(shàng),行为(wéi)主义通过奖励(lì)/惩罚(fá)进行自主学习,强化学习也是人类和动植物行为(wéi)学习(xí)的主要方式(shì)。最后,符号(hào)主义极大促进了人(rén)类(lèi)的智力发(fā)育,尤其(qí)是语言的发明成为(wéi)了人(rén)类智能远超其他生(shēng)物智(zhì)能的分水岭。
以“三大主义”为基础,人工(gōng)智(zhì)能在最近五六年取得(dé)了飞(fēi)速发(fā)展。目前来看,在大(dà)数(shù)据(jù)和大计算的驱动下,深(shēn)度学习已(yǐ)成为计算机视觉(jiào)、语音识别与合(hé)成、自然语(yǔ)言处理和大数据分(fèn)析(xī)等的(de)主流方法。以深度卷积神经网络为(wéi)基础(chǔ)的新一(yī)代人工智能确实带(dài)来了更接(jiē)近于人类视听觉的感知能力。
因此,数据驱动(dòng)的方法已被(bèi)视(shì)为继实(shí)验科学、理论模型、模拟仿真之后的第四科学研究(jiū)范(fàn)式——数据驱动的科学范(fàn)式,其(qí)如同网络技术(shù),已(yǐ)逐渐变革为一种通用(yòng)赋(fù)能工具。从“互联网+”到“人工智能(néng)+”,新一代人(rén)工智(zhì)能已经远远超出了(le)计算机科学(xué)技术的范畴。
大数据和大计算让人工智能迎来(lái)了大发展(zhǎn),邓志东总结了人工智(zhì)能的三大(dà)进展。
首先是深(shēn)度卷积神经网(wǎng)络令大数据感知智能取得突破性进展。人(rén)工智能已经能获得更加接近(jìn)于人类水平的视听(tīng)觉感知能力和对文(wén)本自(zì)然语言的模式分(fèn)类能力(lì),从而赋(fù)能产品(pǐn)、流程和服务体验,引发(fā)了技术变革和产业革命。
这一领域最为(wéi)人熟知的例子就(jiù)是自动驾驶(shǐ),以全球首个自动(dòng)驾驶商(shāng)用服务Waymo One为例,其估值已超千亿美元。另外,在医学影像领域,谷歌的人工智能(néng)深度卷积神经网络已经可(kě)以根据视(shì)网膜影像来准(zhǔn)确判断(duàn)一个人的年龄(líng)、性别、血压、是否吸烟等,甚至可(kě)预测肺癌、乳腺癌(ái)等,达到了国(guó)际顶级(jí)医生的诊断水(shuǐ)平。
其(qí)次(cì)是(shì)超人类水平的AlphaGo引发全(quán)社会(huì)强烈关注,在此基(jī)础上进(jìn)化(huà)而来的AlphaZero更是带来了无需(xū)大数据(jù)就可自主学(xué)习的棋类(lèi)通用(yòng)人工智能。AlphaZero经过8小(xiǎo)时16.5万次训练,就击败(bài)了AlphaGo战(zhàn)胜李世石的(de)版本。
第三大(dà)进展是对抗性(xìng)神经网(wǎng)络带(dài)来了(le)超真实感(gǎn)的想(xiǎng)象能力,也就是上述人工智能“创(chuàng)造”人像的案例所(suǒ)表现的(de)。邓志东表示,生成式对抗网络(luò)(GAN)是目前(qián)最为成功的(de)生成式神经(jīng)网络模型,通过与强化学(xué)习及蒙特卡洛搜索(suǒ)等(děng)的结合,推动了半监督与无(wú)监(jiān)督学(xué)习方(fāng)法的发展。
portant;" />
清(qīng)华(huá)大学计算机系教授、博(bó)士生导师邓志东
大数据(jù)AI的先天不足
邓志东坦言,以大数据为燃料,喂食越(yuè)多,人工智能(néng)越(yuè)能获得更好的感知直(zhí)觉(jiào)。但问题随(suí)之而来(lái),首先是对大(dà)数据的清洗和标签(qiān)需要(yào)付出很高代价。
其次,在落地应用中,在开放环(huán)境下,实际(jì)是不存在完备的大数据的。对于(yú)各种应用场景(jǐng),大数据人工智能均只能获得较接近于(yú)人类水平的视听(tīng)觉等感知能力,这(zhè)与各种基于公开测(cè)评数据(jù)集得(dé)到的性能指标是完全不同的。简言之,人工智(zhì)能或(huò)许在测试状态下表现良好(hǎo),但(dàn)在实际落地应用中的表现(xiàn)却可(kě)能差强人意。
此外,基于深度学(xué)习的(de)计算机(jī)视(shì)听觉感知方法(fǎ)不(bú)仅依赖(lài)大数据的驱动,也缺(quē)乏人类(lèi)举(jǔ)一反三的,基于小(xiǎo)样(yàng)本的学(xué)习能(néng)力和对目标的认知水平的理(lǐ)解(jiě)能力,并且缺乏记忆、没有常识(shí)、不能运用经验,缺乏技巧和(hé)知(zhī)识学习能(néng)力。
比如,人们开车(chē)转弯或掉头就(jiù)是过程性经验。大脑记住后,每当转(zhuǎn)弯就不需要再思(sī)考,而是可以条件反射地做出动作。
人类的思维(wéi)方式并(bìng)不(bú)完全依(yī)靠(kào)特征提取,很(hěn)多时候是靠(kào)理(lǐ)解(jiě)和推理,但(dàn)目(mù)前人工智能(néng)并不具备这样的能力,也就不具有规划决策和思考能力。
邓志东把(bǎ)大数据人工智能面(miàn)临的(de)挑战归结为:人工(gōng)智能缺乏自己的语言。相(xiàng)比(bǐ)之下,语言却是人类(lèi)的“制(zhì)胜法宝(bǎo)”。他(tā)表示(shì),人(rén)类(lèi)高层认知能力(lì)其实是通过(guò)记忆语言去思考和(hé)推(tuī)理的。记(jì)忆以及知识的运用,都是基于语言的(de)。
另外(wài),大数据人(rén)工智能(néng)的发展,还会带(dài)来法(fǎ)律、伦理、隐(yǐn)私安全(quán)和失业等(děng)方面的挑战。
尽管当下的人工智能还非常弱,“落地(dì)”也只能在特(tè)定应用领域发(fā)挥作用,还极度依赖大数据。但随(suí)着人工(gōng)智能的进一步发展,也(yě)就是(shì)认(rèn)知智能和通用人工(gōng)智能的发展(zhǎn),或许会对技术与产业带来变革,甚至(zhì)威胁(xié)到人(rén)类(lèi)的安全(quán)。
“但总(zǒng)体(tǐ)来说(shuō),现在的弱(ruò)人工(gōng)智能对于(yú)人类(lèi)是赋能和有益的”,邓志东表示(shì)。
拥有自己语(yǔ)言的下一代人工智(zhì)能
对于(yú)人工智能的未来突破(pò)点,邓志东认为(wéi),关键就在于从感知智(zhì)能向认知(zhī)智能(néng)的进化(huà)。目(mù)前人工(gōng)智(zhì)能主要追(zhuī)求看清、听清,能够识别但没有理解,属(shǔ)于感知智能范畴。未来人工智能的发展目标将是(shì)如何(hé)看(kàn)懂(dǒng)、听懂和读懂,从(cóng)而具备基本的认知智(zhì)能,这也(yě)是从弱人工智(zhì)能向通用或强人工智能进化的方向。
所谓认知智能,就是指对目标或(huò)实体具有理解能力,理解事物(wù)的内(nèi)涵和外延。其发展趋势(shì)就是要探索举一(yī)反三的认知智能,即以(yǐ)大数据感知智能+图模型/知识图(tú)谱为基础,利用图卷(juàn)积(jī)神(shén)经网络从特征学习(xí)拓展到知识(shí)学习。
而通(tōng)用人工智能则(zé)包含了多任务的自主学(xué)习(xí)、自(zì)适应与自(zì)组(zǔ)织能力。其发(fā)展趋势(shì)是基(jī)于连(lián)接主(zhǔ)义的(de)深度神经网络,通过与行为主义的强化(huà)学习,特(tè)别(bié)是与具有(yǒu)学习能力(lì)的符号主义(yì)的有机(jī)结(jié)合,从AlphaZero这样的新起点出发(fā),发展出具有更(gèng)宽垂直领(lǐng)域的通用人工智能(néng)。
总(zǒng)之,通过深度学习与无监督学习(xí)、概率或模糊图模型知识(shí)图谱进(jìn)行深度(dù)融合,让(ràng)下一代人工智能拥有自己的语言,并能根据数据和常识自主学习(xí),是(shì)探索认知能力与通用人工智能的关键路径之一。