刚刚,斯坦福全(quán)球AI报(bào)告正式(shì)发布。
从去年开始,斯坦福大学(xué)主(zhǔ)导(dǎo)、来自MIT、OpenAI、哈佛(fó)、麦肯锡等机构(gòu)的多位专家教授,组(zǔ)建了(le)一个小组,每年(nián)发布(bù)AIindex年度报告,全面追踪人工智(zhì)能的发展现(xiàn)状和趋势。
“我们用(yòng)硬(yìng)数据说话。”报(bào)告的负责人、斯坦福大学(xué)教授、前(qián)任谷(gǔ)歌首席(xí)科(kē)学家YoavShoham谈到(dào)这份最新的(de)报(bào)告时表示。
今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展(zhǎn)的(de)现状,并(bìng)且记录了计算机视(shì)觉(jiào)、自(zì)然(rán)语言(yán)理解等(děng)领域的技术进展。
报告(gào)要点:
一、美国AI综合(hé)实力最(zuì)强
美国(guó)的(de)AI论(lùn)文发布(bù)数量虽然不(bú)是第一(yī),但(dàn)美国(guó)学者论文被引用的次数却是全(quán)球第一,比全球平均(jun1)水平(píng)高出83%。
2018年美国AI创业公司的数量,比(bǐ)2015年增长2.1倍。而(ér)从(cóng)2013年到2017年(nián),美国AI初(chū)创(chuàng)企业获得的融资额增(zēng)长了4.5倍。均高(gāo)于平(píng)均水平(píng)一倍以上。
二(èr)、中国AI追赶速度惊人(rén)
清华(huá)2017年学AI和(hé)机器学习的学生数量,是2010年16倍。
70%的AAAI论文来自美(měi)国或中国,两国获接收(shōu)的论(lùn)文数量相近,但中(zhōng)国提交的论(lùn)文总量比美国(guó)多(duō)30%。
基于经同行(háng)评议论(lùn)文数(shù)据(jù)库(kù)Scopus的数据,2018年发布AI论文最多的(de)地区是欧洲(28%)、中国(25%)和美国(17%)。
与2000相比,2016年中国(guó)AI学者论文被引(yǐn)用的次数,提高了44%。
中(zhōng)国一年(nián)的机(jī)器(qì)人部署安装量,从2012到现在增(zēng)长了500%。ROS.org来自中国的(de)访问量,2017年比(bǐ)2012年(nián)增加(jiā)了18倍。
三(sān)、全球AI发(fā)展(zhǎn)提(tí)速但仍不均衡
2017年,全球ML人才(cái)需求已经(jīng)是2015年的35倍(bèi)。
整体(tǐ)来说(shuō),自2016年(nián)以来,美国(guó)、加拿大、英国政府在国会/议会会议中(zhōng)对人(rén)工智(zhì)能和(hé)机器学习(xí)的提及(jí)激增。
80%的AI教授是男性,统计(jì)数据来自UC伯(bó)克(kè)利、斯(sī)坦福(fú)、UIUC、CMU、UCLondon、牛津和苏黎世联邦理(lǐ)工学院。
美国AI工作(zuò)岗位(wèi)的应(yīng)聘(pìn)者中(zhōng)71%为(wéi)男性。
看过这份报告之后,人工智能大牛(niú)吴恩达总结了两点:1、AI正在快(kuài)速发展,不管(guǎn)是学术界还是(shì)工业界都是(shì)如此(cǐ)。2、AI的发(fā)展仍不均(jun1)衡,在(zài)多样(yàng)性、包容性(xìng)方面仍需努力。
以下是这份报(bào)告的主要内容:
AI论(lùn)文情况分析
发表总量增(zēng)长迅猛(měng)
从1996年到2017年,CS领域的年发表(biǎo)论文增长了约五倍(6x),AI领域的(de)年发表(biǎo)论文增长了约七(qī)倍(8x)。对(duì)比一下(xià),所有学科的年发表论文总量增长(zhǎng)了不到(dào)两(liǎng)倍(
划重点(diǎn),AI论文的年发表量,比CS论文增长要快。
各地区(qū)AI论文发(fā)表情况
2017年,Scopus上面(miàn)的AI论(lùn)文,有83%来自(zì)美国以外(wài)的地方。具体数据是,28%来自欧(ōu)洲,25%来自中(zhōng)国,17%来自(zì)美国。
从2007年到2017年,中国的年发表AI论文数增长了150%。
细分领(lǐng)域论文发表情况
2017年发表的AI论文中,有56%来(lái)自机器学习与概率推理这一研究方(fāng)向。
对(duì)比一下,2010年发(fā)表(biǎo)的AI论文(wén),只有28%来自这个方向。
另外,图表里显示的(de)大(dà)部分研究方向,在2014-2017年间,复合年均增长率(CAGR)比2010-2014年要高。
比如,神经网络这一方向的(de)论文发表数量(liàng),2014-2017年之间,复合年均增长率达到37%(如(rú)图中红色曲线),最(zuì)为突出。
做个对比(bǐ),在2010-2014年之(zhī)间,神经网络论文发(fā)表数(shù),复合年均增(zēng)长(zhǎng)率仅(jǐn)有3%。
arXiv论文
自2010年以来,arXiv论文总(zǒng)体呈现迅速(sù)增长,从(cóng)2010年发布的1,073篇(piān),到2017年发(fā)布的13,325篇,增长(zhǎng)超过11倍(bèi)(12x)。许多细分领域也呈现增长。
这(zhè)表示,论文作者们倾(qīng)向于把(bǎ)自(zì)己的研究成(chéng)果传播(bō)出去,不论是经过同行评审还是在AI会议上发表的论文(wén)。这也体现(xiàn)了,AI这个领域竞争激烈的特质。
在细(xì)分领(lǐng)域中,计算机视(shì)觉(CV)是自2014年(nián)起增长最快的一(yī)个(上(shàng)图蓝色曲线),从1,099篇增长到(dào)2017年的4,895篇(piān),涨幅近400%。
AI论文引(yǐn)用量
FWCI是领(lǐng)域(yù)权重引用影(yǐng)响系数,可(kě)以用来衡量(liàng)论文的影响力。
报(bào)告重新定义了一种“改装版”(Re-based)的(de)FWCI,不按地区(qū),而(ér)按世界平均值,来计算影响力。
在这个(gè)标准之下,虽然欧(ōu)洲(zhōu)发表的AI论文(wén)数高于中国(guó)和美国,不(bú)过论文(wén)影响力(lì)曲线比较平(píng)缓(huǎn);相比之下(xià),中国发表的论文影响力(lì)增长剧烈:与2000年(nián)相(xiàng)比(bǐ),2016年平均每位中国AI论文作者的引用率(lǜ)增长了(le)44%。
不过(guò)在这方面,美国(guó)依(yī)然全球领先,美国AI论(lùn)文作者(zhě)的平均引用率,比世界平均值高出83%。
AAAI论(lùn)文
AAAI2018,提交(jiāo)论文,中美占70%,中选论文(wén),中美(měi)占67%。
中国的论文提交数(shù)高出美国约1/3,但(dàn)二者中选论文数相差(chà)无几,中国入(rù)选265篇,美国入选268篇。
高(gāo)校AI课程注册情况
AI和ML进军高(gāo)校的速(sù)度提(tí)升了不少。
报告显(xiǎn)示,截止到2017年底,AI课(kè)程注(zhù)册人(rén)数是(shì)2012年的3.4倍,ML课(kè)程(chéng)注(zhù)册人数是(shì)2012年的5倍。
其中,UC伯克利的ML课程的注册人数增(zēng)长最快,是2012年的6.8倍,但此数(shù)值(zhí)较2016年增长速(sù)度有(yǒu)明显下降。
报告进一步统计(jì)了非美国地区院校AI+ML课程(chéng)注册人数(shù)的变(biàn)化。结果(guǒ)显示,清华是非美(měi)国院校外增长(zhǎng)率最高的高校,几(jǐ)乎是第二名多伦多大学(xué)的(de)2倍。
纵向(xiàng)对比(bǐ)来看,清华2017年AI+ML课程注册人数是2010年的16倍。
学术(shù)会议热(rè)度
在大型会议中,NeurIPS(曾(céng)用名NIPS)、CVPR和(hé)ICML,是参(cān)与人数最多的三(sān)大AI会(huì)议(yì)。自2012年以来,论参与人(rén)数的增长率,这三者也领先于其他会议。
NeurIPS和ICML参与人数增长(zhǎng)最快:将(jiāng)2018年与2012年相比,NeuRIPS增长3.8倍(4.8x),ICML增长5.8倍(6.8x)。
上面(miàn)讨(tǎo)论(lùn)的是(shì)大型会议,但小型会议的参与人数同样(yàng)有明显的(de)增长(zhǎng),甚至可以比大型(xíng)会议的增长更加明显(xiǎn)。
这里最突(tū)出的是,ICLR2018的参会人数达到了2012年的20倍。
原(yuán)因很可能(néng)是近年来,AI领域(yù)越来越关注深(shēn)度(dù)学习和强化学习了。
AI创(chuàng)业投资情(qíng)况
从2015年(nián)1月(yuè)到2018年1月(yuè),人工智能创(chuàng)业公司的数量增(zēng)长到了原来(lái)的2.1倍,而所有活跃的创(chuàng)业公司增长到(dào)了原(yuán)来的1.3倍。
大(dà)多(duō)数情况下,创业公司的增(zēng)长都保持相对稳定,而(ér)人工智能创业(yè)公(gōng)司呈指数级增(zēng)长。
在风投资金方(fāng)面,从2013年到2017年,人工智能领(lǐng)域的风投资金增长到了(le)原(yuán)来的4.5倍,而所有的风投资金只(zhī)增长到了原来的2.08倍(bèi)。这些数据都是年度数据(jù),不是逐年(nián)累积的。
图表中有两个高峰(fēng)期(qī),1997-2000年风投资金的(de)激增,对应的是网络泡沫时期。2014-2015年(nián)出现了一(yī)个较小的增(zēng)长,因为当时正处(chù)于一个相对(duì)较大的(de)经(jīng)济增长(zhǎng)时期。
人才(cái)需求
报告显示,近几(jǐ)年,社会(huì)需要的AI相关(guān)人才大幅度增(zēng)加,目前对有ML技能的(de)人才(cái)需求最大(dà),其次是深度学(xué)习。
可(kě)以看出,ML人才需求也是这两年增长速(sù)度(dù)最(zuì)快的(de)。
报(bào)告统计(jì),2017年,全球ML人(rén)才需求是2015年的35倍,从2016年(nián)到2017年(nián)的(de)增幅尤为(wéi)明显。全球对AI人才的需求(qiú)在(zài)2016年骤增。
专利
2014年(nián),大约30%的人(rén)工(gōng)智能专利发明(míng)人(rén)来自美(měi)国,其次(cì)是(shì)韩(hán)国和日本,各拥有16%。
在韩国和中国台湾地区,专利的(de)增长速度较快。2014年人工智能专利的数量几乎(hū)是2004年的(de)5倍。
财报电话会议中提及AI和ML的次数
2015年,科(kē)技公司在财报电(diàn)话会议中提及AI和ML的次(cì)数开(kāi)始有(yǒu)所增加。
2016年,其他行业(yè)提及AI次数才开始增长(zhǎng)。
相比(bǐ)之下(xià),科技(jì)行业的公(gōng)司提及AI和ML的次数远比其他(tā)行(háng)业多。
在财报电话会议(yì)中,除了科技行业之外(wài),提及AI次数最(zuì)多的(de)公司(sī),基(jī)本上分布在消费、金融和医疗保健行业(yè)。
机(jī)器人安装量
2012年到2017年,中国机器人年(nián)安装(zhuāng)量增长(zhǎng)了500%,其(qí)他地区,比如韩国(guó)和欧洲(zhōu),分别增长了105%和122%。
在安(ān)装(zhuāng)量较小的地区(qū)中,中国台(tái)湾比较突出,在2012-2017年增长(zhǎng)最快。
开源框架(jià)GitHub标星数
各框架的标星数(shù)反映着他(tā)们在开发者群体中的流行程(chéng)度。不过,因(yīn)为开发者们日常不(bú)会“取关”GitHub项目,所(suǒ)以这(zhè)些星星都是多年来积(jī)攒(zǎn)下的。
我(wǒ)们可以明显发(fā)现,TensorFlow的(de)受欢(huān)迎程度(dù)在开发者中遥遥领先、稳(wěn)步增(zēng)长。
排除了(le)第一热门,第二名和第三名(míng)分别(bié)是scikit-learn和BVLC/caffe。
TensorFlow官方力(lì)推的keras排(pái)到了第(dì)四,但(dàn)近(jìn)一年来(lái)几无增(zēng)长势头(tóu)。
另外两大热(rè)门PyTorch和MXNet分别排到了第七(qī)和第六,尤其是PyTorch,作为一个年(nián)轻的框架(jià),自2017年(nián)初(chū)发布以(yǐ)来(lái)至今,GitHub标星数至少增(zēng)长(zhǎng)了(le)4倍。获取(qǔ)新用户的势头很猛,不知道其中有多少被TensorFlow逼疯的人(rén)类。
各类任务最(zuì)新成绩
这个部分分为(wéi)CV和NLP两(liǎng)块,分别列举了各主流任务(wù)从发展之初到现在的成绩进步情况。
ImageNet图像(xiàng)识别准确率
2017年是ImageNet比(bǐ)赛的最后(hòu)一届,2018年这项(xiàng)比(bǐ)赛就不(bú)再(zài)进行了。不过(guò),验证集依然有人在用。
蓝色的(de)线条为ImageNet挑战赛历年的成绩变(biàn)化(huà),由于(yú)每年比赛(sài)所用(yòng)的数据不同,旁边(biān)多了一条黄色线条(tiáo),是以ImageNet2012验证集为评(píng)价标准绘制(zhì)的(de)。
可(kě)以看出,到2015年,机器在图像分类任务上(shàng)的能力已经明显超越了(le)人眼,而即使比赛不再继(jì)续,学术研究者依然在认真推进该任务(wù)的表现。
这(zhè)也侧(cè)面(miàn)说明,如果一项工作有(yǒu)了明确(què)的评价标准(zhǔn)和固定(dìng)的挑战内容,研(yán)究者(zhě)们(men)围绕此竞争,更容易让技(jì)术(shù)在该领域取得突破。
ImageNet训练(liàn)速度
这张(zhāng)图是训(xùn)练(liàn)ImageNet图像分类神经(jīng)网络所需时间的历年变化(当然,是买(mǎi)得(dé)起足够计算资源的人和机构所用(yòng)的(de)时长)。
从2017年6月的1小时,到2018年11月的4分钟,ImageNet图像分类神经网络(luò)的训练速(sù)度提升(shēng)了16倍,除了硬件方面的(de)贡献,算法上的提升也不容小觑。
图像分割COCO
ImageNet挑战赛“退休”之后,CV领域的朋友(yǒu)们就把重点(diǎn)放在了微(wēi)软的COCO,挑战语义分割和实(shí)例(lì)分割。
四年来,COCO数据集上图像分(fèn)割挑战的(de)精确度已经提升(shēng)了(le)0.2,2018年的成绩(jì)比2015提升了72%。不(bú)过(guò),目前还(hái)没有超(chāo)过0.5,这一项还有充(chōng)足(zú)的进(jìn)步(bù)空间(jiān)。
另外值得一提(tí)的(de)是,COCO比赛近年来占(zhàn)据(jù)冠(guàn)军位置的(de)多是来自(zì)中国的公(gōng)司,包括旷视、商汤等计算(suàn)机视(shì)觉独角兽日常包揽(lǎn)数个项目的冠军。
语法分析(Parsing)
在(zài)确定(dìng)句子结构这种(zhǒng)语法分析的任务(wù)上,2003年到2018年的15年(nián)间,AI的(de)表现(F1Score得分)提升了将近10%。
机(jī)器翻译
在机器(qì)翻译任务上,报告(gào)拿英(yīng)语-德(dé)语互相(xiàng)翻译举例,评估(gū)了AI模型(xíng)在经典机(jī)器翻译评(píng)估算法BLEU标准(zhǔn)中的表现。
报告显示,2018年英语转德语的BLEU评分是2008年的(de)3.5倍(bèi),德语(yǔ)转英语(yǔ)成绩是2008年(nián)的(de)2.5倍。
机器问答:AI2ReasoningChallenge(ARC)
在(zài)问答领域,AI表现进(jìn)步更明显,可(kě)以(yǐ)按(àn)月计数了。
报告统计了(le)2018年从四月到11月间,AI在ARC推理(lǐ)挑战赛(sài)上(shàng)成绩的变化(huà):简(jiǎn)单(dān)组得分从63%提升到69%,挑战(zhàn)组(zǔ)得分从27%提(tí)升到42%。
这些,都仅是半(bàn)年间的进步。
机器问答:GLUE
同样用于机器问答(dá)的GLUE基准(GeneralLanguageUnderstandingevaluation)推出至今只有7个月的时间,但目前的表现已(yǐ)经(jīng)比(bǐ)半年前(qián)提升了90%。
GLUE的推出(chū)者、纽约大学助理教授SamBowman说,虽然围(wéi)绕GLUE的大型社区还没(méi)有出现,不过已经有了像谷歌BERT这样的(de)代表性技术用了GLUE基准(zhǔn),面世一个月内已经被引用(yòng)8次。在EMNLP会议中,GLUE时(shí)常被讨论,可能(néng)会成为语言理解(jiě)领域中的一个基准(zhǔn)线。
政府(fǔ)提及
整体来(lái)说,自(zì)2016年以来,美国(guó)、加拿大、英(yīng)国政府在国(guó)会/议会会(huì)议中提(tí)及人工(gōng)智能和机器学习的(de)次数激(jī)增(zēng)。
2016年之前,机(jī)器学(xué)习很(hěn)少被(bèi)提及,与人(rén)工智能相(xiàng)比,机器学习在总提及量中只(zhī)占很小(xiǎo)的一部分。