导语:亚马逊与国家(jiā)科学(xué)基(jī)金(jīn)会合作,投资千(qiān)万美金(jīn)开发AI公平性系统,实(shí)现人(rén)工智能系统更广(guǎng)泛(fàn)的接受度(dù)。
智东西3月26日消息,亚马逊昨日宣布将与美国(guó)国家(jiā)科学基金会(NSF)合作(zuò),在(zài)未来(lái)三年内投入1000万(wàn)美元的研究经(jīng)费,开发专注于人工(gōng)智能和机器学习公平性的系统。
亚马逊(xùn)Alexa AI 团队(duì)的自然(rán)理(lǐ)解副总裁 Prem Natarajan 表示,人工智(zhì)能的普及使其公平性问(wèn)题在(zài)学术界(jiè)、政府部门(mén)和(hé)企(qǐ)业界都变得越来越重要,公平性(xìng)问题对于(yú)建立和维护客户的信(xìn)任也是至关重(chóng)要的。
为实现人工(gōng)智(zhì)能系统更(gèng)广泛的接受度,亚马逊(xùn)与NSF的合作将针对(duì)人工(gōng)智能的可解释性(xìng)、潜在的(de)不利偏见(jiàn)和影响、缓(huǎn)解策略、公平性验证(zhèng)以及包容(róng)性(xìng)考虑。美国将继续发挥人工智能(néng)技术的潜力,希望到5月10日他(tā)们接受的(de)人(rén)工智能公平性验证提案能够带来新的开放源码(mǎ)工具(jù)、公开可用的数据集和出版物。
亚马逊将为该计划提供部分资金,NSF根据其绩效评(píng)估流程独立地做(zuò)出(chū)奖励决定。 该计(jì)划预计将(jiāng)在2020年(nián)和2021年继续(xù)进行,并附加征集意向书(shū)。
美国国家科学(xué)基金(jīn)会计算机(jī)和信息科(kē)学与工程负(fù)责人Jim Kurose表示,与亚马逊合作进行人工智能公平性研究将支持有关开发和实施可靠(kào)的人工智能系统的研究,这(zhè)些系统从一(yī)开始就(jiù)将透(tòu)明度、公(gōng)平性和问责制融入设计中。
亚(yà)马逊与国家科学基金(jīn)会合作的消息发布后,越来越多(duō)的(de)企业、学术机(jī)构和行(háng)业(yè)协会开始加入,进行人工智能道德研(yán)究。他们的共同工(gōng)作已经产生(shēng)了(le)算(suàn)法偏差缓解(jiě)工具(jù),这些工具(jù)有(yǒu)望加(jiā)速向(xiàng)更公正的模型迈进。
亚马逊与(yǔ)科(kē)学基金(jīn)会合作,专注于开发AI和机器学(xué)习公平性(xìng)的系统
去年5月,Facebook 发布了公平(píng)流程,如(rú)果算法根据(jù)种族、性别(bié)或年龄对某人做出不(bú)公平(píng)的判断,它会自动(dòng)发出警(jǐng)告。埃(āi)森哲咨(zī)询公司发布(bù)了可以自(zì)动检测(cè)AI算法偏差的工具包,为数据科(kē)学家减轻算法偏差提供帮助。微软也在去年5月(yuè)推出了自己的解(jiě)决方案,同年(nián)9月谷(gǔ)歌推出了 What-If 工具,这是(shì) TensorBoard 网络仪表板上的一个偏见检测功能,用于 TensorFlow 机器学习框架的网络仪表(biǎo)板的偏置检测功能(néng)。
IBM也在(zài)去年秋天发布了AI Fairness ,这是一(yī)款基(jī)于云计算的全产(chǎn)品,可以帮助了(le)解AI系统如何(hé)做(zuò)出决策并(bìng)给出调整建议——例(lì)如算法(fǎ)调整或平衡数据。最近IBM的(de)Watson和Cloud Platforms小组的研(yán)究重点是减轻(qīng)AI模型中的偏差,特别(bié)是在面部识别方面。
麻(má)省理工(gōng)学院的研究人员发(fā)现 Rekognition ——亚马逊网络服(fú)务(AWS)的目标(biāo)检测 API——无法可靠地确定(dìng)特(tè)定(dìng)情况下女(nǚ)性(xìng)和深(shēn)肤色面孔的(de)性别(bié)。在2018年进行的(de)实验(yàn)中,RekogniTIon 的面部分析功(gōng)能错误(wù)地将女性的照片识别为男性,将深色皮肤的女性的(de)照片识别为男性的比例分别为19% 和(hé)31% 。
亚马逊对研究结果提出异议,对于实验结(jié)果是(shì)否准确仍存在争议。亚马逊表示在RekogniTIon更新(xīn)版(bǎn)本的(de)测试中,所有种族的性别分类准确性“无差异”,并提(tí)出(chū)研究结果的论文没有清(qīng)楚地说明实验中使用(yòng)的置信阈值。