将人(rén)工智(zhì)能与农业(yè)集合起来的自然保护
在(zài)本周在(zài)网上(shàng)举行(háng)的2020年国际学习代表大会(huì)(ICLR)主办的研讨会(huì)上,小组(zǔ)成员讨(tǎo)论了AI和机器(qì)学习如何(而且已经)应用于(yú)农业挑战。正如(rú)几位专家指出的那样,世界各(gè)国面临粮食(shí)供(gòng)应(yīng)短缺(quē)的(de)问(wèn)题,估计有9%的(de)人(rén)口(6.97亿)严重“粮(liáng)食不安全”,这意味着他(tā)们无法可靠地获得负担得起的营(yíng)养食品。
劳动力短缺,有害生物(wù)和病原体的传播以及(jí)气候(hòu)变(biàn)化等(děng)因素有可能(néng)使危机升级,但是人工智能(néng)可以(yǐ)提供帮(bāng)助。IBM科(kē)学家通过农业“数(shù)字孪生”或用于预测特定农作物产量的农(nóng)作物数字模型谈到了他们在非洲的工作。阿卡迪亚(yà)大学的(de)研(yán)究人员提(tí)出了一种(zhǒng)算法,该(gāi)算法旨在比人(rén)类工人更准(zhǔn)确地测量葡(pú)萄产(chǎn)量(liàng)。加州大学戴维斯分校的一个小组详细(xì)介绍了(le)使用卫星图像预测(cè)肯(kěn)尼亚牲畜觅食条件的工作。
软件质量保证负责人(rén)Akram Mohammed详(xiáng)细介绍(shào)了(le)IBM去年对(duì)尼日利亚农场(chǎng)进行(háng)数字“克隆(lóng)”的工作,这(zhè)需要收集多光谱(pǔ)图像和(hé)元数据(如传(chuán)感器读数,天气和土壤条件(jiàn))的历(lì)史记录,以在IBM的(de)云(yún)平台上构建农场的模拟。部分(fèn)工(gōng)作是IBM与(yǔ)Hello Tractor之间的合作关系的(de)产物,Hello Tractor是一项订(dìng)阅服务,该服务将小规模农民与设备和数据分析联系起(qǐ)来,以提高作物产量。
穆罕默德(Mohammed)断(duàn)言,数字化作物增值不(bú)仅对农民本(běn)身有(yǒu)价值,而且对可以利(lì)用它们来跟踪市场(chǎng)动态,规划和制定政策并最(zuì)大(dà)程度(dù)降低其(qí)投资风(fēng)险的分销商,政府和银行也具有价(jià)值。他指出,预计(jì)五年(nián)内世界人口将超过80亿,但到本世纪末,可耕地将减少20%。
Mohammed和他(tā)的团队利用了IBM的PAIRS Geoscope服务(wù),该(gāi)服务旨在托管和管理PB级(jí)的地理时空(kōng)数据,例如地图和无人机图像,以存储有关每个农场(chǎng)的卫星(xīng),天(tiān)气和(hé)地面传感器数(shù)据。IBM的另(lìng)一(yī)项(xiàng)服务-Watson农业决(jué)策平台,将IBM拥有的(de)The Weather Company的(de)算法与物(wù)联网数据摄取工具(jù)相结(jié)合-使工程师在输入了多个深度的水分读数,土壤养分含量和肥力(lì)后(hòu),可以获得产量预(yù)测,农场操作和工作流程信息以及高清可视卫星图像。
挑(tiāo)战之一(yī)是规模较小的农场(chǎng)数(shù)据相对匮乏。卫(wèi)星图像仅提供(gòng)像素(sù)值(zhí)的信息,并非所有(yǒu)农场都能(néng)买得起监(jiān)视设备。团队(duì)的解决方案是将目标区域中超(chāo)过40,000个集群的农场组建模。这使工(gōng)程师能够训练一个(gè)推荐系统来回答(dá)两个关键问题:(1)农(nóng)民何时应进行特定的种植活动;(2)什么是最佳耕作日,从而使小规模农民的农作物产(chǎn)量最大化?
该系统包括一个集成(chéng)的学(xué)习(xí)模(mó)型,该模型会建议栽(zāi)培日期,利用历史状态(来自(zì)数(shù)字“双胞胎”)和(hé)将来的元数据预测,例如最近(jìn)的天气历史(湿度,能见度,温(wēn)度,降水和风(fēng)速),天气预报(在四(sì)个(gè)不同深度的土壤湿度),多光谱卫星图(tú)像和(hé)地(dì)面真实事件(jiàn)信息(位置和日期(qī))。在(zài)实验(yàn)中,缺少元数据(如农作物类型和土壤条件)阻碍了模型(xíng)的(de)预测。但是研究人员声称,他们的解(jiě)决方案在很(hěn)大(dà)程度上(shàng)优于基于启发式的系统。
阿(ā)卡迪亚(yà)大学数据分析研究所的研究人员Daniel L. Silver和Jabun Nasa介绍了他们开发的计算机视(shì)觉(jiào)系统(tǒng)的工作,该系统可以根据葡萄图(tú)像(xiàng)测量葡萄产量(liàng)。准确(què)的葡萄产量估算对于计(jì)划收成(chéng)和做(zuò)出葡萄酒(jiǔ)生产选择至关重要,但是正如Silver和Nasa指出的(de)那样,进行测量在历史上是一个昂贵(guì)的(de)过(guò)程-更不用说一个不(bú)精确的(de)过程(chéng)了(准(zhǔn)确(què)度为75%至90%)。
为了为他们(men)的(de)估计产量(liàng)的(de)机器学习模型建立训练集,研(yán)究(jiū)人员招募了(le)志愿(yuàn)者,并要求他们给葡(pú)萄拍摄葡(pú)萄在葡(pú)萄树(shù)上的照片,并(bìng)使用(yòng)数字(zì)秤测量葡萄的重量。收集(jí)后,Silver和Nasa将测(cè)量数据数字(zì)化,并对照片(piàn)进(jìn)行裁剪,归一化和调整大小(xiǎo),然后再将两(liǎng)个(gè)数据集组合在一起,并将它们输入到卷积(jī)神经网络(一种非常适合于分(fèn)析(xī)视觉图像的AI模型)中。
他们报告说,他们表(biǎo)现最好的模型在收(shōu)获前六天的平均(jun1)产量预(yù)测上(shàng)平均准确率为85.15%,在预测(cè)收获前16天的平均(jun1)产(chǎn)量上准确率为(wéi)82%。在未来的工作中,他们计划(huá)通过合并自动图像裁剪器和长期天(tiān)气预报数据(jù)来完善它。来自加州大(dà)学戴维斯分校和AI咨(zī)询(xún)公司Weights and Biases的研究人员就预测(cè)肯尼亚牲畜(chù)饲草(cǎo)状况(kuàng)的努力发表了(le)讲话。他们的工(gōng)作是由(yóu)肯尼亚北部(bù)牧民(mín)的奋斗推动的,他们依靠牲畜获得食物和收入,但往(wǎng)往(wǎng)无法(fǎ)预见干(gàn)旱。
理想的预测模型将通过分析公共数据来防止牲畜损失和饥饿。当干旱来袭时,可以将其链接到一个(gè)平台,该(gāi)平台可以(yǐ)迅速将(jiāng)资源转移给(gěi)牧(mù)民(mín),使他们能够负担家庭支出或牲畜需求。研(yán)究人员通过(guò)编译一个(gè)训练语料(liào)库(kù)来实现这一想法,该训练语料(liào)库由带有人(rén)类标(biāo)签的地面图像组成,这些数据点带有时间戳,草料质(zhì)量(liàng)(0-3尺度,零表示严重干旱),动植物(wù)类(lèi)型和距离浇水。他们将其与在相同地点和相(xiàng)同时间拍摄的100,000幅卫星(xīng)图像相(xiàng)关联,目的是仅(jǐn)使用上(shàng)述卫星图(tú)像来预测质量。
该小组将数据(jù)集发布在了Weights and Biases的基准测试网站(zhàn)上(shàng),该网站允许贡献者将(jiāng)经过(guò)训练的模型提交给公共排行榜(bǎng)。在撰写本文(wén)时,性能最佳的算法可(kě)以以77.8%的精度预测干旱,次之(zhī)的模(mó)型可(kě)以达到(dào)77.5%的(de)精度。展望未来(lái),研(yán)究人员希望将工作范围扩(kuò)大到其他地区,部分方法是收集地面和牧草数据,以及诸如(rú)玉米,木薯,水稻等主要农作物的地理位置。