《科创(chuàng)板日报》12月28日讯(编辑(jí) 宋子乔) 众多专业(yè)学科中,医学以难度强、压力(lì)大著称,但仍有无(wú)数人接受挑战,选择(zé)迎(yíng)难而上,如(rú)今(jīn),AI也跑来(lái)和医学生“抢饭碗”。
当地时间12月27日(rì),谷歌公布了一个新的医(yī)疗AI模型“Med-PaLM”。在经历(lì)一(yī)系列考核(hé)后,该模型被证实(shí)“几乎达到”了(le)人(rén)类医(yī)生的(de)水平。
![]()
具体来看,研(yán)究团队(duì)准备了一个医(yī)学问(wèn)题问答数(shù)据集“MultiMedQA”,涵盖医学考试(shì)、医(yī)学研究和(hé)消费者医学问题,该(gāi)“题库”收集了(le)MedQA(USMLE,美国医(yī)师(shī)执照考(kǎo)试题),还引入了他们自己的新数据集HealthSearchQA,它由(yóu)搜(sōu)索(suǒ)过的健(jiàn)康问题组成。
该团队又请(qǐng)来一(yī)组临床医生作答。这些临床医生分布(bù)于美国和英国,在初级保健(jiàn)、外科(kē)、内科和儿科方面具有(yǒu)专业经验。
最后,研究人员(yuán)将模型和人类医生(shēng)的答案匿名后交给9名(míng)分(fèn)别来自美国、英国和印(yìn)度的临床(chuáng)医生进行评估。
结果显示(shì),Med-PaLM在科学(xué)常(cháng)识方(fāng)面的(de)正确率在92%以上,在理解、检索和推理能力方面(miàn),也(yě)几乎达到了人类医生的水(shuǐ)平,并在(zài)克服隐性偏见方面略胜(shèng)一筹(chóu)。
不(bú)过,该(gāi)研究负责人也表示,Med-PaLM给出(chū)的答案在整体上仍然(rán)不如(rú)临床医生,该(gāi)模型在实际应(yīng)用前有待(dài)进一步完善(shàn)。
追根(gēn)溯源(yuán),Med-PaLM是怎么(me)诞生的(de)呢?
这里不(bú)得不提谷歌在今年发布的转换器(qì)语言模型——PaLM,该模型基于Pathways架构、拥有(yǒu)5400亿参数,是Google迄今(jīn)为止研发(fā)的最大规模(mó)的模型,全名为Pathways Language Model。
PaLM模型在语言理解等(děng)各种方面的评估测试中的(de)表现十分出色,甚至还在语言(yán)和推理类的测(cè)评中超过(guò)了人类。
Med-PaLM正是PaLM的(de)衍(yǎn)生品(pǐn)。谷(gǔ)歌研究团队首先在上(shàng)文提及的医学问题问(wèn)答数(shù)据集(jí)“MultiMedQA”上评估了PaLM及微调变体(tǐ)Flan-PaLM,然(rán)后,基于此提出了(le)指令提示x调(diào)整,让Flan-PaLM进一步与医学接轨,进一步(bù)产生了Med-PaLM。
值得注意的(de)是,AI模型的每一(yī)次突破(pò),都预示着更聪明(míng)的机器人即将(jiāng)到来。指挥机器人干活(huó)不是什么新(xīn)奇的事,但要让机器人能够理解你(nǐ)的命(mìng)令(lìng)背后的(de)意图(tú),那就要考验它的“大脑(nǎo)”好不好用(yòng)了。将(jiāng)AI模型(xíng)应用到(dào)机(jī)器人身上相当于给机器人“开智”。
据了解,今年8月份,谷歌就将(jiāng)大型语(yǔ)言模型首(shǒu)次集成(chéng)到机器人(rén)中,有了AI模型的加(jiā)持,机器人能像人(rén)类一样响应完整的命令。
谷歌(gē)研究人员就此做了(le)演(yǎn)示。当对机器人说(shuō):“我饿(è)了,你能给我点零食吗?”机器人在自助餐厅中搜(sōu)索(suǒ)一番(fān)后,打开(kāi)了(le)一个(gè)抽屉,找(zhǎo)到一袋薯片并(bìng)将它拿给研究人员。
可以预见的是,通过进一(yī)步的训练、优(yōu)化,Med-PaLM模型的回(huí)答准确率将进一(yī)步(bù)提(tí)高,基于此模型(xíng)的机器(qì)人医生也有望更快出现。