全球首個全科醫(yī)療大模型正式發(fā)布:
由谷歌 Research 和 DeepMind 共同打造的多模態(tài)生成模型Med-PaLM M,懂臨床語言、懂影像,也懂基因組學(xué)。
在 14 項(xiàng)測試任務(wù)中,Med-PaLM M 均接近或超過現(xiàn)有 SOTA,前提是所有任務(wù)都使用一組相同的模型權(quán)重。而在 246 份真實(shí)胸部 X 光片中,臨床醫(yī)生表示,在高達(dá) 40.50% 的病例中,Med-PaLM M 生成的報告都要比專業(yè)放射科醫(yī)生的更受采納,這表明 Med-PaLM M 并非 " 紙上談兵 ",用于臨床指日可待。
(資料圖)
對此,谷歌也自己給出了評價:這是通用醫(yī)學(xué)人工智能史上的一個里程碑。
所以,Med-PaLM M 具體什么來頭?
全球首個全科醫(yī)療大模型來了在正式了解 Med-PaLM M 之前,我們先簡單介紹谷歌自建的多模態(tài)醫(yī)學(xué)測試基準(zhǔn)MultiMedBench。
谷歌表示,在 MultiMedBench 之前,市面上缺乏這樣一個全面的多模態(tài)醫(yī)學(xué)基準(zhǔn)。
該基準(zhǔn)由 12 個開源數(shù)據(jù)集和 14 個單獨(dú)的任務(wù)組成,用于測量通用生物醫(yī)學(xué) AI 執(zhí)行各種臨床任務(wù)的能力。
其中 12 個數(shù)據(jù)集共包含了六種生物醫(yī)學(xué)數(shù)據(jù)模式(文本、放射學(xué)(CT、MRI 和 X 光)、病理學(xué)、皮膚病學(xué)、乳房 X 光檢查和基因組學(xué)),14 個任務(wù)則涵蓋五種類型(問題回答、報告生成和摘要、視覺問題回答、醫(yī)學(xué)圖像分類和基因組變體調(diào)用)。
Med-PaLM M 就在上面進(jìn)行了微調(diào)。正如其名 "M" 代表多模態(tài),Med-PaLM M 相比之前谷歌發(fā)布的 Med-PaLM、Med-PaLM-2 等醫(yī)療大模型,是一個主打全科、通才的醫(yī)療 AI,不僅能回答各種醫(yī)學(xué)問題,還能直接看片、懂基因組學(xué)。
它的基本架構(gòu)是 PaLM-E(多模態(tài)語言模型),并采用 ViT 預(yù)訓(xùn)練模型作為視覺編碼器,具體實(shí)現(xiàn)了三種組合:
-PaLM 8B+ViT 4B ( PaLM-E 12B )
-PaLM 62B+ViT 22B ( PaLM-E 84B )
-PaLM 540B+ViT 22B ( PaLM-E 562B )
通過 MultiMedBench 對 PaLM-E 模型進(jìn)行微調(diào),并將其與生物醫(yī)學(xué)領(lǐng)域?qū)R,Med-PaLM M 得以誕生。以下是一些實(shí)現(xiàn)細(xì)節(jié):
(1)數(shù)據(jù)集和預(yù)處理方面,將 MultiMedBench 中所有圖像大小調(diào)整為 224 × 224 × 3,同時按需使用填充來保留原始縱橫比。
(2)由于谷歌的目標(biāo)是訓(xùn)練一個通用的生物醫(yī)學(xué) AI 模型,使用統(tǒng)一的模型架構(gòu)和模型參數(shù),用多模式輸入執(zhí)行多個任務(wù)。為此,他們?yōu)?Med-PaLM M 提供了特定于各種任務(wù)的指令以及一個純文本的 " 一次性示例 "。
如下圖所示的胸部 x 光解讀和皮膚病變分類任務(wù)所示,這些指令有一種寫提示語的味道,以 " 你是一個很給力的放射科助理 " 開頭。
(3)訓(xùn)練過程中,作者對 PaLM-E 進(jìn)行了端到端的微調(diào)。在多模態(tài)任務(wù)中,圖像標(biāo)記與文本標(biāo)記交錯,以形成對 PALM-E 模型的多模式上下文輸入。對于所有微調(diào)任務(wù),多模式上下文輸入最多包含 1 個圖像,然而 Med-PaLM M 能夠在推理過程中處理具有多個圖像的輸入。14 項(xiàng)任務(wù)接近 or 超 SOTA,臨床戰(zhàn)勝 40% 放射科醫(yī)生
性能評估階段,作者主要測試 Med-PaLM M 的 " 多面手 "(即全科)能力、突發(fā)涌現(xiàn)能力以及放射學(xué)報告生成質(zhì)量(與真實(shí)放射科醫(yī)生進(jìn)行對比)。
結(jié)果顯示:
(1)與專業(yè) SOTA 模型和無生物醫(yī)學(xué)領(lǐng)域微調(diào)的廣義模型(PaLM-E 84B)相比,Med-PaLM M 在 MultiMedBench 上的所有任務(wù)、數(shù)據(jù)集和指標(biāo)組合(共計(jì) 14 項(xiàng))中,性能均基本接近 SOTA 或超過 SOTA。
需要注意的是,該結(jié)果是在沒有任何特定任務(wù)定制的情況下使用相同的模型權(quán)重集實(shí)現(xiàn)的。
(2)在 scale 實(shí)驗(yàn)中,三個不同規(guī)模的 Med-PaLM M 對各類任務(wù)的影響各不相同:粗略來看,對于純語言任務(wù)和需要調(diào)整的多模式任務(wù)來說,模型越大越好;但對圖像分類和胸部 X 光報告生成任務(wù)來說,84B 的效果比 562B 表現(xiàn)反而更好一些。
(3)零樣本思維鏈推理能力涌現(xiàn)。Med-PaLM M 可以通過胸部 X 射線圖像檢測沒有訓(xùn)練過的結(jié)核病,與針對該類數(shù)據(jù)集進(jìn)行專門優(yōu)化過的 SOTA 結(jié)果相比,它的準(zhǔn)確率已相差不大。不過,它給出的具體報告還是存在具體錯誤,說明還有不足。(4)放射性報告生成測試中,80B 參數(shù)的 Med-PaLM M 平均有 40.50% 的報告比放射科醫(yī)生做的更好(被臨床醫(yī)生采納),而 12B 和 562B,分別為 34.05% 和 32.00%。另外,遺漏和錯誤率測試顯示,Med-PaLM M 12B 和 84B 模型平均每份報告的遺漏率最低,為 0.12,其次是 562B 模型為 0.13。這一結(jié)果與 MIMIC-CXR 上人類放射科醫(yī)生基線報告的相當(dāng)。多久能實(shí)用?
作為人類首個全科醫(yī)學(xué)大模型,Med-PaLM M 多久能投入實(shí)用,想必也是大家關(guān)心的問題。
雖然它被 " 自詡 " 為里程碑(主要是因?yàn)榭恳唤M模型權(quán)重在各種生物醫(yī)學(xué)任務(wù)上接近或超過 SOTA),但谷歌也指出目前還有不少局限性待解決。
比如缺乏高質(zhì)量的測試基準(zhǔn)。谷歌表示,這是迄今為止通用生物醫(yī)學(xué)人工智能發(fā)展的關(guān)鍵瓶頸,因?yàn)橹挥懈哔|(zhì)量的基準(zhǔn)才能在很大程度上促進(jìn)相關(guān)領(lǐng)域的發(fā)展。
而目前的 MultiMedBench 還存在單個數(shù)據(jù)集大小有限以及模式和任務(wù)多樣性有限(比如缺乏轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué))等問題。
再比如,擴(kuò)展(scale)多模態(tài) AI 模型也具有挑戰(zhàn)性。
在語言領(lǐng)域,這一操作可以顯著提高性能和應(yīng)急能力。然而,谷歌在 Med-PaLM M 上的初步實(shí)驗(yàn)表明,由于醫(yī)學(xué)數(shù)據(jù)的稀缺性,這對于生物醫(yī)學(xué)任務(wù)領(lǐng)域的多模態(tài)廣義模型來說并沒有這么簡單。
作者介紹
目前,谷歌僅發(fā)布了 Med-PaLM M 的論文。
它一共有兩位共同一作,其中一位叫 Tao Tu。他本科畢業(yè)于北理工(2010 年),碩士畢業(yè)于清華大學(xué),博士為美國哥倫比亞大學(xué),專業(yè)都是醫(yī)學(xué)工程。目前已在谷歌擔(dān)任軟件工程師快兩年。
論文地址:https://arxiv.org/abs/2307.14334
關(guān)鍵詞:
新聞發(fā)布平臺 |科極網(wǎng) |環(huán)球周刊網(wǎng) |中國創(chuàng)投網(wǎng) |教體產(chǎn)業(yè)網(wǎng) |中國商界網(wǎng) |萬能百科 |薄荷網(wǎng) |資訊_時尚網(wǎng) |連州財(cái)經(jīng)網(wǎng) |劇情啦 |5元服裝包郵 |中華網(wǎng)河南 |網(wǎng)購省錢平臺 |海淘返利 |太平洋裝修網(wǎng) |勵普網(wǎng)校 |九十三度白茶網(wǎng) |商標(biāo)注冊 |專利申請 |啟哈號 |速挖投訴平臺 |深度財(cái)經(jīng)網(wǎng) |深圳熱線 |財(cái)報網(wǎng) |財(cái)報網(wǎng) |財(cái)報網(wǎng) |咕嚕財(cái)經(jīng) |太原熱線 |電路維修 |防水補(bǔ)漏 |水管維修 |墻面翻修 |舊房維修 |參考經(jīng)濟(jì)網(wǎng) |中原網(wǎng)視臺 |財(cái)經(jīng)產(chǎn)業(yè)網(wǎng) |全球經(jīng)濟(jì)網(wǎng) |消費(fèi)導(dǎo)報網(wǎng) |外貿(mào)網(wǎng) |重播網(wǎng) |國際財(cái)經(jīng)網(wǎng) |星島中文網(wǎng) |手機(jī)測評 |品牌推廣 |名律網(wǎng) |項(xiàng)目大全 |整形資訊 |整形新聞 |美麗網(wǎng) |佳人網(wǎng) |稅法網(wǎng) |法務(wù)網(wǎng) |法律服務(wù) |法律咨詢 |成報網(wǎng) |媒體采購網(wǎng) |聚焦網(wǎng) |參考網(wǎng) |熱點(diǎn)網(wǎng)
亞洲資本網(wǎng) 版權(quán)所有
Copyright © 2011-2020 亞洲資本網(wǎng) All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com