新智元報道 【新智元導讀】醫(yī)療AI的門檻如此高,如何克服關鍵痛點?這家互聯(lián)網(wǎng)醫(yī)療公司深耕9年,終于推出國內(nèi)首個醫(yī)療領域大語言模型MedGPT。ChatGPT帶火了大模型之后,全世界大廠都卷了起來。 強大的語言理解能力、生成能力、邏輯推理能力,讓大模型在醫(yī)療領域大有可為。 是的,硅谷巨頭們早已意識到,GPT在醫(yī)療領域的無限潛力。 早在今年2月,ChatGPT在美國醫(yī)學執(zhí)照考試中,以60%準確度的回答,已經(jīng)接近真人醫(yī)生。 話雖如此,但只要深入調查這個行業(yè)就會發(fā)現(xiàn),目前市面上真正能夠投入使用的醫(yī)療大模型,還寥寥無幾。 原因就在于,醫(yī)療AI的門檻相當之高,在這個交叉領域要想成功做出產(chǎn)品,既要懂醫(yī)療,又要懂技術。 國內(nèi)的醫(yī)療大模型之路該如何走?讓我們先看看國外大廠的發(fā)展路線。 硅谷巨頭,紛紛入局醫(yī)療GPT 當前,大型語言模型的發(fā)展,已經(jīng)有足夠的潛力給醫(yī)療保健整個行業(yè)帶去更加深遠、廣泛的變革。 比如,遠程問診效率、準確度提升,簡化醫(yī)療文檔,甚至還可以幫助醫(yī)療人員減少工作量提高效率。 GPT-4、PALM 2作為當前最先進的語言模型,微軟、谷歌等硅谷巨頭必然將它的能力拓展到醫(yī)療領域。 上個月,微軟和Epic Systems宣布,將GPT-4引入醫(yī)療保健領域,用于醫(yī)護人員對患者的消息回復,分析醫(yī)療記錄,以及尋找新的趨勢。 另外,今年夏天,微軟和Nuance將把GPT-4引入醫(yī)療保健文檔技術。微軟稱,整合后GPT-4提?了AI模型的整體準確性,但沒有透露準確率。 此外,谷歌過去幾年里也一直在探索如何用AI來改善醫(yī)療保健,比如幫助早期發(fā)現(xiàn)疾病,擴大醫(yī)療服務范圍等等。 剛剛過去的谷歌I/O大會上,谷歌在醫(yī)療領域的微調模型Med-PaLM也升級到了第二代。 值得一提的是,Med-PaLM 2一出手,就成為首個在USMLE(美國醫(yī)師執(zhí)照考試)上達到「專家」水平的模型,得分為85.4%。 甚至,它比迭代之前的Med-PaLM性能提高了18%,遠超同類AI模型。 那么,現(xiàn)在通用的大語言模型,在回答醫(yī)學問題方面表現(xiàn)怎樣呢?我們來實測一下。 MedPaLM的表現(xiàn)很專業(yè),然而,如果從應用場景看,MedPaLM還沒有那么高的實用性,因為它主要還是以做題為主。 要說回答問題,那當然少不了當紅大模型ChatGPT。 可以看到,它的回答就比較中規(guī)中矩,沒有太多驚喜。 而一旦給它上點難度,問一道國家執(zhí)業(yè)醫(yī)師資格考試真題,它就寄了…… 可見,類似ChatGPT這樣的通用類LLM,高度依賴文本統(tǒng)計概率生成答案,因此回答的準確性無法保證。 但是,在醫(yī)療應用場景中,準確性和一致性是底線,絕不能出錯。 垂直醫(yī)療大模型,難在哪? 從谷歌和微軟做醫(yī)療大模型的發(fā)展路線,可以看到,要想讓LLM在醫(yī)療領域充分發(fā)揮能力,有一些關鍵的難點。 1. 數(shù)據(jù)孤島 首先,最致命的難點就是,垂直領域的大模型,如何突破數(shù)據(jù)「卡點」? 而垂直醫(yī)療領域AI大模型,只關注醫(yī)療這個特定的領域或者場景。它能夠利用醫(yī)療的數(shù)據(jù)和知識,提供更精準和高效的解決方案。 然而現(xiàn)實是,整個醫(yī)療服務的數(shù)據(jù)信息碎片化,還有的被嚴重分割,醫(yī)療數(shù)據(jù)異構性、難流通。 一方面,不同醫(yī)療機構采用不同的系統(tǒng),每個系統(tǒng)標準不一,因此缺乏統(tǒng)一化的數(shù)據(jù)格式,或交互界面。 另一方面,醫(yī)療數(shù)據(jù)較為敏感與特殊。為更好的保護病人隱私,大多數(shù)醫(yī)院不會為利益交出數(shù)據(jù),甚至將數(shù)據(jù)庫只接入局域網(wǎng)。 再加上,患者差異、疾病繁多、醫(yī)護人員經(jīng)驗識別差異,都導致數(shù)據(jù)的不完整、不統(tǒng)一。 由此可見,醫(yī)療數(shù)據(jù)具有一定的門檻,而且業(yè)內(nèi)沒有統(tǒng)一的的數(shù)據(jù)標準,都將是訓練更專的垂類模型的絆腳石。 2. 復合型人才稀缺 值得注意的是,對于「AI+醫(yī)療」這一專業(yè)性極強的交叉領域,對復合型人才的需求極大。 醫(yī)療專業(yè)的知識本身非常精細,再加上與算法的深度融合,AI醫(yī)療這一高精尖技術,對人才綜合能力要求甚高。 3. 行業(yè)標準難統(tǒng)一 除了以上兩點,在大量涌入AI醫(yī)療的企業(yè)中,AI+醫(yī)療標準缺失也是一大痛點。 而在醫(yī)療領域中,最重要的就是準確度,否則可能會給數(shù)百萬患者帶來風險。 目前,還沒有統(tǒng)一的行業(yè)標準能證明AI醫(yī)療的有效性,如何保證真正的對患者結果負責就成為了行業(yè)中的難點。 總而言之,在醫(yī)療這一特殊領域,如果沒有打通這些痛點,并不是每個大模型的玩家都能玩轉的。 國內(nèi)首款醫(yī)療大模型MedGPT 據(jù)媒體報道,昨日醫(yī)聯(lián)正式發(fā)布了國內(nèi)首個醫(yī)療領域自研大語言模型——MedGPT。 具體來說,MedGPT基于Transformer架構,目前參數(shù)規(guī)模為1000億,可支持醫(yī)療場景下的多模態(tài)輸入和輸出。 其中,預訓練階段使?了超過20億的醫(yī)學文本數(shù)據(jù),微調訓練階段使?了800萬條的高質量結構化臨床診療數(shù)據(jù),并投入超過100名醫(yī)?參與??反饋監(jiān)督微調訓練。 還記得ChatGPT一上來「翻車」了的問題嗎? MedGPT秒秒鐘就給出了正確答案,并且還配上了每個選項的詳盡分析。 在經(jīng)典的醫(yī)學應試能力評測上,MedGPT順利過關。 不僅如此,MedGTP的創(chuàng)新之處在于,它不再是簡單的AI問答,而是以「治愈」為目的實現(xiàn)有效問診。 值得注意的是,MedGTP不僅整合了1000+多模態(tài)能力,具備強大的技術路徑,而且還成功實現(xiàn)了眾多首次突破。 - 首次突破了AI醫(yī)生無法與真實患者連續(xù)自由對話的難點。 缺少行業(yè)標準,何以壯大并持續(xù)發(fā)展 9年深耕,終獲突破 |
|
來自: liuaqbb > 《生物醫(yī)療》