2019年6月21日,挑戰廣州,真醫某行業展會展出的生A生剛應用在醫療領域的智能機器人。 (視覺中國/圖)
它展現出了真人醫生一樣的剛上問診素養。
“您說的挑戰甲狀腺結節四年前是怎么發現的?當時有什么癥狀?這四年來結節有沒有變大或其它癥狀?您是否定期復查?最近一次復查什么時候?”
這些連珠炮似的提問,令從醫十余年的真醫李惠感到驚訝。因為提問來自一款醫療大語言模型(下稱“大模型”)MedGPT,生A生剛又稱AI(人工智能)醫生。剛上李是挑戰一位腎內科副主任醫師。
就在2023年6月底,真醫李惠與9位來自心內科、生A生剛消化內科、剛上呼吸內科、挑戰內分泌科、真醫腎臟內科、生A生剛骨科、泌尿外科等科室的醫生,聯手挑戰MedGPT。后者于2023年5月推出,號稱國內首款醫療大模型。
這場在成都的一家醫院舉行的測試,也被業內譽為人類與AI在醫學領域的一次公開比拼。
最終經過7位專家的評審,真人醫生綜合得分為7.5分,AI醫生綜合得分為7.2分。AI醫生與三甲主治醫生在比分結果上的一致性達到了96%。
考慮到大模型不斷自我學習成長的能力,眼前的成果難免令人對AI醫生的應用前景浮想聯翩。據南方周末記者不完全統計,2023年5月以來,國內已至少有醫聯、商湯科技、京東健康、聯影智能、上海聯通等企業相繼發布了醫療AI大模型。7月27日,谷歌亦發布全球首個全科醫療AI大模型Med-PaLM M。
不過,在醫療大模型投入應用前,從診斷的準確性和可解釋性,到醫療數據的來源,再到AI醫生與真人醫生的關系,許多倫理問題仍待厘清。
和大火的ChatGPT一樣,MedGPT的界面也是一組簡潔的對話框,可見對話與問答功能是其核心所在。在一則現場問診視頻中,患者與MedGPT、真人醫生的對話氣泡分別用藍色和綠色表示。但即使不借助顏色,二者之間也有著顯見的差別。
問診中,病人自訴腰疼,AI會追問,左側還是右側?“如果是單側疼痛,也有可能是腎周感染,但更要考慮結石或腫瘤。”李惠告訴南方周末記者,AI在不能查體的情況下,能通過對話彌補一部分差距。
從文本上看,人類醫生的表述更加口語化也更簡潔。MedGPT則透露著機器特有的耐心和客氣。它的回復往往以“您好!感謝您的配合”開場,接著是長篇大段的解答,有時也會連續發問。
“問診比較詳細,它對于每個細節都很注重,作為臨床醫生的補充是非常有幫助的。”作為評委的北京阜外醫院心內科主任醫師楊躍進表示,“但詳細有時候意味著重點不突出,有些問題就需要一查到底,未來還需要繼續凝練。”
“我們沒想到一致性得分會這么高,大家都很興奮很滿意。”互聯網醫療企業醫聯MedGPT項目負責人王磊表示。
從最近層出不窮的新品發
2025-04-17 01:42
2025-04-17 01:28
2025-04-17 00:57
2025-04-17 00:22
2025-04-16 23:54
2025-04-16 23:44