中新網杭州11月28日電 (張煜歡)27日記者從浙江省衛生健康委了解到,國家人工智能應用中試基地(醫療)·浙江(下稱基地)日前組建成立醫學人工智能臨床專家庫。這支專家團隊匯集省內外41家醫院和機構的近300名醫學專家,覆蓋64個??祁I域。
他們依托基地與中國醫學科學院北京協和醫學院、中國信息通信研究院共建的“醫學人工智能測評驗證聯合實驗室”,參與醫療大模型能力評測的標準建立、考題制作、結果審核等工作。目前,團隊已完成超過20個醫療大模型的評測任務。
近年來,各類醫療大模型紛紛涌現,卻缺乏嚴肅、權威、專業的評價體系。一個核心問題日益凸顯:如何確保這些與百姓健康息息相關的AI產品安全、可靠?
(資料圖)
“專家團隊覆蓋了內科、外科、婦產科、兒科等核心臨床專科,并納入了影像、病理等關鍵醫技科室的權威專家,”醫療大模型評測技術負責人康俊暉介紹,“團隊已構建超過6萬道題的測評題庫,建立初審、復審和抽樣校驗的三審機制。這套嚴謹的體系,相當于為醫學人工智能量身定制了一套‘專業考題’。”
這些考題圍繞《衛生健康行業人工智能應用場景參考指引》設計,覆蓋患者就醫、醫生診療等真實場景,構建了健康科普、分診導診、報告解讀、用藥指導、檢驗檢查推薦、輔助診斷和輔助病歷撰寫等七大應用場景。
在題型設計上,團隊也進行了創新突破?!俺R幍目陀^選擇題只能評估模型的知識覆蓋能力,難以衡量其在復雜醫療場景中的實際表現?!笨悼熣f,“我們大幅增加了主觀簡答題比重,通過對大模型回答的深度分析,更準確地評估其臨床推理能力。”
例如,在輔助診斷場景中,不僅要求模型給出診斷名稱,還要求模型詳細闡述診斷依據和思路;在用藥指導環節,則需要說明藥物選擇的理由和注意事項。
“醫學人工智能是一個非常特殊的領域,倫理、安全、算法黑箱、幻覺等問題倍受關注,稍有不慎,極易導致信任崩塌?!被叵嚓P負責人、浙江省衛生健康信息中心主任李春浦指出,“基于網絡公開數據或有限臨床數據訓練出來的大模型,在一些醫院的落地應用中,就出現了‘水土不服’?!?/p>
李春浦進一步解釋,應用在真實臨床診療場景下的人工智能產品,僅靠掌握公開的醫學教材、文獻資料和個別醫院的數據是遠遠不夠的。
“這就好比一個醫學生,即便熟讀教科書,經歷了臨床實習,仍難以勝任復雜的診療工作。因此,我們必須用大量的‘真案例、真標準’來檢驗,通過不同醫院、不同領域真實的臨床案例,包括疑難重癥病例,參考國內外最新診療指南進行評測,才能科學評估人工智能在嚴肅醫療場景下的真實水平?!崩畲浩终f。
目前,浙江正在開展醫療大模型第二輪的測評驗證工作,推動醫療大模型測評將常態化,讓真正好用、管用、實用的醫療AI產品加速推廣應用,推動醫學人工智能高質量發展。(完)
2025年武漢商用車展上,東風商用車以"智繪綠境 馭見未來"為主題,
今年7月,東風商用車啟動了“龍擎萬里行”實戰驗證行動,直至10月份
歐盟下發全新的重型車輛碳排放標準的法規,設定了清晰的、漸進式的
在雙碳目標持續推進與物流行業降本增效需求日益迫切的背景下,純電動商用車已成為行業轉型升級的重要方向。在2025中國國際商用車展覽會上,
11月10日~13日,在2025武漢車展上,東風商用車以全新能源陣容亮相,用純電、氫能、混動等多元技術路線的6款差異化車型,充分展現出其向綠
11月10日至13日,2025中國國際商用車展覽會在武漢國際博覽中心舉行。東風商用車旗下動力品牌東風龍擎展出一系列綠色、智能動力產品,圍繞智
導讀:東風天龍KL超充重卡的主要應用場景是什么?在競爭日益激烈的電動重卡市場中具備哪些核心優勢?在近日舉行的2025中國國際商用車展上,
近日,在2025武漢商用車展上,東風商用車以智繪綠境·馭見未來為主題,重磅展出了多款混動重卡車型,展現了其在商用車新能源化浪潮中的技術
車展歷來是行業技術迭代與市場趨勢的風向標。在2025中國國際商用車展上,東風商用車亮相了一款增程式混動牽引車,成為展會現場的一大亮點。
2025年11月10日,2025中國國際商用車展覽會在中國車谷武漢盛大開幕,聚焦商用車產業的新能源化、智能化、網聯化,為接下來商用車的發展指明