• +1

温州医科大学张康团队开发MetaGP大模型用于临床决策支持

2025-04-12 17:12
来源:澎湃新闻·澎湃号·湃客
听全文
字号

原创 Cell Press CellPress细胞科学

医学

Medicine

2025年4月4日,温州医科大学视觉健康国家重点实验室和临床大数据研究院的张康教授团队和合作者在Cell Press细胞出版社期刊Cell Reports Medicine发表了一篇论文,题为“MetaGP: A generative foundation model integrating electronic health records and multimodal imaging for addressing unmet clinical needs”。该研究开发并验证了一个名为MetaGP的大型生成式人工智能基础模型,旨在整合电子病历和多模态影像数据,以应对复杂的临床需求。

人工智能(AI)在特定医疗领域的诊断任务中取得了显著进展,例如解读特定类型的医学图像或病历。然而,现实世界的临床场景往往更为复杂,涉及多种数据类型(文本病历、影像、检验结果等),并且需要处理罕见疾病诊断、急症识别等高难度挑战。现有的通用AI模型往往难以胜任这些跨学科、需要综合判断的任务,且整合海量的、异构医疗数据也极为困难。开发能够理解并融合多源医疗信息、具备更广泛临床推理能力的基础模型,对于提升复杂疾病诊疗水平至关重要。

近日,温州医科大学视觉健康国家重点实验室和临床大数据研究院的张康教授团队领导的研究开发了一个名为MetaGP(Meta General Practitioner)的生成式人工智能基础模型。该模型拥有 320亿参数,通过对包含超过800万份电子病历、540万篇生物医学文献和大量医学教科书在内的海量、多样的医疗数据进行训练,旨在模拟“全科医生”的综合能力。

研究通过严格的评估证明了MetaGP在应对关键临床挑战方面的潜力。在罕见病诊断方面,MetaGP 的表现优于先进的通用大模型(如GPT-4),诊断准确性接近经验丰富的临床医生。在急症识别方面,MetaGP能够显著提升初级和中级临床医生诊断准确率分别达53%和46%。此外,MetaGP在整合多模态数据方面表现出色,能够生成高质量的胸部X光片(CXR)和CT扫描报告,其质量在多项评估中被认为可与放射科医生的报告相媲美,甚至更优。这项研究突显了大型生成式AI模型在整合多源医疗数据、辅助复杂临床决策制定方面的巨大潜力。(可参考图1了解模型开发流程)

图1 MetaGP 开发流程与数据集概览

作者专访

Cell Press细胞出版社公众号特别邀请张康教授代表研究团队接受了专访,请他为大家进一步详细解读。

CellPress:

目前人工智能在复杂临床诊断(如罕见病、急症)方面面临哪些主要挑战?

张康教授:

当前的医疗AI往往非常“专科化”,比如一个心脏AI可能不理解神经系统的问题。这种“管窥效应”限制了它们在需要全局观和跨学科知识的复杂场景中的应用,特别是在症状模糊、病情紧急或涉及罕见病的情况下。此外,真实的临床数据是多模态的(病历文本、影像、检验数据等),并且常常是非结构化的,如何有效地整合这些异构数据,让AI能够全面理解患者情况,是一个巨大的技术挑战。现有模型通常需要大量人工预处理和结构化数据,这既耗时又可能丢失信息,也限制了模型的可扩展性。我们需要的是能直接学习和理解多样化原始医疗数据、具备更广泛医学知识和推理能力的基础模型。

CellPress:

MetaGP是如何应对这些挑战的?这项研究的关键贡献和优势是什么?

张康教授:

MetaGP的核心思想是通过在一个极其庞大和多样化的医疗数据集上进行训练,构建一个具有广泛医学知识基础的“通用”模型。我们整合了数百万份真实世界的电子病历、海量的医学文献和教科书,以及后续针对罕见病、急症和影像报告的专门微调。这使得MetaGP不仅学习了理论知识,也掌握了临床实践中的模式。

关键的是,我们证明了这种方法在几个关键的“硬骨头”领域是有效的:1)显著提升了罕见病的诊断能力,其表现可与资深医生媲美;2)在急症场景下,它能有效辅助医生(尤其是经验较少的医生)提高诊断准确性,这对于争分夺秒的急救至关重要;3)它成功整合了文本和影像信息,能生成可靠的放射学报告。MetaGP的优势在于其“基础模型”的特性,它提供了一个强大的、可适应多种下游任务的平台,并且相比通用大模型,它在生成潜在有害或错误医学建议方面表现出更强的抑制能力,这得益于其深厚的医学领域数据训练。

CellPress:

本项研究还有哪些亮点?

张康教授:

我认为有几个亮点值得一提。首先是数据规模和多样性,我们使用的训练数据涵盖了可能是目前公开报道中最大规模之一的电子病历、文献和书籍组合,确保了模型的知识广度和深度。其次是严格的多维度评估,我们不仅使用了自动化的客观指标(如F1分数、ROUGE-L等),还进行了由多位不同年资医生参与的盲评,直接与人类专家和顶尖通用模型(如GPT-4)进行比较,评估其在真实临床案例中的表现。第三是聚焦未满足的临床需求,我们特意选择了罕见病和急症这两个AI应用的难点进行突破,并展示了积极的结果。最后是成功的多模态整合,MetaGP 能够处理和关联文本病历与医学影像(CXR和CT),并生成高质量的影像报告,展示了其处理复杂医疗数据的综合能力。

CellPress:

关于MetaGP或这类医学基础模型,未来的发展方向和需要克服的挑战有哪些?

张康教授:

挑战依然存在。首先是模型的可解释性,虽然MetaGP表现出色,但理解其“思考”过程对于建立临床信任和安全应用仍然很重要,这是所有复杂 AI模型的共同挑战。其次是持续优化和减少偏见,尽管我们使用了多样化数据,但仍需警惕并持续监测和减轻潜在的数据偏见,确保模型对不同人群的公平性。伦理和整合也是关键,如何将这类强大工具安全、有效地融入现有临床工作流程,避免过度依赖,并建立人机协作的最佳实践,需要深入研究。

未来的方向包括:继续扩大模型规模和训练数据(在计算资源允许的情况下);进一步提升模型在更多专科领域的性能;开发更好的可解释性方法;在最新deepseek R1 开源模型进行进一步推理训练,以及最重要的——进行前瞻性的临床试验来验证MetaGP在真实医疗环境中对患者结局的实际影响。我们计划将MetaGP开源,希望医学界能够利用它,结合特定的数据集进行微调,以解决更多具体的临床问题,共同推动AI在医疗领域的应用。

作者介绍

张康

教授

张康教授,论文最后通讯作者。临床大数据研究院院长,温州医科大学眼健康与疾病高级研究院院长,智慧医疗领域全球公认的顶尖学者之一,从原创性发现到临床转化做出系统性贡献。共发表SCI论文400余篇,其中以第一/通讯作者在Cell、Nature、Science、NEJM、Nature Medicine等国际顶尖期刊发表20余篇,总引用次数7万余次(源自google scholar),H指数105+,连续6年入选科睿唯安Clarivate全球高被引学者。任世界华人医师协会眼科医师分会会长,获“世界杰出华人医师奖”,获授权发明专利37项,国际专利28项。Signal Transduction and Targeted Therapy以及Precision Clinical Medicine共同主编。美国医学与生物工程院会士、美国科学促进会会士、英国皇家医学院会士、皇家化学院会士。

相关论文信息

论文原文刊载于Cell Press细胞出版社旗下期刊

▌论文标题:

MetaGP: A generative foundation model integrating electronic health records and multimodal imaging for addressing unmet clinical needs

▌论文网址:

https://www.sciencedirect.com/science/article/pii/S2666379125001296

▌DOI:

https://doi.org/10.1016/j.xcrm.2025.102056

Cell Reports Medicine现已加入Cell Press MJS多刊审稿!的前身Cell Press Community Review模式于2021年推出。对于通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的作者,我们将提供稿件被多本期刊同时考虑的机会。超过80%通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的文章获得了至少一个或多个期刊的评审。

CellPress细胞出版社

原标题:《温州医科大学张康团队开发MetaGP大模型用于临床决策支持 | Cell Press对话科学家》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2026 上海东方报业有限公司