關注全球時事|洞察國際風雲
2025-03-18 17:24 星期二

上海人工智能实验室发布 新版中文医疗大模型权威评测平台

时间:2025-12-03 10:36 来源:快讯社

  近日,上海市人工智能实验室发布中文医疗大模型权威评测平台MedBench 4.0,这是国内首个面向垂直大模型、专用大模型、应用场景的医疗大模型评测与验证体系。业内人士介绍,MedBench 4.0为衡量医学AI产品性能与可靠性提供了科学标尺,保障了医疗人工智能产品质量的提升与行业良性竞争。

  据悉,中文医疗大模型权威评测平台MedBench首发于2023年年中,目前更新至第四版。上海人工智能实验室医疗和评测中心负责人徐捷介绍,本次升级包含大语言模型、多模态大模型及智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

  记者从上海市人工智能实验室了解到,针对大语言模型评测,平台围绕医学知识问答、语言理解、生成、复杂推理及安全伦理等维度构建了评测集,并创新引入科学指标体系,以缓解模型信息遗漏或幻觉生成等问题对评测结果的影响;针对多模态大模型评测,瞄准医疗影像、检测报告等临床核心场景,平台可覆盖目标检测、图像分类、多模态报告质控、序列影像理解、病程动态追踪等10项细分任务,填补了中文医疗多模态评测领域的技术缺口;针对智能体评测,平台则重点解决智能体执行断层的问题,推动医疗智能体从“能对话”向“能执行、能协作”演进。

  对于医疗大模型评测的意义,徐捷告诉记者,评测首先可以验证医疗大模型的合规性,其次是验证其专业性,比如会不会误诊、漏诊或者开错药,最终帮助市场更好地训练出优质的医疗大模型。

  记者注意到,目前,不少通用大模型如深度求索、千问等都可以分析体检报告和检查报告。那么,医疗大模型的价值何在呢?

  对此,徐捷介绍称,主流通用大模型可以满足日常健康咨询。评测显示,国内头部通用大模型的医学能力已经超过国外同类产品。但对于需要给出专业判断的医疗场景,例如要做哪些检查、如何解读报告、应开什么药或者中医方剂等,大模型还需整合大量医学数据、专家医案和临床经验等语料。医疗大模型能高效处理海量信息,提供循证参考,有助于提升医生诊疗水平、补足基层医疗短板,进而实现医学普惠。

  除推出权威评测平台,上海人工智能实验室还联合专业医疗机构和相关企业,推出了儿童眼病智能筛查与精准干预系统、胃肠多模态辅助诊疗大模型等医疗人工智能应用。(记者 叶健 )


外交部:将本着科学原则研究日方关于恢复水产品输华请求
外交部:坚决反对美国向中国台湾地区出售武器
测试视频
综合看点 查看更多>>
伊朗外长:达成公平公正协议是可能的
高市早苗重申“不过半数就辞职”,日本众议院选举共有哪几“关”?
高市早苗:若执政党阵营在众议院选举中未过半数 将即刻辞职
利比亚与法、美油企达成超200亿美元协议
欧盟外长:“和平委员会”应受限于安理会决议
纵横天下 查看更多>>
美国南加州多地举行反暴力移民执法示威活动
美航母舰队逼近 伊朗及盟友发严厉警告
欧盟启动对X平台的正式调查
美“移民执法”再杀美国公民
格陵兰岛自治政府:不了解“协议框架”内容 丹麦首相:北约秘书长无权代表丹麦
高市党首讨论直播“放鸽子” 引发在野党批评
风暴“钱德拉”袭击英国
黎巴嫩民众集会声援伊朗
叙过渡政府与“叙利亚民主力量”延长停火15天
崔洪建:面对美强索格陵兰岛 欧洲手里的牌不多
特朗普宣布美国独立250周年活动:白宫草坪看格斗,首都街头飙赛车
最新一期德国《明镜》周刊亮出标题:“唐纳德,够了!”
特朗普宣布对韩国加征关税
德国柏林发生枪击事件 5人受伤
巴基斯坦卡拉奇购物中心火灾死亡人数升至60人
习近平会见芬兰总理奥尔波
国家发展改革委印发意见 推进城际铁路健康可持续发展
中方重申:日本根本没有资格要求“入常”
中医药抗衰老原创成果跻身年度十大进展
增长5%!2025年中国GDP跨越140万亿元关口
2025年国内居民出游人次超65亿
大熊猫“晓晓”和“蕾蕾”将于27日从日本回国
达沃斯论坛:中国为世界提供“机遇清单”
深圳打造科技零售新地标 逛街逛出“未来感”
二十四节气中的中国智慧
群策群力 聚爱前行——香港大埔火灾善后全景扫描
香港特区立法会通过主动对接国家“十五五”规划议案
陈茂波:香港三大增长引擎发展潜力巨大
港澳探讨深化反贪合作推动廉政建设
世界可持续发展前沿论坛在香港举行
沪宁合高铁201.5米转体梁成功转体跨越京沪高铁
海南2025年绿电交易首破百亿千瓦时
国家电网经营区去年省间交易电量规模创新高 首次突破1.6万亿千瓦时
六类涉住房租赁企业纠纷高发 54.8万笔租赁合同、17.1亿元资金纳入监管
民生领域反垄断执法再加力 平台经济成重点
春运期间寄递服务保障工作方案发布 切实保障快递员休息休假等合法权利
最高检发布典型案例 涉停车扫码、人脸识别等场景个人信息保护
最高法:加强对新型犯罪的依法治理综合治理
中央政法工作会议在京召开 陈文清出席会议并讲话
海南加强种业知识产权司法保护 服务“南繁硅谷”建设
一片叶“沏”出农文旅融合新画卷
云南元谋:南菜北运生产忙
中央农村工作会议关键提法之四:新一轮千亿斤粮食产能提升行动
强化深度体验,云南旅居经济持续升温
打好特色牌!“产业旺”促“乡村兴”
临西县人民医院“公益诊疗  +  学术共享”
临西县人民医院胃肠早癌公益筛查活动圆满落幕
2026年全国卫生健康宣传思想文化工作会议在京召开
入睡困难、晨起昏沉、工作走神……警惕这些亚健康信号!
【名单公布】2025年第二批县域肿瘤防治中心评估结果正式公布
前沿科技 查看更多>>
聚优势之力 绘就中国AI高质量发展新图景
我国将高水平推进三大国际科技创新中心建设
瞄深空!南极“天眼”看见了啥?
中国空间站动态|整理、打包、装载,送别神二十!
我国已发布 “新三样”国家标准57项
健康生活 查看更多>>
三大人工智能区域工作组成立 共推标准建设
“智造”推动产业转型升级
未来五年,空间科学驶入快车道
AI赋能“手搓”打开创业新风口
我国科学家成功研制“纤维芯片”
实用技术 查看更多>>
AI助力 我国手机行业攀高向优
国产软件关键领域获新突破
可“解难题”也可“出好题”!中国科学家取得通用人工智能逻辑推理新突破
智能眼镜“热”撬动产业链升级
我国实现太空金属3D打印
科普博览 查看更多>>
AI“打广告”背后的治理考题
北京商业航天产业聚势起飞
中国科学院报告提出高温超导带材领域十大关键科学技术问题
展望全球人工智能2026年演进新局
北京:2027年将累计建成算力规模20万P左右
2026广州新春灯会开幕
“过年——春节主题摄影展”彰显中华年韵
北京朝阳:中外居民体验国粹文化
北京:“天宫灯会”点亮冬夜
北京北海公园琉璃阁院落腾退移交 “西天梵境”恢复完整性
考一次,认多处!人社部将逐步扩大职业技能证书互通互认覆盖范围
2026,教育改革释放哪些信号?
科学家刊文称:发现影响癌症进展的关键细胞
部分低价体验课异化为“套路课”
教育部等七部门印发意见推进中华优秀语言文化传承发展
这个篮球女孩说:“我的天赋只有努力”
郑洁:20年间,中国网球从“零的突破”到“全面开花”
澳网综合:王欣瑜止步16强 卫冕冠军凯斯出局
中国足球,请昂起头,向前走!
花滑四大洲锦标赛:隋文静/韩聪领跑双人滑短节目
千年茶马古道:在现代文旅热潮中焕发新生
梦幻“冰世界”
“冰雪赛车”燃动“尔滨”冰雪
超936万人次!2025年上海接待入境游客量创新高
一城一特色焕新文旅 夜经济激活消费新引擎