關注全球時事|洞察國際風雲
2025-03-18 17:24 星期二

上海人工智能实验室发布 新版中文医疗大模型权威评测平台

时间:2025-12-03 10:36 来源:快讯社

  近日,上海市人工智能实验室发布中文医疗大模型权威评测平台MedBench 4.0,这是国内首个面向垂直大模型、专用大模型、应用场景的医疗大模型评测与验证体系。业内人士介绍,MedBench 4.0为衡量医学AI产品性能与可靠性提供了科学标尺,保障了医疗人工智能产品质量的提升与行业良性竞争。

  据悉,中文医疗大模型权威评测平台MedBench首发于2023年年中,目前更新至第四版。上海人工智能实验室医疗和评测中心负责人徐捷介绍,本次升级包含大语言模型、多模态大模型及智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

  记者从上海市人工智能实验室了解到,针对大语言模型评测,平台围绕医学知识问答、语言理解、生成、复杂推理及安全伦理等维度构建了评测集,并创新引入科学指标体系,以缓解模型信息遗漏或幻觉生成等问题对评测结果的影响;针对多模态大模型评测,瞄准医疗影像、检测报告等临床核心场景,平台可覆盖目标检测、图像分类、多模态报告质控、序列影像理解、病程动态追踪等10项细分任务,填补了中文医疗多模态评测领域的技术缺口;针对智能体评测,平台则重点解决智能体执行断层的问题,推动医疗智能体从“能对话”向“能执行、能协作”演进。

  对于医疗大模型评测的意义,徐捷告诉记者,评测首先可以验证医疗大模型的合规性,其次是验证其专业性,比如会不会误诊、漏诊或者开错药,最终帮助市场更好地训练出优质的医疗大模型。

  记者注意到,目前,不少通用大模型如深度求索、千问等都可以分析体检报告和检查报告。那么,医疗大模型的价值何在呢?

  对此,徐捷介绍称,主流通用大模型可以满足日常健康咨询。评测显示,国内头部通用大模型的医学能力已经超过国外同类产品。但对于需要给出专业判断的医疗场景,例如要做哪些检查、如何解读报告、应开什么药或者中医方剂等,大模型还需整合大量医学数据、专家医案和临床经验等语料。医疗大模型能高效处理海量信息,提供循证参考,有助于提升医生诊疗水平、补足基层医疗短板,进而实现医学普惠。

  除推出权威评测平台,上海人工智能实验室还联合专业医疗机构和相关企业,推出了儿童眼病智能筛查与精准干预系统、胃肠多模态辅助诊疗大模型等医疗人工智能应用。(记者 叶健 )


外交部:将本着科学原则研究日方关于恢复水产品输华请求
外交部:坚决反对美国向中国台湾地区出售武器
测试视频
综合看点 查看更多>>
既要又要还要,特朗普陷入“不可能三角”
靠不住的美军,拉仇恨的基地——中东危机对美国亚洲盟友的启示
欧盟外长:中东战事“不是欧洲的战争”
被“点名”参与护航霍尔木兹海峡 韩国要先“研究研究”
伊朗百余学童遇害 因美军拿“过时情报”定坐标?
纵横天下 查看更多>>
沙特首都利雅得遭弹道导弹袭击
伊朗证实最高国家安全委员会秘书拉里贾尼遇害
中美在法国巴黎举行经贸磋商
伊朗伊斯兰革命卫队称将“追杀”以总理内塔尼亚胡
第51届日内瓦国际发明展开幕 中国参展规模创新高
在加油站听美国人算经济账
特朗普对北约“感到失望”
美国为何要组建“霍尔木兹联盟”
越南举行第十六届国会代表选举
沧海桑田话古巴
记者观察:核心分歧难解 巴阿冲突或持续
特朗普再抱怨英国“放马后炮”
海湾石油运输能绕开霍尔木兹海峡吗
日本政府16日起释放石油储备 规模约8000万桶
1500万吃牛排、690万吃龙虾尾,美国防部被曝“龙虾门”
习近平会见土库曼斯坦民族领袖、人民委员会主席别尔德穆哈梅多夫
外交部:中美双方就特朗普总统访华时间等问题保持着沟通
中越举行外交、国防、公安“3+3”战略对话机制首次部长级会议
中美经贸磋商在法国巴黎开始举行
沙尘暴预警继续发布 新疆内蒙古等6省区部分地区有扬沙或浮尘
探访石家庄国际陆港:物流通达效率提升 企业“走出去”信心足
照亮人类共同未来——全球文明倡议的世界共鸣
何以铸就欣欣向荣的中国——2026年全国两会世界观察
我国成功发射试验三十号卫星03、04星
我国在超高强度碳纤维生产领域实现重大跨越
特写:澳门中学生从江实践的青春思考
逾790家展商云集香港国际影视展
香港故事丨百年警署按下“播放键”
台湾省籍代表委员:深化两岸融合发展 携手推进祖国统一大业
香港代表团举行开放团组会议
不负春光“体检”忙 “西电东送”特高压通道启动全面检修
为星空“关灯” “靠光”谋转型——解码一个西北小镇的取舍之道
2025年全国消协组织为消费者挽回经济损失9.25亿元
沪宁合高铁201.5米转体梁成功转体跨越京沪高铁
海南2025年绿电交易首破百亿千瓦时
美法院驳回特朗普政府有关推迟启动退还关税程序请求
AI漫画:司法裁决拦不住美加税野心?
最高法:规范涉企执法司法专项行动期间纠正小过重罚、过罚失当等问题367个
春运期间寄递服务保障工作方案发布 切实保障快递员休息休假等合法权利
最高检发布典型案例 涉停车扫码、人脸识别等场景个人信息保护
西藏山南:生态优势+技术创新 带动农民持续增收
浙江武义:中国有机茶之乡春茶全面开采
中国乡村“颜值”更高“气质”更佳
从“边陲山货”到“全球商品”,深山小玉米借“链”挺进大市场
人勤春早 不负春光——立春时节农耕一线见闻
救护车到底该不该抬人? ——从阳泉事件谈院前急救的一个制度盲区
《关于医保支持基层医疗卫生服务发展的指导意见》政策解读
国家医保局:去年共追回医保基金342亿元,抓获10357人
雷海潮出席全国人大记者会,回应卫生健康热点问题
2026年全国卫生健康法治工作会议在京召开
前沿科技 查看更多>>
打造全球科技交流合作盛会——2026中关村论坛年会看点前瞻
布局脑机接口,加速未来产业落地生花
未来五年 我国前沿科技攻关向“深”而行
硅藻微米机器人精准“狙击”脑胶质瘤
太空旅游离我们还有多远
健康生活 查看更多>>
人工智能重塑短视频内容生态
796款生成式人工智能服务完成备案
抢抓人工智能发展战略机遇期,携手构建网络空间命运共同体
前两个月我国科技创新保持良好发展势头
智能康养机器人养老驿站上线
实用技术 查看更多>>
新型脑机接口可作意念打字“键盘”
AI被“投毒”,如何避免上当受骗
风口之上:“养龙虾”的热闹与隐忧
全固态电池产业化还需3—5年
推动AI人才高质量聚集
科普博览 查看更多>>
江苏靖江:“人工智能+”激活制造业新动能
车企为何扎堆进军人形机器人?
第一批国家新兴产业发展示范基地创建遴选工作启动
AI智能体加速落地 距离“放心放手”还有多远?
“龙虾热”开启AI产业竞速
中国西南地区青铜文明展在西班牙开幕
陕西蒋刘遗址发现西周时期遗存
6000年前“制造业”雏形 无锡斗山遗址出土石纺轮作坊
2026全国鼓王大会在石家庄正定古城举办
走进大阳古镇 探秘“针”功夫
青海:启动学生体质强健计划三年行动
北大公布2026年研招分数线
以心育人,护航成长:筑牢学生心理健康防线
云南举行医药类高校毕业生招聘会
全国人大代表贾少谦:产教融合是职业教育高质量发展的“核心密码”
张子宇将参加WCBA全明星周末星锐赛
女篮主帅宫鲁鸣:资格赛是历练 盼与更多强队交手
F1中国大奖赛:梅赛德斯包揽冠亚军 安东内利获正赛首冠
蔡佳云、王蒙担任米兰冬残奥会闭幕式中国代表团旗手
宫鲁鸣:中国女篮要通过与世界强队交手提升水平
甘肃宕昌:官鹅沟春雪美如画
浙江宁波:家门口的水上运动公开课
第二艘国产大型邮轮计划3月20日出坞
中国光谷:“科创高地”奋力打造“旅游胜地”
中国至朝鲜国际旅客列车抵达平壤