關注全球時事|洞察國際風雲
2025-03-18 17:24 星期二

上海人工智能实验室发布 新版中文医疗大模型权威评测平台

时间:2025-12-03 10:36 来源:快讯社

  近日,上海市人工智能实验室发布中文医疗大模型权威评测平台MedBench 4.0,这是国内首个面向垂直大模型、专用大模型、应用场景的医疗大模型评测与验证体系。业内人士介绍,MedBench 4.0为衡量医学AI产品性能与可靠性提供了科学标尺,保障了医疗人工智能产品质量的提升与行业良性竞争。

  据悉,中文医疗大模型权威评测平台MedBench首发于2023年年中,目前更新至第四版。上海人工智能实验室医疗和评测中心负责人徐捷介绍,本次升级包含大语言模型、多模态大模型及智能体三大技术范式,深度对齐国家《卫生健康行业人工智能应用场景参考指引》,覆盖60个全自主构建评测集,共70万余专业评测题。

  记者从上海市人工智能实验室了解到,针对大语言模型评测,平台围绕医学知识问答、语言理解、生成、复杂推理及安全伦理等维度构建了评测集,并创新引入科学指标体系,以缓解模型信息遗漏或幻觉生成等问题对评测结果的影响;针对多模态大模型评测,瞄准医疗影像、检测报告等临床核心场景,平台可覆盖目标检测、图像分类、多模态报告质控、序列影像理解、病程动态追踪等10项细分任务,填补了中文医疗多模态评测领域的技术缺口;针对智能体评测,平台则重点解决智能体执行断层的问题,推动医疗智能体从“能对话”向“能执行、能协作”演进。

  对于医疗大模型评测的意义,徐捷告诉记者,评测首先可以验证医疗大模型的合规性,其次是验证其专业性,比如会不会误诊、漏诊或者开错药,最终帮助市场更好地训练出优质的医疗大模型。

  记者注意到,目前,不少通用大模型如深度求索、千问等都可以分析体检报告和检查报告。那么,医疗大模型的价值何在呢?

  对此,徐捷介绍称,主流通用大模型可以满足日常健康咨询。评测显示,国内头部通用大模型的医学能力已经超过国外同类产品。但对于需要给出专业判断的医疗场景,例如要做哪些检查、如何解读报告、应开什么药或者中医方剂等,大模型还需整合大量医学数据、专家医案和临床经验等语料。医疗大模型能高效处理海量信息,提供循证参考,有助于提升医生诊疗水平、补足基层医疗短板,进而实现医学普惠。

  除推出权威评测平台,上海人工智能实验室还联合专业医疗机构和相关企业,推出了儿童眼病智能筛查与精准干预系统、胃肠多模态辅助诊疗大模型等医疗人工智能应用。(记者 叶健 )


外交部:将本着科学原则研究日方关于恢复水产品输华请求
外交部:坚决反对美国向中国台湾地区出售武器
测试视频
综合看点 查看更多>>
特朗普政府想知道宣布“获胜”后伊朗如何反应
记者观察:白宫记协晚宴枪击凸显美国治理无力
白宫:特朗普及其国安团队开会讨论伊朗新提案
大使任命风波发酵 英首相坚称不辞职
激战顿巴斯,俄军有新突破?
纵横天下 查看更多>>
十载同心筑发展之路 南南携手创可持续未来
马里过渡总统:局势得到控制 继续清剿袭击者
白宫记协晚宴枪手被控试图刺杀特朗普
以色列两名前总理联组新政党 寻求击败内塔尼亚胡
特朗普再称“不着急”“没压力” 想同伊朗达成“永久协议”
斯塔默又渡一“劫” 工党前景如何
维也纳“全球治理之友小组”正式启动
第23届东博会展览总面积约17万平方米
日本岩手县山火过火面积超200公顷
欧盟委员会公布“加速欧盟”方案应对能源危机
美联储今年连续第三次宣布维持利率不变
战事60天,美伊“不战不谈”还要多久
联合国秘书长敦促开放霍尔木兹海峡
白宫记协晚宴突发枪击 特朗普紧急撤离始末
“特高课”又要重现?——起底日本“新战前情报体系”
从中央政治局会议看当前经济工作
深入学习领会总书记对服务业发展的指引
与祖国共进、与时代同行:迈向世界一流大学新高度
教科文组织官员:中国是世界地质公园网络中的重量级国家
绿润丝路 沙海生金——全球荒漠化治理的中国智慧
我国首款正向设计自转旋翼机完成首飞
全球最大汽车运输船交付 “中国制造”高端船舶实现新突破
大庆油田川渝探区天然气累计销量突破50亿立方米
国家防总通报2026年全国防汛抗旱责任人名单
大渡河老鹰岩二级水电站实现大江截流
港澳台简讯:“粤车南下”累计预约出行数目超3500辆次
香港黄埔精神爱国公民教育基地揭牌
对标“十五五”规划 香港航运业聚力高端服务转型
2026宁波文旅(香港)推介会举行
澳门特区行政长官:积极推动中葡平台功能向西语国家延伸
“海上粮仓” ——福建宁德大黄鱼鱼苗陆续投放
一座中国村庄的“气候民生”
一座中国生态新城的“气候治理”
今年第二批“国补”资金下达 消费品以旧换新今年的销售额超过4332亿元
智驾开始普及,车险“水土不服”问题咋解决?
泰国司法部:他信获准于5月11日假释出狱
农业法大修四大看点
写在“法治浙江”建设20年之际
最高法:对虚假诉讼恶意诉讼等坚决说“不”
香港举办国安法律论坛 增强各界维护国家安全意识
移轴视角看哈尼梯田春耕图
甘肃静宁:苹果花开农事忙
来寿光菜博会看未来无人农场
福建连江:早稻插秧正当时
浙江慈溪:首批大棚杨梅开摘上市
这场交流会,为县域肿瘤MDT培训打开新路径
2026年度中国青年五四奖章揭晓!
中央纪委国家监委公开通报八起违反中央八项规定精神典型问题
关于印发尼帕病毒病诊疗方案(2026年版)的通知
024年中国恶性肿瘤流行情况发布
前沿科技 查看更多>>
打破三大技术壁垒,助低空经济“飞”得更稳
从“六小龙”到“五小凤”:同一根藤上,又一串果
坚持自主可控,自动驾驶方能行稳致远
6G技术加速走向“应用场”
迄今规模最大“虚拟宇宙”构建成功
健康生活 查看更多>>
智能体走入日常 算力底座持续夯实
直击脑机接口技术“痛点”,前沿探索正多路并进
脑机接口风头正劲,但别忽视“辅助”二字
AI与科学仪器融合已到关键节点
国家知识产权局:完善新兴领域知识产权保护制度
实用技术 查看更多>>
“AI集市”亮相数字中国建设峰会
AI赋能科学研究由“单兵作战”迈向“集团冲锋”
太空金属3D打印技术在轨完成演示验证
具身智能特种机器人构筑高危作业“安全结界”
市场监管总局开展CCC认证守底线专项行动
科普博览 查看更多>>
“科技+文旅”解锁“五一”出行新玩法
两部门联合启动2026年“模数共振”行动
智能眼镜从尝鲜到常用有多远
机器人“投身”家庭保洁 具身智能迈向家庭“终极考场”
奋楫问天路,逐梦探苍穹
从长白山到贺兰山,它们为何入选新一年度全国十大考古新发现
乌兹别克斯坦希瓦举办国际舞蹈节
中国传统文化方阵亮相多哥独立日庆典
斯里兰卡举行太极拳推广活动
经典话剧《四世同堂》在墨尔本引发观剧热潮
《普通高等学校本科专业目录(2026年)》发布
教育部“信息技术支撑学生综合素质评价”试点成果现场会与工作促进会在苏州举办
段慧玲、初晓波,任北京大学副校长
青春,那是属于阅读的“黄金时代”
这堂“冠军思政课”彰显拼搏的力量
羽毛球进入“15分制”时代:一场关乎节奏、健康与商业的变革
全天综合:四海宾朋相聚三亚 中国健儿圆梦首金
英超球队切尔西解雇罗塞尼尔:执教106天下课
2026女篮世界杯分组揭晓:中美女篮同处D组
波士顿马拉松:肯尼亚选手包揽男女组冠军 双双实现卫冕
一季度我国海洋旅游业繁荣开局
铁路“五一”假期运输启动
长沙:白天不懂夜的嗨
“熊猫专列·锦绣天府号”在蓉首发
“如意甘肃·山水共鸣”文旅宣传活动启动