欢迎访问速发财讯!

首创“证据锚定”技术,百川推出最低幻觉循证增强医疗大模型M3 Plus

健康生活 2026-01-22 69852srtt

首创“证据锚定”技术,百川推出最低幻觉循证增强医疗大模型M3 Plus

快讯

康谈网2026-01-22 14:05:02

摘要   1月22日,百川智能正式发布Baichuan-M3Plus,严肃医疗场景下的问答准确性、可靠性,再次刷新了刚刚推出的M3所...

来源: 

首创“证据锚定”技术,百川推出最低幻觉循证增强医疗大模型M3 Plus

  1月22日,百川智能正式发布 Baichuan-M3 Plus,严肃医疗场景下的问答准确性、可靠性,再次刷新了刚刚推出的M3所创下的世界纪录。

  凭借独创的六源循证技术与M3基座结合,M3 Plus将幻觉率降低至2.6%,低于 Open Evidence,达到全球最低水平;首创“证据锚定”技术,不仅给出引文来源,还能将模型生成的每一句医学结论,精确锚定到原始论文中的对应证据段落,使 AI 的医学判断真正做到可核验、可追责、可教学。

首创“证据锚定”技术,百川推出最低幻觉循证增强医疗大模型M3 Plus

  更具意义的是,百川宣布推出「海纳百川」计划,将全球最低幻觉的循证增强医疗大模型以API形式,免费开放给中国医疗服务机构,共同繁荣国内的AI医疗生态,推动中国AI医疗的变革,让每一位中国医务工作者都能拥有可靠、好用的AI助手。

  低幻觉率再次刷新世界纪录,让AI具备迈向临床的诊疗能力

  对于中国的医生而言,拥抱AI的先决条件,是AI真实具备了足够优秀的诊疗能力。当患者频繁使用DeepSeek、豆包等通用大模型的AI产品去寻求诊疗建议,大量的误判、幻觉,不仅让医生不胜其烦,更逐渐演变为一场对中国医疗AI技术的信任危机。

  随着上周百川M3大模型的正式开源,这一局面已被彻底打破。M3不仅在 Healthbench、Healthbench Hard 等多个权威评测中登顶榜首,实现了对 GPT-5.2的全面超越,更在 OpenAI 引以为傲的低幻觉领域完成超越,以3.5%的幻觉率领跑全球。

  作为百川拓展低幻觉技术路线的成功实践,M3首创的 Fact-Aware RL的强化学习范式,使底座模型在无工具的设定下,幻觉也能大幅降低到SOTA水平。

  在此基础上,M3 Plus 将 M2 Plus 模型已验证有效的六源循证范式,引入模型训练和推理过程,确保模型的每条建议都有专业医学证据支持。最终,M3 Plus的事实性幻觉降低到新的SOTA,仅2.6%,相较GPT-5.2大幅下降超30%。即便与行业标杆 Open Evidence相比,M3 Plus 也完成了超越。

首创“证据锚定”技术,百川推出最低幻觉循证增强医疗大模型M3 Plus

  首创“证据锚定”技术:让 AI 的每一句医学结论,都能被逐句核验

  在循证医学体系中,真正决定医生是否信任一条结论的,从来不是语言是否流畅,而是结论背后的证据是否权威、是否准确、是否可追溯。相比“说得像不像医生”,临床更关心的是:这句话,究竟依据哪篇论文、哪条指南、哪一段原文。

  当前行业中,无论是通用大模型还是医疗模型,大多已支持“文献引用”——在结论后标注论文或指南来源。但在实际使用中,医生往往会发现:点开引文,依然无法判断 AI 的这句结论究竟源自哪一段证据。更常见的问题是两类:一是“张冠李戴”,引用编号存在,但文献内容对不上;二是“内容冲突”,文献本身正确,但被引用的段落与结论并不匹配,甚至存在拼接、误读。

  百川 M3 Plus 首创“证据锚定(Evidence Anchoring)”技术,不是简单标注“引用自哪篇文献”,而是要求模型生成的每一句医学结论,都必须精确对应到原始论文或指南中的具体证据段落。每一句判断,都能被逐字溯源、逐条核验。

  为实现这一目标,百川将“证据锚定”作为独立训练目标,引入 Citation Reward Model,对错误引用进行明确惩罚,让模型只能在“确实有证据支持”的空间中推理与生成。最终,结论与证据段落的匹配准确率超过 95%,真正让 AI 的医学判断做到可核验、可追责、可教学。

  M3 Plus API 调用价格较上一代模型大幅降低70%

  在大模型快速演进的当下,能力越强的模型,调用成本往往越高,许多优秀的应用因此难以规模化落地,更难真正走进临床一线。百川认为,只有持续降低智力成本,AI 才能覆盖临床、教学等真实场景,成为医生和患者“用得起、用得好”的基础能力。

  为此,M3 Plus 在系统层面进行了全面的工程重构,通过 MoE 架构优化、模型量化以及 Gated Eagle-3 投机解码等关键技术,在严格保证模型能力与可靠性的前提下,实现了 API 调用成本较上一代降低 70%,为 AI 在医疗场景的规模化应用扫清了关键障碍。

  百川全面开放M3 Plus的技术能力,API限时免费体验15天,所有开发者均可申请使用。

  「海纳百川」计划开启,M3 Plus 向行业伙伴免费开放

  随着人工智能开始进入门诊、病房和医学教学等真实场景,越来越多医生在工作中接触到 AI:查资料、看指南、对照证据、推敲诊疗方案。但在高强度、强责任的临床环境中,AI 能在多大程度上真正帮到医生,仍需要在真实使用中不断探索。

  医生“用好 AI”的新局面,要靠足够多的行业伙伴在真实场景里一起打磨——怎么嵌入医疗流程、怎么做证据呈现、怎么做风险提示、怎么支持年轻医生成长。

  为此,百川发起 「海纳百川」计划:面向所有服务医务工作者的机构,免费提供全球幻觉最低循证增强医疗大模型 M3 Plus 的 API,把服务医生的AI能力直接交到生态伙伴手里。

  从核心技术的持续突破,到面向行业生态的免费开放,「海纳百川」不仅是一个名字,更是一份推动中国AI+医疗发展的承诺。百川愿与行业伙伴一道,围绕医生、面向患者,推动医疗 AI 更安全、更可及、更有温度地发展,让技术进步真正转化为人民健康的长期福祉。

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

海报生成中...

相关阅读

阿里健康发布AI产品“氢离子” 专注医疗临床与科研场景阿里健康推出AI医学助手产品“氢离子”北京家恩德运医院遗传中心诊断技术新突破:全基因组测序发现并指畸形“漏2026广州医疗与健康产业博览会 一站式院企对接交流平台瑛泰医疗配售3520万股 募资约8.84亿港元轻松健康集团与大湾区医疗集团达成战略合作 将启动AI赋能的全民健康计安速康医疗完成A+轮融资悦唯医疗完成近亿元B轮融资派尼迩医疗完成A+轮融资牧光医疗完成数千万元Pre-A轮融资 点赞 浏览

扫描二维码分享到微信

链接已复制

最新新闻

热门新闻

The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

Copyright © 2099 速发财讯 版权所有

苏ICP备2023036119号-2 |——:合作/投稿联系微信:nvshen2168

|—— TXT地图 | 网站地图 |