新智元报道

编辑:编辑部 HYZ

【新智元导读】5天发布5项领先,从此,人人都有了口袋里的健康专家——好伴AI。

在医疗领域,我们很多人的痛点就在于,80%的优质医生都集中在一线城市。与此同时,最近中美网友小红书对账的事,再一次揭露了国外医疗程序的繁琐和不够人性。

而好伴AI的使命,就是让每个人无论身在何处,都能拥有口袋里的健康专家!对用户,它的口袋里的健康咨询专家;对医生,它是专业知识和经验的应用和传播者。

接下来,就让我们详细领略一下智诊科技的五天发布会内容,感受一下这款AI将如何变革我们的智能健康医学新时代。

简短目录如下——

  • Day 1:无限记忆

  • Day 2:全科医疗基座&深度推理

  • Day 3:分身有术

  • Day 4:精准解读

  • Day 5:好伴AI,触手可及

Day 1:让AI拥有无限记忆,事无巨细地了解我们、懂得我们、关心我们

第一天,智诊科技通过WiseDiag-Z1让AI拥有了无限记忆,具体来说,是一种即插即用的记忆力机制。

从脑科学的角度来说,记忆始于神经元之间的信号传递。不过,人类的碳基记忆不是完美的,许多记忆会模糊、消失。而研究者希望,能赋予AI一个全新的记忆系统,克服碳基记忆的弊端。

智诊AI系统最基础的特性,就是支持多国语言,尤其支持中文。并且这个系统模拟了人类记忆的特性,能够自动提取、存储三种不同的记忆信息。

具体来说,包括完整对话内容、以天为单位的记忆总结,和事件级记忆。这样,在医疗问诊的多轮长对话中,它就能方便用户获取所需信息。

同时,为了让大模型不搞错模糊代指的记忆,研究者专门开发了基于端到端的多轮多路上下文查询能力,从而帮助AI理解复杂的多轮对话。


另外,研究者还开发了一个AI的模糊记忆查询功能,这就可以通过模糊的内容联想(时间或地点)来查询记忆。

比如在下面这个demo中,研究者问:前天和你说的关于买咖啡的事,你还记得不?但其实这件事是昨天聊的,不要紧,系统依然查出来了所需信息。


或者,我们可以让AI帮忙回忆一下,我有个梦里有森林和美丽的颜色,那是什么样的梦?可以看到,即使用户记不清细节,好伴AI依然可以根据模糊表述查到准确记忆。


想象一下,为了在医院看病时,AI医生分身能事无巨细地了解我们的生活习惯、医疗记录,像老朋友一样懂我们,关心我们的身体,这也太令人期待了!

Day 2:全科医疗基座 & 深度推理,懂医还会聊

第二天,全学科医学基座大模型WiseDiag首次亮相,与此同时,医学版o1推理模型也来了。

作为医学基座大模型,WiseDiag采用了最新一代大模型架构,共有730亿参数,具备了强大医学知识处理能力。

它在超3万亿token的专业级优质医学数据中完成了训练。

其中包括,大量权威医学教材、最新临床指南,以及海量高水平医学研究论文。

预训练之后,WiseDiag还用到了SFT监督微调、PPO直接偏好优化的训练方法,以及受邀的临床专家深度参与训练过程。

通过精心设计的训练,新模型不仅掌握了丰富的医学知识,更具备了类医生的临床思维能力,能够为医疗决策提供专业、可靠的智能支持。

在专业能力方面,WiseDiag在中文医学大模型权威基准CMB和Medbench中,分别拿下了98.39和92.9的成绩。

尤其是,在CMB上,分数几乎接近满分,愈加证明其对医学知识掌握到位。

在通用能力方面,WiseDiag也在中文基础模型评估C-Eval和极具挑战性的大规模多任务理解评测MMLU-Pro中,取得了媲美国内外顶尖模型的表现。


WiseDiag在通用和专业基准上优异表现,恰恰印证了智诊的初衷——打造一个既懂医,又会和人沟通的AI助手。

当然,考试测试是一方面,更重要的是它能够在实际应用场景中,真正帮助到医生和患者。

深度思考版本Z1

医学领域,也有其o1版推理模型。

基于WiseDiag,团队打造的深度思考版本——Z1在这次发布会中,首次亮相。

对于一位经验丰富的医生来说,在遇到疑难病例时,他会不断深入分析,反复推敲论证,并根据新的发现及时调整思路。

这个过程,如果是被AI实现了呢?

通过采用多层次推理扩展机制,Z1能够像专家医生一样,进行深入细致的分析思考和反复权衡,直至找到最优解。

这一突破,让WiseDiag不再停留在简单的「查找规则配方」层面,而是真正具备了专业的临床思维能力。

在实际应用中,Z1已展现出了令人瞩目的深度思考能力。

接下来不如看个栗子,打开好伴AI,我们将疑难杂症的一个病例发给它,让AI帮我们做出诊断。


在经过深思熟虑之后,好伴AI基于所给的信息,准确指出了这个病症——庞贝病。

要知道,这是一个全球罕见的遗传代谢病,全球发病率1/30万。不仅如此,它还是症状「伪装者」,若能早期识别对治疗影响极大。

但对于医生而言,得出诊断都是一种挑战。

如果AI能对类似罕见病早期预见,将会带来极大的医疗价值。

可以看到,好伴AI不仅给出了最终的诊断,还给出了完整鉴别诊断思路。这种诊断模式与临床医生的思维高度吻合,能够真正助力医生的日常诊疗工作。


当然了,AI提供的只是一个高敏预警,承担的角色是辅助诊断/决策,并不能取代真正的医生。

若真怀疑是罕见病,患者应尽早面诊专业医师,需要结合病史、体格检查、影像学结果、多项实验室检查来做综合判断。

不论Wisediag,还是Wisediag-Z1,它们都是全学科医学大模型。

有了这样一个强大的基座大模型,我们就能打造出一个专属的专业级健康专家助手。

Day 3:AI医学专家分身有术,7x24为你诊疗

第三天,研究者还带来了医学领域的AI智能体——医学专家分身系统。

医少患多,这种不平衡的医疗资源,造成了各大医院专家每天被上百位患者「围追堵截」的现状。

特别是,知名专家的号几乎「一票难求」。

这时,如果每个医生能够有一个「分身」,可以7x24小时对全国患者做出回应,对医生和患者来说都是福音。

这不仅让更多人能享受到优质医疗资源,还能大大节省就医成本和时间,让看病变得更加便捷高效,让高水平健康医疗资源实现普惠。

对于准妈妈来说,最常见的一个问题是——剖宫产和顺产侧切,哪种方式对身体伤害更大?

王权利是浙二医院产科权威专家,在好伴AI中,就有一个AI版的王权利主任。

接下来,就把这个问题交给这位AI专家,在经过60多秒思考,参阅12篇权威资料后,它给出了非常详实的解读。

它的回复专业性强且富有人文关怀,既讲清了顺产和剖宫产的医学利弊,又很好地安抚了准妈妈的心理需求。

而且, 为了说明问题,AI还援引了WHO的权威数据,并给出温馨提示。


王权利专家现场点评道,「它用『内伤』和『外伤』这个比喻很形象地解释了剖宫产和顺产的区别。其中,『出血1000ml的定义』这个细节和我在抖音视频中的描述一致,体现了较强的专业性和实用性」。

他还表示,「这个AI分身已经达到自己80%的功力,未来经过改善,可能会达到90%以上」。


专家AI分身能够实现,背后的门道是什么?

那便是,医学编码模型Med-Embedding+医学知识库+网络搜索。

在如此专业的领域中,AI能准确理解各种复杂的医学术语,前提是其向量化,Med-Embedding的效用便是在此。

每一个医学文本都可以转化成一个「向量」,就像拥有一个独特的地理坐标。

举个栗子,患者提出一个问题,「医生,我最近皮肤发黄,尿色变深,还总是肚子疼,感觉特别没精神,这是怎么回事」?

Med-Embedding可以精准将这段描述,转化为一个1794维的「医学坐标」。

普通的编码模型很难区分「发烧38度三天」和「反复低热」的区别,因其坐标分布比较近。但对于医生来说,信息侧重点是完全不同的。

Med-Embedding却能够捕捉到医学临床意义的细微差别,从而精准把这两个信息坐标隔开,从而区分出它们的医学关系。

在MedicalQARetrieval等多个医学召回测评集中,Med-Embedding也拿下了不错的成绩。


王权利主任的AI分身是在WiseDiag基础上,通过医学编码模型,学习了其发表的40+篇论文,以及视频平台上近400个视频后打造的。

就比如,他的个人习惯用语、打比方,甚至是一些碎碎念,AI分身可是学的有模有样。

它学会了王权利在每日查房时必问的那句——「昨晚睡够8小时了吗」?

此外,AI能有理有据,全凭智诊拥有自主可控的医学网络搜索、医学全科知识库和专家个性化知识库。

其中,医学全科知识库包含40多万条持续更新的医学知识;专家个性化知识库则收录了每位专家独特的临床经验和专业见解。

未来,这些知识还会持续更新和维护,以确保信息时效性和准确性。


为了确保可靠性和透明度,在AI回答中列出了详细参考链接,确保信息可溯源

最值得一提的是,智诊还将专家经验做成了「数字插件」,融合了顶尖专家的经验和诊疗思路。

正如演示中所示,专家分身不仅保留了好伴AI的优势,甚至能模拟专家特有的临床思维模式,提供更精准的建议。

从此刻起,任何一个人打开好伴APP,找到「产科王利权」专家分身,即可获得——

3秒生成个性化产检计划、1分钟解读唐筛报告、24小时在线的「孕期守护者」。

如今,国家正在对「分级诊疗」「互联网+医疗」大力扶持,优化医疗资源配置,解决群众「看病难、看病贵」的问题。

在这样的背景下,口袋医生的出现就十分应景了。它缓解了基层医疗机构的压力,提高了公众的自我健康管理,还能辅助医疗专业人员。

可以说,它的出现与政策的方向是完全一致的。

Day 4+5:好伴AI精准解读医学报告,像医生一样给出诊断

第四天和第五天,研究者将上述技术凝练成了触手可及的产品——「好伴AI」。


第一款专注于全人类健康生活、医疗咨询的智能助手软件,诞生

上面说到,很多时候专家号一票难求,但有了好伴AI这个医学专业领域的聊天机器人,我们的这些难题就可以迎刃而解一大部分!

这是因为,它能够读懂复杂的医学报告,能够像医生一样给出详细的分析、诊疗和判断。

在首页,我们可以使用检测单解读、体检报告解读、全科医学咨询、专家分身咨询等核心功能。

或者,直接输入语音或文字,跟AI健康管家「好小伴」发起对话。


相信很多人都有这样的经历:在医院拿到检测报告单后一筹莫展,看不懂复杂的医学用语,也不理解异常的数值或结果。

这时,我们就可以使用好伴AI的检测单解读功能。


将血气报告拍照上传好伴AI后,它便开始了详尽的分析,并给出了辅助诊断结果和依据:高度怀疑是DKA,即糖尿病酮症酸中毒,建议患者去做尿酮体检测和尿常规,需要立即就医。

可以看到,整个分析过程逻辑缜密,并且明确对患者强调了紧急性。


这个真实病例的就诊文件中还有两份检查单,正是尿常规和糖尿病酮症的指标;可以证明AI医生推荐的检查项目的正确性

另外,我们还可以上传自己的体检报告,它会给我们一份专家级的解读报告。整个体检报告智能咨询功能,非常准确、科学、个性化。

在填写完一份调查问卷之后,好伴AI就会进行综合分析,并给出一份「健康咨询报告」。


首先,是结合了用户生活习惯和同年龄段人群数据的健康得分,可以反映用户当前的身体状况。

然后,它还给出了一份详细的健康状况综述,指出体检报告上的异常,给出分析和应对方式。



而报告最核心、最详细的部分,就是健康风险解读。包括对异常指标可能原因的分析、对健康的影响、此次检测的局限性、后续处理建议和异常项的精准认知。

值得一提的是,这些都是由WiseDiag模型结合医学知识库和网络搜索得出的。


智诊AI的研究者表示,这是自己在国内外见过的最详细、最看得懂的体检报告解读了。

而下面这个专家分身功能,是研究者基于智诊医疗大模型,融合多位三甲医院专家的诊疗经验和知识打造出来的。可以说,每一位医生分身,背后都有真实的知名专家。

比如,我们试试这个问题:孩子忽然发烧39度两天了,身上有红疹,可能是什么病?


可以看得到,国内外常见的通用AI,一般只会建议退烧药,但好伴AI会提示——「警惕川崎病,建议立即就医并检查C反应蛋白」。

这完全就是普通家长很难想到的专家级建议!


因为川崎病是小儿发热合并皮疹、黏膜变化的一种疾病,有「发热、结膜充血、口唇/舌头红、四肢末端改变」等典型临床表现,需要尽早诊治,AI医生的这个诊断,就显得非常及时了。

AI医生做出警示后,家长可以尽快就诊,排除其他发热病因,而不要过度慌乱,或者仅依赖网络咨询。

再比如下面这个真实案例:患有癫痫的孕妇,未补充叶酸,正在服用拉莫三嗪,胎儿能要吗?

产科主任AI分身直接上重点:孩子能要!它还干脆利落给出行动清单——产检、补叶酸、停中药。

同时,它还用「一起努力」给患者稳定情绪,让医嘱变成了贴心的叮嘱。


值得注意的是,孕期癫痫用药需谨慎,拉莫三嗪是比较常见的安全性相对较高的抗癫痫药,但具体方案仍需产科和神经内科医生联合评估。

目前,AI只是提供了常规指导,对于实际患者来讲,还需要个体化与产科大夫沟通,及时做血药浓度监测、胎儿畸形筛查等。

或许会有读者有疑虑:AI医生究竟靠不靠谱呢?

为此,智诊AI请到了十位医学专家,对包括WiseDiag在内的四个平台提供的服务诊断结果打分,可以看到WiseDiag被公认为TOP 1。


对于体检报告的解读,十位专家也给出了打分,WiseDiag依然明显处于领先水平。


曾有报告称,在国内,80%的优质医疗资源集中在一些主要城市中,而好伴AI的出现,可以让患者无论身在何处,都能在口袋里拥有一位健康专家。

同时,每位专家也能同时服务成千上万名患者。

这,便是医疗普惠的意义。

当然了,AI的作用并非完全取代临床医生,而是作为一种极具前景的辅助决策工具。

因此,它必须在合规框架、伦理与安全性验证下,才能让更多患者放心受益。

虽然AI可以「看懂检测报告」「协助做罕见病诊断」,但在实际临床使用中,医生通常需要结合病史、体格检查、影像学结果、多项实验室检查来做综合判断。

因此,AI系统目前主要的角色是「辅助诊断/辅诊决策」,在临床上应与专业医师的面诊相结合,而并不是完全替代医生。

智诊API开放平台发布,开发者也能用

令人激动的是,智诊API开放平台也同时发布了!

从此,开发者也能参与这场医疗AI革命。


针对不同场景需求,智诊打造了3款同系列模型。

WiseDiag-Z1,是标准版的全科医学通用大语言模型,基于技术底层开发,适用于大多数健康咨询场景。

在此基础上,智诊还打造了深度推理强化版Z1 Thinking。它能模仿顶尖医生的思维过程,适合多步骤复杂场景健康咨询,如针对疑难病症的诊断、多阶段治疗方案的辅助设计等。

而Z1 Lite,是希望更快更经济得到答案的用户的不二之选。它更具性价比,在保持大部分核心性能的情况下,能帮普通用户低成本获得服务。

此外,智诊还提供了几个高附加值的特色工具,如智诊Med-Embedding(医学向量化模型),硅基永久记忆数据库,高性能医学OCR工具(Med-OCR)等。

为了助力开发者,智诊AI为每个新账号都提供10美元免费额度。

深度思考,重构医疗AI新范式

过去一年,人们都在讲应用落地,而医疗AI是大模型落地最佳场景之一。

连更5天发布会,从无限记忆、深度推理模型、到专家分身系统、口袋助手,再到API开放,智诊开启了AI重塑医疗的全新旅程。

前段时间,世界经济论坛公布的一份报告中,预测了全球有80亿AI医生的愿景。

AI已经成为医疗行业变革的主要力量,预计2024-2032年将以43%的速度增长,届时AI医疗市场规模将达到4910亿美元。


另有德勤统计,到2030年,全球医护人员缺口预计达1000万,这个数字意味着医疗不公平现状依旧存在。

在国外,谷歌DeepMind团队曾专门做出了AI医疗大模型Med-PaLM,拿下92.6%高分水平媲美临床医生。

除了谷歌之外,还有IBM医疗大模型Watson、斯坦福基础模型研究中心的BioMedLM(PubMedGPT)等等。

反观国内,有专攻医疗领域百川智能,还有讯飞星火医疗大模型等头部科技公司,均在这一领域有所深耕。

能够做出医疗领域的「推理模型」,智诊还是国内首次。

与传统大模型相比,深度思考推理模型能够模拟医生的临床思维过程,从症状诊断到逻辑推导,这正是医疗决策中的关键环节。

另一方面,推理模型另一个重要特点便在于其「可解释性」。

在医疗决策中,理解诊疗背后的原因至关重要。

一般来说,AI给出建议的推理过程,需要与临床医生的逻辑相匹配。否则,若AI出现幻觉,可能会带来严重的医疗事故。

WiseDiag-Z1能清晰展示诊断的每一步推理过程,这不仅有助于医生验证AI的判断,还能帮助患者更好地理解自己的病情。

不仅如此,智诊AI在上线时,已与个多位临床专家展开合作,并进行了反复验证。

同时,它还会不断自主收集和纠正「错误case」,逐步迭代,尽最大程度减少误诊漏诊的隐患。

而在医疗数据快速积累的今天,具备推理能力的医疗模型,还具备了持续学习和能力进化的潜力。

通过不断吸收新的医学研究成果、临床经验,它们可以始终站在在医学前沿,为医生患者提供最新、最准确的诊疗建议。

随着医疗资源分布资源不均问题日益突出,推理模型的价值更加凸显。

它可以作为基层医疗机构的得力助手,帮助提升诊疗效率和准确性,让每个人都能享受到高治疗医疗服务。

这也是为什么世界经济论坛,会提出80亿AI医生的愿景。

放眼未来,推理模型必将成为重塑医疗服务的核心力量。下一步,最重要就是让WiseDiag走向落地。

接下来,智诊将会打通产学研相结合的路线,不仅要与医院、保险机构合作,还要与科研院校共研项目。

另外,好伴AI将面向所有人开放,同时智诊API开放平台将交到每一份同行者手中。

让医疗资源实现真正的普惠化,才是AI医疗最具价值的意义所在。

可以期待,WiseDiag和好伴AI将赢得大众和医疗行业人士的认可,智诊的技术将点亮全社会。

ad1 webp
ad2 webp
ad1 webp
ad2 webp