本文以2011—2019年山东中医药大学附属医院的高血压电子病历建立数据集,用Apriori算法量化镇肝熄风汤组成中药的配伍强度,从多个维度体现配伍规律和作用机制。结果表明,K最邻近分类算法结果最优,验证了镇肝熄风汤配伍调节细胞因子、减少炎症反应和代谢紊乱的作用机制。此研究可对传统的关联规则模型进行补充,具有良好的普遍适用性和外推性,为多模态的中药数据集挖掘提供了一种跨学科研究方法。
高血压等慢性疾病每年导致全球近1000万人死亡,超过2亿人残疾,血压的异常升高导致血管受损,进而损害脑、心、肾脏等靶器官,患者常出现头痛、眩晕、心悸、乏力、水肿、夜尿增多等症状,且逐渐加重,甚至诱发中风、心肌梗死、心力衰竭和终末期肾病等高危疾病,严重降低生活质量。中医治疗强调整体观念,不仅能有效降低血压,还强调改善不适症状,副作用较少,长期服用较为安全,能够有效减少高剂量化学药物带来的副作用。此外,天然药物可显著减少患者的恐惧和抵触心理,提高依从性,其疗效已获得临床认可。
镇肝熄风汤作为经典方剂,已广泛应用于高血压的临床治疗,有丰富的长期临床数据,其组成包括牛膝、赭石、龙骨、牡蛎、龟甲、白芍、玄参、天冬、川楝子、麦芽、茵陈和甘草。根据多项临床研究和系统评价报道,在化学药物治疗的基础上联合镇肝熄风汤有助于加强降压效果,改善患者不适症状,提高患者依从性,实现降低心脏、脑、肾脏及血管并发症和死亡的总风险。中医学是以“天人合一”为导向的医学模式,要求中药处方能够兼顾患者的不适症状,并强调“君、臣、佐、使”的剂量变化,具有繁杂的配伍规则。以真实数据为基础充分进行数据挖掘,可贴合中医诊疗中的随证加减规律,充分体现诊疗中个体化和药物应用特征。
本研究基于电子病历数据建立镇肝熄风汤配伍药物加权网络,使用卷积神经网络(convolutional neural network,CNN)获取药物的配伍剂量梯度;基于生物信息数据建立蛋白质相互作用网络反映生物效应特征;使用机器学习算法搭建模型,输入镇肝熄风汤的临床与生物特征数据,挖掘其核心配伍,从多个角度讨论镇肝熄风汤在真实世界中应用规律。
1 材料和方法
1.1 数据准备
本研究数据来源于2011年7月11日至2019年10月22日山东中医药大学附属医院心内科住院和门诊电子病历,其中包括17800份高血压患者电子病历及处方(图1)。临床数据的运用获得山东中医药大学附属医院伦理委员会批准,并接受该委员会监督。纳入标准为符合原发性高血压诊断标准,年龄在18~85岁。同时排除妊娠和哺乳期妇女;合并严重心脑血管疾病、恶性肿瘤、严重造血系统、呼吸系统、消化系统和感染性疾病患者;病历资料不完整情况。数据标准化上,依据《中国药典》和美国国家医学图书馆的医学主题词(medical subject headings,MeSH)完成了中药处方和诊断的规范化,建立数据库。
图1 研究流程
1.2 镇肝熄风汤配伍药物
一是发现中药配伍规律。Apriori算法作为经典的关联规则算法常用于发现元组间的相关性,本研究用于量化真实世界处方中镇肝熄风汤组成药物的配伍强度;二是构建镇肝熄风汤处方网络。本研究以中药为实体节点,以Apriori算法获得的药物间提升度(Lift)为连接权重,建立复杂关系网络,运用快速模块性优化算法(BGLL算法),形成镇肝熄风汤组成中药的加权网络社团划分。
1.3 配伍剂量模型的建立
本研究使用CNN研究镇肝熄风汤治疗高血压的中药配伍剂量,首先建立中药矩阵,以配伍剂量作为矩阵元素,使用CNN分析矩阵后形成剂量特征模型,用于研究高血压治疗中镇肝熄风汤配伍的剂量变化特征。
1.4 生物网络的建立
一是数据收集。高血压相关基因收集自Gene Expression Omnibus(GEO)数据库内的GSE24752数据集,从中检索高血压基因表达数据,使用GEO2R工具进行在线分析,并使用公共数据库进行补充。结合前期研究确定的高血压核心症状体征,从SymMap中获取高血压症状体征的相关基因和镇肝熄风汤靶点,均使用Uniport数据库进行数据规范;二是建立网络。将高血压相关基因和中药调控靶点输入STRING平台的Homo sapiens数据库,建立蛋白质-蛋白质相互作用网络。
1.5 中药配伍的效力评价
将真实世界数据的中药配伍与高血压的关联程度进行量化,从临床相关性、生物调控程度、调节效力方面评价不同配伍在临床实际和生物过程中与高血压的密切程度,再使用机器学习模型从各个层次进行汇总分析。
1.6 通路富集分析
对机器模型筛选的有效配伍信息进行富集分析。使用层次聚类对中药和通路进行分类,用于区分其干预的生物过程。同时使用Metascape进行多基因荟萃分析。
2 结果
本研究共筛选1063名高血压患者服用镇肝熄风汤,另有1823名未服用镇肝熄风汤的患者作为对照,两组在年龄、性别、高血压等级、心血管风险等级等方面没有统计学差异。
表1 纳入患者特征
2.1 镇肝熄风汤的常用配伍
通过Apriori算法筛选镇肝熄风汤的常用配伍中药,包括桂枝、黄柏、合欢皮、郁金、天麻、延胡索、丹参、酸枣仁、川芎、青黛、乳香、没药(图2)。
图2 镇肝熄风汤配伍中药间的关联规则
2.2 镇肝熄风汤配伍的剂量特征
研究结果显示,通过建立中药配伍的剂量指数矩阵并应用CNN模型进行训练,得到了剂量特征模型。进一步的剂量梯度表明,镇肝熄风汤组成的龙骨、牡蛎、龟甲、赭石、玄参、白芍与配伍的天麻、延胡索、丹参、酸枣仁在高血压的治疗中用量均有所增加,镇肝熄风汤组成的核心中药连接紧密,且数量远多于外围中药。CNN模型筛选出的前30位最佳剂量组合(表2)表现尤为突出,表明临床诊疗更加倾向于对此进行调整,以优化疗效。
表2 CNN模型筛选的前30位最佳剂量组合
2.3 PPIN
从143组中药配伍的稳定扩散概率发现:牛膝-桂枝,川楝子-桂枝,牛膝-丹参,麦芽-黄柏组合的扩散概率最高,表明其可在高血压生物网络中发挥潜在影响。
2.4 配伍中药的有效性评价
在模型性能方面,K最邻近(K-nearest neighbor,KNN)分类算法(KNN模型)效果最佳,能够有效处理异构数据,验证了其在临床数据与微观数据融合中的可靠性。
图3 KNN、SVM、GBDT、Bayes和LR模型的ROC曲线
在有效配伍筛选方面,牛膝、酸枣仁、川芎、丹参为核心配伍药物(图4)。镇肝熄风汤的主要配伍方向包括滋阴通络、调补肝肾和清热安神。
图4 KNN模型筛选的中药配伍关系
2.5 配伍药对的疗效机制
镇肝熄风汤配伍间接或直接调控炎性因子活性,进一步抑制炎性反应,可参与细胞因子、细胞代谢、生长因子的调节,配伍规律具有生物学基础。
此外,为了验证本研究方法构建模型的效力,还使用山东中医药大学附属医院标准化电子病历中的高血压肾病数据作为外部数据开展KNN模型验证,结果进一步验证了此研究的可靠性和外推性。
3 结论
本研究利用机器学习算法进行建模,获得87个包含最佳剂量的镇肝熄风汤药对组合,验证了镇肝熄风汤配伍可以针对高血压发挥以控制炎症反映和调节能量代谢为核心多层次生物调控作用,表明KNN模型可有效融合CNN数据和网络拓扑数据,对传统的关联规则模型进行补充,且具有良好的普遍适用性,为多模态的中药数据集挖掘提供了一种跨学科研究方法,同时为临床决策提供多层次参考。
本文作者:郇家铭、陈晓晴、杨雯晴、李洁、滑振、王怡斐、李运伦
作者简介:郇家铭,山东中医药大学第一临床医学院,博士研究生,研究方向为中医药治疗心血管疾病;李运伦(通信作者),山东中医药大学第一临床医学院,山东中医药大学附属医院心病科,教授,博士生导师,研究方向为中医药治疗心血管疾病研究。
论文全文发表于《科技导报》2024年第21期,原标题为《基于机器学习模型分析镇肝熄风汤治疗高血压病的配伍特征研究》,本文有删减,欢迎订阅查看。
内容为【科技导报】公众号原创,欢迎转载
白名单回复后台「转载」
《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的成果报道、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、智库观点、科技评论、热点专题、综述、论文、学术聚焦、科学人文等。