随着数据库和人工智能技术的不断应用和发展,数据挖掘(DataMining,DM)作为一门新兴的多学科交叉的科学技术随之应运而生。数据挖掘是从大量数据中提取出可靠的、有效的且最终被人理解的信息模式处理过程,具有分类、聚类、关联、回归、序列分析等功能。采用数据挖掘技术对中医药学中的相关数据进行整理、提取和挖掘。可以更好地获取其中隐藏的知识精华,有助于加速中医药学的前进步伐,提高中医药学的学术水平。
[1]陈小丽,许光兰,赵媚,王光耀,吴红英,陈青蓝,明春玉.基于数据挖掘的古代治疗肺痨的用药规律研究[J/OL].世界科学技术-中医药现代化:1-10[-11-19].
研究背景:耐药结核的出现对患者的生存和公共健康构成重大挑战,为肺结核的治疗带来诸多的困难。目前数据挖掘技术越来越成熟,能够从海量数据中发掘其规律性,并通过一定的技术手段处理之后,找出共性规律与差异性,为指导临床中医药的辩证实施治疗提供理论依据。
数据来源:以“肺痨”、“骨蒸”、“痨瘵”、“伏连”、“劳嗽(痨嗽)”、“肺痿”、“传尸”、“尸注”、“*疰”等为关键词,检索《中华医典》所有与肺痨相关的医案。
数据处理方法:首先根据纳入标准和排除标准筛选,最终纳入首肺痨治疗处方,涉及中药味。以《临床中药学》和《中药大辞典》为标准,对中药名进行规范。通过Excel建立肺痨处方数据库,并完成交叉核对。统计药物种类及每味药的使用频数,得到频次≥50的高频药物,并对高频药物进行药效分类。借助SPSSStatistics中Ward联结聚类算法并结合相关中医理论对高频药物进行聚类分析,利用主成分分析法对高频药物进行因子分析。通过Apriori算法对高频药物进行关联规则分析,设置最低条件支持度≥8%,最小规则置信度≥72%,提升度>1,最后将古代医家治疗肺痨药物关联规则可视化。
研究结论:治疗肺痨处方中,多以补虚培元为原则,以活血祛瘀、滋阴降火、清热豁痰、健脾利湿为治法,同时药物选择常以补虚药为主,并辅予清热药、化痰止咳平喘药及解表药。
与同类研究相比的优缺点:通过对高频药物的关联分析,在统计过程中发现其统计结果对于方剂的加减使用有较好的临床意义。但是缺少对药物药性以及归经的分析,所以在治疗肺痨的用药方选择面存在局限。
阅读参考价值:由于肺痨在古代文献中没有直接相应的病名,文献纳入首医案处方,系统挖掘了古代医家治疗肺痨的用药规律,为类似研究提供了有力参考。
[2]杨福双,高法,谭田慧,徐炎,曹方,王中天,孙丽平.基于数据挖掘的中医药治疗小儿肺炎组方用药规律研究[J].中国中药杂志,,45(08):-.
[3]高婷,苗晋鑫,康乐,苗明三.基于数据挖掘的中医药治疗间质性肺炎用药规律分析[J].中药药理与临床,,36(04)-11.
[4]*威,饶艳玲,孙勤国,李成银,巴元明.基于数据挖掘探讨例新冠肺炎的中医用药规律[J].海南医学院学报,,26(12):-+.
[5]SuxianZhang;HaoWu;JieLiu.MedicationregularityofpulmonaryfibrosistreatmentbycontemporarytraditionalChinesemedicineexpertsbasedondatamining[J].JournalofThoracicDisease,,10(3).
研究背景:肺炎是累及支气管壁和肺泡的炎症,是儿童时期最常见的一种呼吸系统疾病。间质性肺炎分为继发性和原发性,发病原因不清,研究发现主要是由于肺泡上皮受到损伤直接造成肺部组织的纤维化。其高发病率、病死率及医疗费用,严重增加了社会负担。长期以来,中医药在治疗肺炎与间质性肺炎中发挥着特有的优势与特色。在本次疫情中,临床中使用的治疗药物与方法大多源于治疗SARS、MERS等经验,尚未发现特效的治疗药物与治疗方案,中医药在治疗瘟疫方面具有悠久的历史,对例新冠肺炎的中医用药规律进行总结及分析,希冀为新冠肺炎的预防治疗起一定的指导作用。
数据来源:文献[2]在CNKI,使用专业检索,输入检索表达式为SU=“小儿肺炎”“儿童肺炎”“肺炎喘嗽”AND“中医”“中药”“中医药”,发表时间选择—年,检索到相关文献篇。文献[3]以CNKI为数据来源,检索全文含有“间质性肺炎+中药”,日期在年—年的期刊。文献[4]的数据医院年1月27日—年2月25日确诊为COVID-19的且服用过中草药的出院患者的中草药处方个。文献[5]数据来源于根据关键词:肺纤维化、间质性肺纤维化、间质性肺病、间质性肺炎、药物治疗、中药、传统中药和替代中药,检索PubMed,EMBASE,SinoMed、万方、CNKI和VIP,时间设为从成立到年3月10日,手工检索各种中医核心期刊,获得相关文献篇。
数据处理方法:首先根据纳入和排除标准对检索结果进行筛选,文献[2]得到篇文献,首方剂,文献[3]得到96首方剂,文献[5]获得了获得篇文献,例病例,涉及60名医生,次治疗记录。文献[2][4]参照《中药学》对药物名称的进行规范,文献[2]将方剂录入中医传承辅助系统。通过中医传承辅助系统中“统计报表”模块中“基本信息统计”功能,对用药频次、四气五味及归经进行数据挖掘,得到频次≥70的中药。运用“数据分析”模块中复杂系统熵聚类和无监督熵层次聚类功能对组方规律进行分析并挖掘新方。文献[3]将方剂输入Excel表,建立数据库,归纳筛选方剂中的中药,并统计各味中药出现频数。参照《中药学》分类标准,对频数≥18的21味中药进行分类归纳。依据《中国药典》年版分类标准,对高频中药的性、味、归经进行统计分析。使用Clementine统计软件对高频药物进行关联规则分析,使用Apriori算法挖掘不同中药之间的配伍关系,设置支持度为10%,置信度为85%,最大前项数为5,提升≥1等条件挖掘出常用方剂中的潜在药物组合,将高频药物的关联网络化展示,最后利用Ward聚类分析法将高频药物分为6类。文献[4]将药名输入Excel软件建立数据库并批量导入古今医案云平台,运用古今医案云平台建立数据库,将医案资料标准化并加入分析池。对药物的频次、药性、药味、药效以及归经进行频次统计分析。对新冠肺炎出院患者例的处方中前15味药物进行聚类分析,以分组距离>为界,得到治疗新冠肺炎的常用中药4类。设置信度≥0.28,支持度≥0.2进行关联规则分析,将边权重设为>80,进行复杂网络分析提取治疗新冠肺炎处方中核心药物组合,绘制核心药物组合网络图。文献[5]提取入选病例中包含的中医专家、人口学特种、症状、和使用的中药并录入Eccel中建立数据库,对数据库进行编码使不同数据之间形成关联。对中药名进行规范,根据年版《中华人民共和国药典》将各种药的药性、味、归经、功效记录并数字化。对于药味、归经、功效,如果某一药物的描述与某一种药物关联则记为1,否则为0。借助Stata软件对中药的种类进行频数分析,对使用频次≥30的药物根据其药性、味、归经,采用Ward法进行聚类分析。借助SASEnterpriseMiner软件进行关联规则分析,设置最小支持度10%,最小置信度50%,最小提升度1,提取药物组方。通过复杂网络分析提取核心药物并得到新处方。
研究结论:文献[2]发现治疗小儿肺炎组方以治痰、热为主,治肺为关键,兼顾脾胃;以清热化痰,止咳平喘,解表散寒,止咳化痰为主要治法,并根据疾病的变证,随证治之。文献[3]发现治疗间质性肺炎多以补虚药,化痰止咳平喘药、活血化瘀药等配伍使用,多选用入肺经的药物。文献[4]得出新冠肺炎的主要病理特点为湿邪,湿*壅肺为核心病机,临床患病多以中老人为主,发病时多为干咳、纳差、乏力等表现,多选用辛甘、温性及归肺脾经的中药,治疗以清热解*、祛湿化痰为主,以清肺排*汤为临床常见方。文献[5]分析总结出中医治疗肺纤维化以补肺、健脾、益肾为主,以活血化瘀、化痰清热为主,得到由以*芪、*参、麦冬、五味子、地龙、丹参、当归、浙贝母、半夏、桃仁、苦杏仁、紫菀、甘草为核心药物组成的治疗肺纤维化的新处方。
与同类研究相比的优缺点:文献[2]通过无监督的熵层次聚类算法得到的新方对于治疗小儿肺炎具有一定的参考价值。文献[3]利用统计学方法对方剂中治疗间质性肺炎的中药进行分析,统计其配伍规律,为中药的合理配伍提供了理论依据。文献[4]以实际病例为数据基础,对数据实现了多方位、多平面的关联与融合。文献[5]得到治疗肺纤维化的新方,为治疗肺纤维化、间质性肺炎以及新冠肺炎提供了参考。但文献[2][3]仍需进一步的临床研究及试验研究给予验证。文献[4][5]不足之处均为,样本量不大,并且通过其得出的新方缺乏临床的实际应用。
阅读参考价值:文献[2]借助中医传承辅助系统为中医临床数据挖掘和总结名医经验提供了科学有效的方法。文献[3][5]发现潜在的配伍药对,药物的组合规律,为临床合理用药提供理论依据。文献[4]医院新型冠状病*肺炎患者的中医用药规律,总结疾病特点和临床治疗思路,对中医治疗本病有所借鉴。
[6]陈丰,陈绍红,柳海艳,修琳琳,许皖,高洁,吕艳敏,王鑫,葛超冉,钟赣生.基于数据挖掘的中医药治疗酒精性肝病组方用药规律分析[J].中草药,,51(12):-.
研究背景:随着生活水平提高和饮食习惯的改变,饮酒导致的酒精性肝损伤疾病发病率逐年上升。传统中医学未见有对酒精性肝病的直接论述,但其病因病机以及临床症状与“酒病”、“伤酒”、“酒癖”、“酒疸”、“酒积”等病的描述类似。近年来,随着中医药治疗酒精性肝病的临床与实验研究不断深入,发现中医药治疗酒精性肝病前景广阔,不仅从治疗疾病本身出发,同时还兼顾患者的生活质量,疗效佳且不良反应少。
数据来源:在CNKI、万方数据库、VIP中选择高级检索,检索词为“酒精性肝病”或“酒精性肝损伤”或“ALD”和“中医”或“中药”或“中医药”或“中西医结合”或“草药”或“汤药”或“方剂”或“复方”。检索项选择“主题”,年限为建库至年6月21日,检索到文献条。
数据处理方法:根据纳入标准和排除标准对检索到的文献进行筛选,获得篇文献,首方剂。将方剂信息录入中医传承辅助系统。首先进行药物的频次分析,得到使用频次≥10的中药。根据《中药学》将高频药物分为9类。对高频药物进行关联规则分析,支持度个数设置为21,置信度设置为0.7,得到常用药物组合和方剂内部中药间关联规则,并将药物之间的关联进行网络展示。对首中药方剂进行聚类分析,设置相关度为7,惩罚度为2进行运算。应用复杂系统化熵聚类的核心组合分析,演化出3味药的核心组合,利用无监督的熵层次聚类算法提取用于新方聚类的核心组合,进一步聚类得到7个新处方,并进行网络展示。
研究结论:中医药治疗酒精性肝病以活血化瘀、化湿、补益、解酒*、行气为主,且始终以“顾护脾胃功能”为宗旨,符合中医药治疗酒精性肝病的理论基础。
与同类研究相比的优缺点:本研究运用中医传承辅助平台总结口服中药治疗酒精性肝病的用药规律,并根据方剂数据集使用数据挖掘算法生成新方。但新处方不能直接应用到临床治疗,必需与中医药理论及临床实践相结合作进一步评判。
阅读参考价值:中医传承辅助平台软件将一般统计法、文本挖掘、关联规则、复杂系统熵方法等挖掘分析方法加以集成,为名老中医经验总结、医案整理和分析、疾病用药防治规律分析、中药应用规律、新药研发及处方筛选等方面提供了便利有效的工具。
[7]章春生,刘锌,杜斌,孙光权,何兵,彭晨健,吕排云.基于数据挖掘的中医药治疗糖皮质激素相关型股骨头坏死用药规律分析[J].辽宁中医杂志,,47(08):29-34.
研究背景:糖皮质激素相关型股骨头坏死(GA-ONFH)是一种骨科常见的顽疾,GA-ONFH占股骨头坏死的比例超过50%,我国每年新发的GA-ONFH的数量近10万,以青年多见,预后差,致残率高。目前人们已经认识到糖皮质激素与股骨头坏死之间的关系,并为其发病机制提出了多种学说。中医药治疗GA-ONFH在临床上被证实确实有效。
数据来源:对PubMed、EMbase、theCochraneLibrary、CBM、CNKI、万方、维普中年1月—年8月发表的关于中医药治疗GA-ONFH的相关文献进行交叉检索,共检索出文献篇。
数据处理方法:根据纳入标准和排除标准对文献进行筛选,最终纳入53篇文献,包括70首方剂。利用Excel建立数据库,对70首方剂的中医证型、证候要素、药物类别、频次≥6的药物的性、味、归经进行频数频率统计分析。使用SPSSClementine软件,采用Apriori算法进行关联规则分析,最低条件支持度为15%,最小规则置信度为80%,最大前项数从1逐渐增加至5,直至不再产生新的频繁项集,得到中药药对关联规则和三味药药组关联规则条。基于SPSS软件,以频次≥6的高频药物性味归经为基础,采用系统聚类法二分类变量资料的Ochiai算法,生成聚类树状图,对频次≥20的高频中药采用主成分分析法,进行方差最大化旋转因子分析。
研究结论:GA-ONFH的治疗多以温肾助阳、活血化瘀、健脾化湿为主要治法,反应出补肾、活血对于GA-ONFH的治疗具有突出意义。
与同类研究相比的优缺点:统计分析中医药治疗GA-ONFH的处方用药规律,为中医药治疗GA-ONFH的临床应用提供依据和借鉴。但是缺少对于GA-ONFH的分期论治研究,且所得结论仍需要临床检验。
阅读参考价值:基于研究结果,GA-ONFH的中医证型分布被重新排列。这对GA-ONFH的诊断、辨证和治疗具有重要意义,尤其是重视虚证的存在,虚实夹杂为其根本病机,减少临床上治标不治本的发生,从而避免疾病反复。
[8]张婧,李璇,刘明,孙庆,王玉涛.基于数据挖掘的中医药治疗血栓闭塞性脉管炎的用药规律研究[J].中国中西医结合外科杂志,,26(05):-.
研究背景:现代医学对血栓闭塞性脉管炎TAO发病原因及机制的阐述尚未明确,一旦患病,前期患者会出现指(趾)节麻木、苍白、怕冷,间歇性跛行,后期出现坏疽,甚至指(趾)节脱落,给患者带来极大的痛苦。中医药在治疗TAO方面有明显优势,诸多医家通过辨证论治治疗TAO,但处方灵活多变,缺少总结分析研究,难以把握其药物之间的关联。
数据来源:在CNKI数据库以模糊关键词:“血栓闭塞性脉管炎”、“脱疽”、“脉管炎”、“伯格病”检索,文献发表时间设置为年1月—年10月。结合手工筛选,筛选出符合条件的文献篇。
数据处理方法:首先根据纳入标准和排除标准筛选出符合条件的方剂首。根据《中国药典》统一中药名称,将方剂中药组方录入中医传承辅助平台。通过平台中“数据分析”模块里的“方剂分析”功能,再利用系统“数据查询”功能,对录入的证型、方剂中药物出现的频次、性味归经进行统计分析。在辅助平台的“组方规律”版块,将支持度个数设置为、置信度为0.9,进行药物关联规则分析。在平台的“新方分析”模块,设置相关度为8、惩罚度为2、结果为4,通过无监督熵层次聚类算法聚类分析得到药物核心组合和治疗TAO的新方组合,并将新方组合进行网络展示。
研究结论:在治疗TAO时用药以“活血化瘀”为基本治则,辅以清热、补虚、温通、息风止痉、止痛、托*生肌、燥湿、通络等中药,治疗可从肝、心、脾三脏入手,分清寒、热,用药时标本兼顾,打破仅“祛瘀”的固定思维,辨证与辨病结合,辅以补肝肾、补气血、祛湿热、温阳散寒等治法。
与同类研究相比的优缺点:借助中医传承辅助平台软件研究用药规律,推动中药治疗疾病的新方研究。不足之处在于,由于部分医家开展临床试验时常根据TAO发展阶段的不同或者症状差异等在基础方上临证加减中药,采用一方共用法治疗TAO,导致缺乏证型统计,只能对这部分的统计按“未分证型”录入。
阅读参考价值:TAO在发病过程中病理变化曲折多变,治则治法有较大差异,运用中医传承辅助平台系统可以充分挖掘中医药治疗TAO的用药规律,提供临床应用依据。
[9]彭卓嵛,陶丽芬,蓝斯莹,蔡林坤,李桂贤.基于数据挖掘对溃疡性结肠炎中医用药规律的分析[J/OL].世界科学技术-中医药现代化:1-7[-11-19].
研究背景:溃疡性结肠炎(ulcerativecolitis,UC)是一种病因未明的慢性肠道炎性疾病,目前西药常规治疗UC的有效性和安全性未取得让人满意的结果,尤其是在临床缓解维持和内镜缓解方面的证据相对不足。中医药在治UC上显示出其标本兼治、副作用小、可长期用药、远期疗效可观等特有优势,但各医家观念不一、治疗方法繁杂,用药差异性大且缺乏大样本的临床研究。
数据来源:检索数据库为中国期刊全文数据库、万数据库、维普中文科技期刊数据库、博硕士学位论文数据库、Pubmed,时间限定在9年1月—年5月,采用数据库高级检索,检索词包括:溃疡性结肠炎、中医、中药、中医药。检索到篇文献。
数据处理方法:首先根据纳入标准和排除标准对文章进行筛选,得到篇文献。参照《中医诊断学》和《中医证候鉴别诊断学》对中医证候进行规范整理,一方治疗多证者经规范证型后保留其所有证型,两书中未见有相对应证型者保留其原有证型。中药名及性味、归经、归类的规范则参照《中华人民共和国药典》和《中药学》进行标准化处理,统计性味、归经时以每一性味、经别出现1次为1个统计单位,凡一药归数性味、数经别者分别统计之。应用Excel表格依据方名、证型、药名、功效、性味、归经建立数据库。运用SPSS对高频中药进行聚类分析。运用Modeler软件将味药物通过Apriori算法进行关联规则分析,设定最低条件支持度14%,最小规则置信度90%,最大前项数4,且提升度≥1,挖掘药物关联规则。
研究结论:UC证型分布以大肠湿热证、脾肾阳虚证、肝郁脾虚证、脾虚湿困证、脾气虚证、寒热错杂证为主。核心用药多味苦、甘,入脾胃经,功效上以补虚、清热、理气、收涩、渗湿、温里药为主。组方多为四君子汤、参苓白术散等经典方加减而成,药物配伍上体现了从脾论治的治疗思想,清热除湿、调气理血并重,后期注重补火助阳,多药相合,多法并用以标本兼治。
与同类研究相比的优缺点:在宏观层次上分析了中医药治疗UC的配伍特点,对完善该病的中医辨证论治具有一定借鉴意义,挖掘出的部分强关联药对及潜在方剂组合可为临床中医药治疗该病提供一些借鉴。但数据挖掘整体上纳入文献的标本量较小,缺乏大样本、多中心研究,纳入文献质量仍有待进一步提高,可能存在一定局限性,且此次挖掘出的潜在方剂组合还需临床实践进一步验证。
阅读参考价值:通过数据挖掘技术中的频数统计、聚类分析、关联规则等方法,较全面的对近十年中医治疗UC的用药规律进行了初步的探索研究,为国内对本病的辨证治疗提供参考。
[10]段锦龙,姚魁武,于宙,刘友明,张铌雪.基于数据挖掘分析中药治疗室性早搏的组方规律及潜在作用机制[J].世界中西医结合杂志,,15(08):-+.
研究背景:室性早搏(Ventricularprematurebeat,VPB)是指窦性激动尚未到达,而心室中某一起搏点提前发生激动,导致心室发生除极,是常见的心律失常之一。患者常表现为心慌、胸闷等不适症状,严重者可影响血流动力学,甚至引起室速、室颤,危及生命。西医所使用抗心律失常药物,因其有严重的致心律失常作用和增加死亡率的风险,存在较大局限。中医药治疗室性早搏,因其疗效显著,不良反应小而逐步受到重视。但对于用药规律及作用机制目前缺少深入的研究。
数据来源:以“室性早搏”作为关键词,文献的发表时间设置为7年—年在CNKI进行高级检索到相关文献条。
数据处理方法:首先根据纳入标准和排除标准对文献进行筛选得到首方剂,味中药。参照《中药学》及年版《中国药典》对所录入中药的名称进行统一规范。将筛选后的基础处方录入到中医传承辅助平台。进入传承辅助平台的“数据分析”模块,对录入的首方剂进行药物频次,得到高频药物;将支持度个数设置为32,置信度设置为0.90,点击“用药模式”,进行组方规律分析并进行网络展示,得到常用药物组合。将甘草、麦冬、桂枝核心中药配伍录入到中药作用机制在线分析软件BATMAN-TCM,分析甘草、麦冬、桂枝核心中药配伍疾病富集和甘草、麦冬、桂枝核心中药配伍潜在作用信号通路。
研究结论:草、麦冬、桂枝3味中药为治疗室性早搏的核心中药配伍,其干预室性早搏的潜在靶标为CaMKII信号通路,为中医药治疗室性早搏的临床用药和分析其潜在作用机制提供参考。
与同类研究相比的优缺点:对室性早搏用药规律及潜在作用通路进行了分析,为中医药治疗室性早搏的临床用药和分析其潜在作用机制提供参考。但是文献仅对中医药治疗室性早搏的潜在作用通路进行了分析,未能详细阐述药物作用于该通路的具体蛋白。
阅读参考价值:中医药通过“多组分、多靶点、多通路”来发挥它的治疗作用,但由于中药复方成分复杂,具体作用机制并不明确,影响其临床应用,因此研究中医药的潜在作用通路,对于揭示中医药的分子作用机制非常重要。
[11]徐畅,石岩,杨宇峰.基于数据挖掘分析中医药治疗糖尿病腹泻用药规律[J].辽宁中医药大学学报,,22(11):96-99.
研究背景:糖尿病腹泻是糖尿病常见的慢性并发症之一,是糖尿病自主神经病变影响消化系统的表现,给患者造成极大的痛苦,严重影响着患者的生活质量。此病现有西医治疗效果不佳,中医药治疗颇见成效并受到医学界的广泛