There is a special kind of data in the prescriptions of TCM (traditional Chinese medicine), called atomic data, which is composed by several elements. The atomic data used to be ignored in the existing study on clustering of prescriptions so that there is a lack of TCM meanings of the prescriptions’ clusters. These methodological reductionism attempts explanation of entire systems in terms of their individual, constituent parts and their interactions which may unsuitable to explain the mechanism of TCM prescription system. So this research is going to study the atomic data to solve the fuzzy problem in the existing prescriptions’ clustering. The following works will be performed. (1) Study the effects of the atomic data on hierarchical clustering analysis. (2) Design a hierarchical clustering method for the information with the atomic data. (3) Evaluate the correctness of the new method on the clustering known data set by comparing consistency between the known clusters and the resulting clusters, and evaluate the practicability on the prescription data by finding the meaningful mapping between the clusters and the TCM theories at different hierarchical levels. The method proposed in this research can be used to substantiate the abstract TCM theories into herbs.
中药方剂信息中存在一种特殊的数据——由多个个体元素组成的组合信息,这类信息具有不可拆解的特征,简称“原子组合”。传统聚类分析普遍忽视原子组合,而以个体元素为离散对象进行分析,但是原子组合有一定结构,离散化操作会丢失信息量,导致聚类不能表达信息系统的整体架构。当前方剂聚类研究也存在同样问题,所得方剂簇的中医学意义不明显。为此,本课题拟研究以原子组合为最小操作单位的层次聚类问题,具体完成如下研究工作:1)探索原子组合特点及其对层次聚类的影响;2)设计一种针对具有原子组合的信息的层次聚类方法;3)在聚类已知的候选集上运行该新方法获取聚类结果,通过对比两个聚类的一致性来评估该方法的正确性;将新方法用于方剂信息的层次聚类分析中,通过在不同层次上寻找方剂簇与中医方剂理论之间的有效映射来评估该方法的实用性。本课题的结论可以将抽象的中医理论表达为实体药物关系的形式,从而方便现代科学对中医理论进行实验验证。
方剂作为中医治疗的临床药物蕴藏了大量的中医知识。在方剂组方中存在一些不可拆分的原子组合信息,这些组合会影响方剂的聚类分析。本项目探索了原子组合对聚类分析的影响以及中医方剂信息的聚类问题。.主要研究内容和相关结论如下:(1)原子组合对聚类分析的影响。原子组合作为一个新的概念,没有在过去的研究中被正式提出来,本研究通过异质网络来映射这个问题。以Karate网、Dolphin网、Polbook网和Football网四个已知聚类结果的异质网络为研究对象,把其中的异质边作为最简单的原子组合。结果表明当前聚类算法多以拓扑聚集为优化目标,当被分析信息中存在原子组合时,这些算法倾向于产生多余已知聚类数量的聚类结果。.(2)设计了针对具有原子组合信息的聚类算法TESC,并且将该算法与GN、Louvain、 Hete_SPAEM和Hetero-Attractor做比较。结果表明在上述四个网络中,本算法所获取的聚类结果更接近于已知聚类结果,并且其运行时间略高于 Louvain 算法,但低于其他三种算法。.(3)将原始数据构建成网络,原子组合相当于一些固定结构的子图,那么针对原子组合的搜索等同于同构子图的搜索。为此我们设计了一个同构子图的搜索算法 NEC-COMB,并且对比了VF2、GraphQL、Turbo_ISO和NEC-COMB四个相关算法。结果表明在不牺牲搜索精度的情况下,NEC-COMB算法在运行时间上有较大的优化。.(4)本课题采用两类方案针对方剂进行聚类分析,一类是基于NEC-COMB和TESC算法,一类是基于原子组合的重新组图的层次聚类法,通过中医理论形式化表达来匹配不同聚类层次上的中医学理论目前已经完成了中医血气理论、部分脏腑理论的匹配。构建中医脏腑理论形式化表达的知识库的科学意义和应用前景包括:(A)用于自动匹配聚类分析结果的中医学含义;(B)为其他中医理论形式化表达探索合适的信息学方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征
向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选
复杂系统科学研究进展
基于MCPF算法的列车组合定位应用研究
智能煤矿建设路线与工程实践
面向信息的组合学理论和方法
异质信息网络的聚类分析研究
面向中药产业虚拟联盟的信息资源共享问题研究
面向视觉信息内容安全的层次化结构学习方法研究