With the development of biomedical science, a large amount of scientific documents has been accumulated in this field. Tacit knowledge entities refer to certain terms or concepts appearing in scientific documents(i.e. drug). They represent the knowledge hidden in these documents, so the study of association between these entities is of significant importance to scientific research. However, a vast body of knowledge about entity relationships is buried in the flood of documents. An effective knowledge discovery approach is therefore needed to present this kind of knowledge to researchers in a more rapid way. In view of this, our research plans to carry out drug entities association knowledge discovery based on co-occurrence network from multidimensional perspective: first, we will construct drug-drug co-occurrence network as well as author-drug entity bipartite network based on co-occurrence relationship; second, complex network analysis and link prediction will be used to dig up the drug association; At last, empirical study and medical experiment will be made to prove the scientific and validity of the knowledge discovery process and result. This research will expand the boundaries of co-occurrence theories, and make them applicable to the rapid and effective discovering of tacit knowledge, thereby accelerating the hypothesis generation and science progress.
随着生物医学的不断演进,该领域积累了大量的文献数据。隐性知识实体是指科研文献中出现的专指某种事物的术语或概念(如药物实体),它代表文献的内含知识,了解其相互关系对于科学研究意义重大。然此类知识被大量淹没于文献海洋,亟需一种有效知识发现方式将之快速地展现给科研人员。鉴于此,本研究拟针对生物医学科技文献中的药物实体单元,采用共现分析的思想进行知识发现流程的构建,并将多维的视角贯穿于其中:首先,基于共现关系构建药物实体共现网络以及作者-药物实体二分网络;其次,利用复杂网络分析和链路预测实现对药物关系的多维挖掘;最后利用实证分析和医学实验对药物关系知识发现过程与结果的科学性和有效性进行解释和评估。本研究扩展了共现分析理论的应用,使之适用于文献中隐含知识的快速有效挖掘,促进科学假说的生成,加快科学研究的进程。
生物医学领域的科研文献大量积累,为辅助疾病的预防治疗、推进药物研发提供了强大的数据支持。科研文献中实体代表着科学知识单元,其类型包括以关键词和主题词为代表的显性知识实体以及以概念术语、研究规律为代表的隐性知识实体。科学计量学中的共现理论常被用来抽取实体关联,这有助于揭示文献中的内含知识,建立生物医学假说,引导并实现知识发现的预期目标。本项目开展了四个方面的研究,以期能够挖掘科学文献中潜在的知识价值,最终促进知识发现。①基于科研文献的隐性知识实体评价研究;②基于复杂网络的文献实体单元共现网络的知识挖掘研究;考虑到大量生物医学知识以非结构化数据的形式隐藏在非科研文献中,本项目在执行后期结合社交媒体数据和生物信息学数据等新型数据源,开展生物医学知识发现研究:③基于链路预测方法的实体单元共现网络的知识挖掘研究;④结合基因组学数据等多源学术数据,对知识发现的过程和结果的科学性和有效性进行评价和评估。在课题的研究期间,在CSSCI以及北大核心等收录的期刊上发表发表学术论文9篇,发表会议论文2篇,获得省部级科研奖励1项,申请专利2项,参与2项大会报告,主持获批省部级项目2项,培养硕士生2名,邀请北京联合大学副教授房小可老师进行学术交流。本研究通过对生物医学相关文献中的实体单元及其关系进行快速、有效挖掘,对生物医学知识发现规律进行深入探索,拓展了科学计量学的应用范围,促进科学假说的生成,加快科学研究的进程。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
城市轨道交通车站火灾情况下客流疏散能力评价
基于细粒度词表示的命名实体识别研究
基于FTA-BN模型的页岩气井口装置失效概率分析
基于GIS的青藏高原科研文献知识发现研究
基于生物医学文献的隐含知识发现方法研究
面向甲骨学知识图谱的实体发现及语义关系挖掘研究
开放获取生物医学文献的实体关系抽取