There is complex terrain, various soil and climate in Yunnan Province. The rich resources of the species are produced by the unique natural condition. The spermatophyte endemic genus resource is the most quantity of China. It is essential to protect and use Yunnan spermatophyte endemic genus resource reasonably. According to Yunnan spermatophyte endemic genus resource various data formats, deficient integration, low efficiency intelligent retrieval, lacking of individualized information service mode and more problems, This project is applied by integrated area terminology automatical extraction technical, geo-ontology theory and ontology mapping technical to build Yunnan spermatophyte endemic genus ontology library. The project also did research and explore in Yunnan spermatophyte endemic genus area terminology information retrieval model, retrieval methods, retrieval system framework design and more contents using Bayesian network information retrieval model, space information mining technical, Internet search mining algorithm technical and more technicals, Finally to build Yunnan spermatophyte endemic genus area terminology information retrieval system. The application of the project is the solution of Yunnan spermatophyte endemic genus resource using technical barrier, it provides theory support for Yunnan spermatophyte endemic genus macro level research and provides a new method for other agriculture area terminology information retrieval.
云南省地形复杂,土壤和气候类型多样,独特的生态条件孕育了丰富的物种资源,其中种子植物特有属的丰富度位居全国之首,科学合理地保护和利用云南种子植物特有属资源,对保持我国生物多样性具有重要意义。本项目将围绕目前云南种子植物特有属信息资源数据格式多样、集成整合不足、检索效率低下等问题,综合运用领域术语自动提取、地理本体、本体映射等理论和技术,构建云南种子植物特有属本体库;并在此基础上,利用贝叶斯网络信息检索模型、空间信息挖掘技术、互联网搜索挖掘算法等技术和方法,对面向云南种子植物特有属领域的语义信息检索模型、检索方式、检索系统框架结构等方面进行深入研究和探索,为最终建立云南种子植物特有属语义信息检索系统奠定技术基础。本项目的实施可有效地解决云南种子植物特有属数字资源利用的技术障碍,为云南省种子植物特有属的宏观深层次研究,提供新的技术支持和理论依据;为相关领域语义信息检索提供一种新方法和思路。
本项目选取云南种子植物特有属为研究对象,以构建云南种子植物特有属领域语义信息检索系统为目标;利用领域术语自动识别技术、本体技术、语义信息检索技术等相关理论和技术,构建了云南种子植物特有属的语料库、本体库和语义信息检索模型,以及云南种子植物特有属领域语义信息检索系统。主要研究内容和创新点包括:. (1)提出了一种基于互信息和条件随机场的领域术语自动识别方法。该方法将基于统计和机器学习的两类术语识别方法结合在一起,解决了单纯利用统计方法进行术语识别时的数据稀疏问题;同时,由于仅采用了3个最为普通的词特征,作为条件随机场算法的训练特征,使该方法具有较好的领域通用性,并且降低了条件随机场的运算量,减少了条件随机场的训练时间。. (2)构建了云南种子植物特有属本体库。选取了《中国植物志》、《中国种子植物特有属》、《云南植物志》、《云南植被》、《云南植物研究》等文献作为云南种子植物特有属语料库原始语料,构建了云南种子植物特有属语料库;并利用本课题所提出的领域术语自动识别方法,针对125种云南种子植物特有属的相关叙述进行识别,提取出云南种子植物特有属领域术语。利用这些术语,依据植物外形特征的描写,采用七步法构建了云南种子植物特有属领域本体库。. (3)提出了云南种子植物特有属领域语义信息检索模型,构建了云南种子植物特有属语义信息检索系统。引入统计语言模型思想,将语义相关度扩展和领域术语权重相结合,构建了适用于竹籐的领域语义信息检索模型,实现了云南种子植物特有属领域文本信息的关联检索和语义查询扩展,构建了云南种子植物特有属语义信息检索系统。. 本项目解决了云南种子植物特有属数字资源利用的技术障碍,提高了云南种子植物特有属语义信息鉴别效果,为云南省种子植物特有属的宏观深层次研究,提供新的技术支持和理论依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
肉苁蓉种子质量评价及药材初加工研究
黑河上游森林生态系统植物水分来源
中国种子植物特有属的研究
面向特定领域基于Ontology的跨语言信息检索技术研究
云南苏铁属特有植物的保护生物学研究
面向关联数据的信息检索关键技术研究