图书层次主题自动标引研究

基本信息

批准号：71303089

项目类别：青年科学基金项目

资助金额：20.00

负责人：陈静

学科分类：

依托单位：华中师范大学

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：张自然,严莉,王忠义,刘凯,宋梅青,黄梦梅

关键词：

自动标引主题结构划分主题抽取层次主题图书

结项摘要

With the rapid growth of electronic book information resources, the contradiction between coarse-granularity status of book topic indexing and fine-granularity trend of information users' needs becomes increasingly serious. Combining book topic structure partition and book hierarchy topics extraction to index book hierarchical topics(BHT) is an effective way to resolve the contradiction. On the basis of theoretical inspection and needs analysis, this project makes efforts to build an automatic indexing model for BHT and its methodologies with the help of artificial intelligence and data mining theories and methods. First, an algorithm combining machine-learning and semantic analysis for table of contents (TOC) recognizing is designed to mine characteristics and marking rules of TOC. Then, the structure of BHT is partitioned within two steps. The first step is book coarse structure partition following fuzzy retrieval model and results of TOC recognition, and the second step is that, by applying hierarchical topic model and clustering analysis, the lowest level text fragments from the former one are partitioned their hierarchical topics structure out and indexed. At last, topic extraction and indexing for book coarse structure are done with an algorithm based on probabilistic topic model. So, automatic indexing of BHT is accomplished, which will surely refine the granularity of book information research, widen the content of book information research, and promote the development of managements and applications of book information resources.

随着电子图书信息资源的迅速增长，图书主题自动标引的粗粒度现状与信息用户需求的精细化趋势之间的矛盾日趋严重，进行图书层次主题自动标引是解决这一矛盾的有效方法。本项目在理论梳理与需求分析基础上，着力于构建图书层次主题自动标引模型及其方法体系，首先，设计图书目次识别算法，该算法融合机器学习及语义分析，从图书中提取目次特征与标记规则，接着，研制图书层次主题结构划分方法，利用目次识别和模糊检索划分出图书主题粗结构，利用层次主题模型和聚类分析，对图书主题粗结构划分得到的最小逻辑单元进行层次主题结构划分及主题标引，然后，通过基于概率主题模型的主题信息抽取方法，抽出图书主题粗结构中各逻辑单元的主题信息，实现图书层次主题自动标引，以细化图书信息研究粒度，拓展图书信息组织研究内容，推进图书信息资源管理与应用发展。

项目摘要

随着电子图书信息资源的迅速增长，图书主题自动标引的粗粒度现状与信息用户需求的精细化趋势之间的矛盾日趋严重，进行图书层次主题自动标引是解决这一矛盾的有效方法。.本项目主要研究内容为：厘清图书层次主题自动标引的理论基础与应用需求；在构建图书目次识别模型的基础上，首先对基于目次的图书主题粗结构划分研究，然后进行基于层次主题模型的文本层次主题结构划分，接着，研究了图书层次主题信息抽取模型，以生成文档层次主题树。在模型研究的基础上，设计与开发图书层次主题自动标引原型系统，并通过实证对理论模型和方法进行验证与优化。.研究结果包括：探讨了图书层次主题自动标引项目研究所需的各学科基础知识及理论，, 并分析了主题挖掘的研究热点与前沿；构建了图书层次主题自动标引语料库，为图书主题研究及用户细粒度阅读研究提供语料素材；开发了中文图书目次自动解析系统CBTOC Hierarchier及图书层次主题自动分析系统THC-DAT；实证了THC-DAT系统的可行性与优越性，更从客观衡量的角度探讨了用户细粒度阅读的用户认知负荷、认知模式等，不仅从实证上解决了图书主题自动标引的粗粒度现状与信息用户需求的精细化趋势之间的矛盾，同时，为图书用户细粒度阅读和检索研究提供了新的视角——认知视角。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.13191/j.chj.2017.0028

发表时间：2016

DOI：

发表时间：2017

DOI：

发表时间：

陈静的其他基金

批准号：91437113

批准年份：2014

资助金额：103.00

项目类别：重大研究计划

批准号：11701594

批准年份：2017

资助金额：23.00

项目类别：青年科学基金项目

批准号：30971106

批准年份：2009

资助金额：8.00

项目类别：面上项目

批准号：31402000

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：81260339

批准年份：2012

资助金额：48.00

项目类别：地区科学基金项目

批准号：41862011

批准年份：2018

资助金额：38.00

项目类别：地区科学基金项目

批准号：51309045

批准年份：2013

资助金额：24.00

项目类别：青年科学基金项目

批准号：81370353

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：51803227

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：31901081

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：31900758

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：21906082

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：81860778

批准年份：2018

资助金额：34.00

项目类别：地区科学基金项目

批准号：81470313

批准年份：2014

资助金额：70.00

项目类别：面上项目

批准号：81570331

批准年份：2015

资助金额：57.00

项目类别：面上项目

批准号：41171314

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：81600579

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：61305069

批准年份：2013

资助金额：20.00

项目类别：青年科学基金项目

批准号：21071006

批准年份：2010

资助金额：35.00

项目类别：面上项目

批准号：11871206

批准年份：2018

资助金额：50.00

项目类别：面上项目

批准号：61403282

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：81400191

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：51102079

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：81700333

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：51174096

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：31800904

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：50405038

批准年份：2004

资助金额：8.00

项目类别：青年科学基金项目

批准号：40675061

批准年份：2006

资助金额：34.00

项目类别：面上项目

批准号：30270830

批准年份：2002

资助金额：7.00

项目类别：面上项目

批准号：81560485

批准年份：2015

资助金额：37.00

项目类别：地区科学基金项目

批准号：81870401

批准年份：2018

资助金额：58.00

项目类别：面上项目

批准号：31460473

批准年份：2014

资助金额：45.00

项目类别：地区科学基金项目

批准号：11501188

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：81704041

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：31901764

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：10305018

批准年份：2003

资助金额：30.00

项目类别：青年科学基金项目

批准号：71671081

批准年份：2016

资助金额：48.00

项目类别：面上项目

批准号：31101337

批准年份：2011

资助金额：18.00

项目类别：青年科学基金项目

批准号：81273935

批准年份：2012

资助金额：72.00

项目类别：面上项目

批准号：12026249

批准年份：2020

资助金额：10.00

项目类别：数学天元基金项目

批准号：81373461

批准年份：2013

资助金额：55.00

项目类别：面上项目

批准号：51202028

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：11501190

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：81200156

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：81070447

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：31100388

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：11702184

批准年份：2017

资助金额：28.00

项目类别：青年科学基金项目

批准号：81773285

批准年份：2017

资助金额：53.00

项目类别：面上项目

批准号：31802166

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：61703105

批准年份：2017

资助金额：21.00

项目类别：青年科学基金项目

批准号：91543110

批准年份：2015

资助金额：78.00

项目类别：重大研究计划

批准号：41771226

批准年份：2017

资助金额：70.00

项目类别：面上项目

批准号：61574153

批准年份：2015

资助金额：64.00

项目类别：面上项目

批准号：81301011

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：21473225

批准年份：2014

资助金额：90.00

项目类别：面上项目

批准号：11326057

批准年份：2013

资助金额：3.00

项目类别：数学天元基金项目

批准号：11526124

批准年份：2015

资助金额：3.00

项目类别：数学天元基金项目

批准号：31772492

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：40801163

批准年份：2008

资助金额：19.00

项目类别：青年科学基金项目

批准号：11126244

批准年份：2011

资助金额：3.00

项目类别：数学天元基金项目

批准号：81903091

批准年份：2019

资助金额：20.50

项目类别：青年科学基金项目

批准号：30871527

批准年份：2008

资助金额：32.00

项目类别：面上项目

批准号：81660765

批准年份：2016

资助金额：36.00

项目类别：地区科学基金项目

批准号：21705159

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：50871089

批准年份：2008

资助金额：30.00

项目类别：面上项目

批准号：31871449

批准年份：2018

资助金额：59.00

项目类别：面上项目

批准号：61674029

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：41406126

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：21705093

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：41671311

批准年份：2016

资助金额：66.00

项目类别：面上项目

批准号：41301214

批准年份：2013

资助金额：28.00

项目类别：青年科学基金项目

批准号：81102315

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：40905054

批准年份：2009

资助金额：22.00

项目类别：青年科学基金项目

批准号：40701159

批准年份：2007

资助金额：20.00

项目类别：青年科学基金项目

批准号：21103192

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

相似国自然基金

基于语义分析和统计的自动主题标引研究

批准号：60872133

批准年份：2008

负责人：吕学强

学科分类：F0113

资助金额：30.00

项目类别：面上项目

基于本体的专利自动标引研究

批准号：61271304

批准年份：2012

负责人：吕学强

学科分类：F0113

资助金额：75.00

项目类别：面上项目

基于短语信息和领域概念的主题标引关键技术研究

批准号：60603093

批准年份：2006

负责人：李素建

学科分类：F0211

资助金额：24.00

项目类别：青年科学基金项目

基于hLDA层次主题模型的中文多文档摘要研究

批准号：61202247

批准年份：2012

负责人：李蕾

学科分类：F0211

资助金额：22.00

项目类别：青年科学基金项目

图书层次主题自动标引研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

石萆汤对弱精子症患者精子线粒体膜蛋白PHB及超微结构的影响

陈静的其他基金

基于GRAPES集合预报和三维变分的青藏高原混合同化方法研究

带点电荷的Vlasov-Poisson系统的适定性及解的渐近性态研究

心功能及血流动力学的变化影响斑马鱼胚胎心脏结构形成的分子机制

日本扁蚜族系统分类与支序系统学研究（半翅目：蚜科：扁蚜亚科）

中药单体化合物柠檬苦素靶向VEGF/VEGFR2信号途径的抑癌作用研究

东昆仑东段地区那更康切尔沟独立银矿床成因机制研究

随机晃荡载荷下基于概率破损稳性的船舶压载水置换与分舱布置耦合设计

激活TRPV1调控高盐负荷下肾集合管上皮细胞钠重吸收的机制

基于主/客体聚合物刷的水凝胶宏观超分子组装新策略及智能驱动器构筑研究

浒苔多糖降解微生物的筛选及其降解机理的研究

眼球追随对早期视觉加工的强化效应：P通路机制和注意机制

Fe(VI)降解水中颗粒物表面邻苯二甲酸酯类化合物的机制及QSAR研究

基于肠道微环境探讨四君子汤通过“扶正”干预哮喘的分子机理研究

PRPS1基因突变介导儿童急性淋巴细胞白血病复发的分子机制研究

组蛋白去甲基化酶KDM3a在糖尿病心脏“代谢记忆”和损伤修复中的作用

全球多尺度三维矢量数据模型及其空间分析方法研究

Klotho在硫酸吲哚酚诱导的血管平滑肌细胞成骨转化中作用及机制研究

面向复杂数据基于流形学习的非线性降维算法研究

新型柔性、刚性咪唑类氮氧自由基分子基高维磁体的构筑和功能研究

符号图的符号圈覆盖问题研究

基于内在动机的运动平衡机器人自主认知系统研究

VEGF调控滋养血管新生参与血管炎症的机制研究

中温固体氧化物燃料电池纳米复合阴极的氧还原机理研究

曲美他嗪通过促进中性粒细胞迁移改善脓毒症心肌病的作用及机制研究

基于综合力场调控的凹凸棒石粘土的晶束解离及纳米化

疾病偏侧化以及运动症状对帕金森病人自身运动控制能力的影响

激光快速成形过程中粉末、激光束与熔化基体的相互作用

中尺度暴雨集合预报初值扰动方法研究

簇毛麦抗条锈病基因局部染色体区域高密度遗传图谱建立

聚醚类抗生素Narasin通过VEGFR2/c-MET信号途径的抑癌作用研究

GADD45β对非酒精性脂肪性肝炎的作用及机制研究

双斑长跗萤叶甲对寄主挥发物的响应机理研究

边传递图与旗传递关联几何

基于线粒体凋亡途径探讨桂枝甘草汤抗心肌细胞凋亡改善心脏功能的机制研究

低温等离子体激发的活性粒子对中华管鞭虾酶促黑变的抑制机理

低剂量注氧隔离技术氧化埋层形成机理研究

供应链的顾客退货政策研究

高产α-葡萄糖苷酶抑制剂的菌株筛选及其生物转化机理研究

基于非线性模糊综合评价模型心血管中成药临床优势评价方法

图的圈k-覆盖及偶圈分解问题研究

Kv2.1调控胰岛beta细胞凋亡机制研究及促胰岛beta细胞分泌和保护双功能高活性分子的发现

基于石墨烯的量子点发光二极管器件的研究

非对称扰动下的拟线性椭圆方程解的多重性研究

MicroRNA-17对血管损伤后内皮修复的作用及机制研究

NFATc2在缺氧下调FOXP3表达干预GVHD作用中机理研究

滇西北横断山区线蚓科寡毛类区系和物种多样性研究

蹦床运动的动力学测试与建模分析

新型脂质-多肽杂交纳米疫苗介导的多靶点可视化免疫治疗黑色素瘤研究

PRRSV通过调控miR-376-3p表达逃逸TRIM22抗病毒作用的机制研究

面向带宽重叠复用的光纤光栅传感网络非对称光谱解调研究

京津冀地区大气细颗粒物中水溶性有机物污染特征与来源解析

长江和钱塘江河口早-中全新世物源演化及其对地貌塑造的意义

0.13微米射频SOI器件的总剂量辐射效应机理研究

神经肽Humanin在脑白质损伤中的保护作用及机制

酸功能化离子液体催化聚甲氧基二甲醚合成反应体系特征及催化机制研究

置换群理论在组合结构中的应用

Choquet期望下极限定理及其收敛速度的刻画

毛管蚜亚科系统发育关系重建及其与寄主植物关系演化研究（半翅目：蚜科）

网络环境下三维城市模型数据的多尺度传输与可视化

带非线性阻尼的可压缩Euler-Poisson系统的大时间行为研究

LncRNA-LINC00221/CPSF6激活内质网应激-自噬通路在肺腺癌化疗耐药中的作用及机制研究

超表达优质亚基Bx7OE的生化遗传机理研究

基于和合思想探究调和气血法调控VEGF-Ang-Notch通路及miRNA干预COPD肺血管重构机制

DNA为配体稳定的水溶性贵金属纳米团簇的合成及其在生物成像中的应用

激光熔池同步送进混合元素粉末的合金化机理

母源因子Hwa及互作蛋白在斑马鱼体轴诱导中的分子机理

双面发射的叠层式白光量子点发光二极管器件的制备与研究

荚膜多糖黄原胶控制赤潮微藻生长的絮凝捕集与生物抑制双重作用机制研究

色谱质谱技术用于二硫化钨纳米材料的精确组成表征和尺寸筛选方法研究

微波诱导铁载凹土修复硝基苯类-砷复合污染土壤的作用机理

基于SSR 的西南地区野生菰资源遗传多样性及遗传结构分析