基于核矩阵学习的半结构化文本挖掘研究

基本信息
批准号:60642001
项目类别:专项基金项目
资助金额:7.00
负责人:杨建武
学科分类:
依托单位:北京大学
批准年份:2006
结题年份:2007
起止时间:2007-01-01 - 2007-12-31
项目状态: 已结题
项目参与者:陈晓鸥,吴於茜,万小军,路斌,黄小江,彭学政
关键词:
核矩阵XML文档文本挖掘半结构化数据
结项摘要

随着XML标准被普遍采用,以XML为代表的半结构化文档数量迅速增长。半结构化文本作为一种新的数据形式,是文本内容信息与结构信息的综合体。半结构化文本挖掘区别于传统文本挖掘的关键在于结构信息的获取与利用。结构链接向量模型(SLVM)是我们提出的一种综合考虑结构信息与内容信息的半结构化文档模型。该模型通过核矩阵描述文档结构信息,并利用核矩阵将文档结构信息与内容信息联系起来。本项目以SLVM模型为基础,

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
2

具有随机多跳时变时延的多航天器协同编队姿态一致性

具有随机多跳时变时延的多航天器协同编队姿态一致性

DOI:10.7641/CTA.2018.70969
发表时间:2018
3

基于直观图的三支概念获取及属性特征分析

基于直观图的三支概念获取及属性特征分析

DOI:10.3778/j.issn.1673-9418.2104120
发表时间:
4

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

DOI:10.11707/j.1001-7488.20210410
发表时间:2021
5

区块链技术:从数据智能到知识自动化

区块链技术:从数据智能到知识自动化

DOI:
发表时间:2017

杨建武的其他基金

相似国自然基金

1

基于深度学习和迁移学习的非结构化临床文本挖掘的方法探索

批准号:81771937
批准年份:2017
负责人:雷健波
学科分类:H2806
资助金额:60.00
项目类别:面上项目
2

基于吸引子传播的半监督文本挖掘方法研究

批准号:61103092
批准年份:2011
负责人:管仁初
学科分类:F0607
资助金额:21.00
项目类别:青年科学基金项目
3

基于半监督学习和集成学习的文本分类方法研究

批准号:61073133
批准年份:2010
负责人:鲁明羽
学科分类:F0607
资助金额:32.00
项目类别:面上项目
4

自然语言处理中基于矩阵的结构化学习研究

批准号:61402175
批准年份:2014
负责人:吴苑斌
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目