基于树结构模式挖掘的Web信息抽取研究

基本信息
批准号:61005044
项目类别:青年科学基金项目
资助金额:7.00
负责人:吴共庆
学科分类:
依托单位:合肥工业大学
批准年份:2010
结题年份:2011
起止时间:2011-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:胡学钢,张玉红,珠杰,谢飞,李培培,李海光,刘颖,徐仁干,张靖
关键词:
变化检测知识迁移数据挖掘Web信息抽取树结构模式挖掘
结项摘要

Web数据的海量、动态、异构等特点,使得传统的信息抽取模型和算法面临精度、自动化程度、通用性和时空性能等方面的挑战。鉴于网页解析树结构模式对语言不敏感,具有易定位、可演化、可迁移的优点,本课题重点开展基于树结构模式挖掘的Web信息抽取问题研究。通过深入分析Web数据源的特点,研究适用于Web信息抽取的树结构模式表示模型。研究具有强区分定界能力的树结构模式发现问题,寻求快速有效的抽取模式树挖掘方法,并研究网页结构动态变化环境下的变化检测方法和抽取模式树知识演化机制和方法。另外,为了提高获取新的未标注Web数据源抽取模式知识的自动化程度,研究模式树知识可迁移性问题以及知识迁移机制与方法。在上述工作基础上,面向Web服务应用领域,构建基于树结构模式挖掘的Web信息抽取问题求解原型系统,以现实的中文、英文、藏文等语言的新闻网页数据、Web表格数据等为数据源,检验所提理论与方法的合理性与可行性。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
5

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017

吴共庆的其他基金

批准号:61273297
批准年份:2012
资助金额:80.00
项目类别:面上项目

相似国自然基金

1

基于树结构模式Web信息抽取的关键问题研究

批准号:61273297
批准年份:2012
负责人:吴共庆
学科分类:F0605
资助金额:80.00
项目类别:面上项目
2

WEB文本挖掘中知识模式的抽取和评价机制

批准号:60373095
批准年份:2003
负责人:林鸿飞
学科分类:F0211
资助金额:23.00
项目类别:面上项目
3

基于Web的图像检索与信息挖掘研究

批准号:60675003
批准年份:2006
负责人:刘青山
学科分类:F0304
资助金额:26.00
项目类别:面上项目
4

Web图像视觉模式挖掘及其应用

批准号:61201446
批准年份:2012
负责人:黄俊
学科分类:F0113
资助金额:24.00
项目类别:青年科学基金项目