基于树结构模式挖掘的Web信息抽取研究

基本信息

批准号：61005044

项目类别：青年科学基金项目

资助金额：7.00

负责人：吴共庆

学科分类：

依托单位：合肥工业大学

批准年份：2010

结题年份：2011

起止时间：2011-01-01 - 2011-12-31

项目状态：已结题

项目参与者：胡学钢,张玉红,珠杰,谢飞,李培培,李海光,刘颖,徐仁干,张靖

关键词：

变化检测知识迁移数据挖掘Web信息抽取树结构模式挖掘

结项摘要

Web数据的海量、动态、异构等特点，使得传统的信息抽取模型和算法面临精度、自动化程度、通用性和时空性能等方面的挑战。鉴于网页解析树结构模式对语言不敏感，具有易定位、可演化、可迁移的优点，本课题重点开展基于树结构模式挖掘的Web信息抽取问题研究。通过深入分析Web数据源的特点，研究适用于Web信息抽取的树结构模式表示模型。研究具有强区分定界能力的树结构模式发现问题，寻求快速有效的抽取模式树挖掘方法，并研究网页结构动态变化环境下的变化检测方法和抽取模式树知识演化机制和方法。另外，为了提高获取新的未标注Web数据源抽取模式知识的自动化程度，研究模式树知识可迁移性问题以及知识迁移机制与方法。在上述工作基础上，面向Web服务应用领域，构建基于树结构模式挖掘的Web信息抽取问题求解原型系统，以现实的中文、英文、藏文等语言的新闻网页数据、Web表格数据等为数据源，检验所提理论与方法的合理性与可行性。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：

发表时间：2021

DOI：10.3969/j.issn.1001-1978.2022.02.019

发表时间：2022

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

吴共庆的其他基金

批准号：61273297

批准年份：2012

资助金额：80.00

项目类别：面上项目

相似国自然基金

基于树结构模式Web信息抽取的关键问题研究

批准号：61273297

批准年份：2012

负责人：吴共庆

学科分类：F0605

资助金额：80.00

项目类别：面上项目

WEB文本挖掘中知识模式的抽取和评价机制

批准号：60373095

批准年份：2003

负责人：林鸿飞

学科分类：F0211

资助金额：23.00

项目类别：面上项目

基于Web的图像检索与信息挖掘研究

批准号：60675003

批准年份：2006

负责人：刘青山

学科分类：F0304

资助金额：26.00

项目类别：面上项目

Web图像视觉模式挖掘及其应用

批准号：61201446

批准年份：2012

负责人：黄俊

学科分类：F0113

资助金额：24.00

项目类别：青年科学基金项目

基于树结构模式挖掘的Web信息抽取研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

智能煤矿建设路线与工程实践

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

信息熵-保真度联合度量函数的单幅图像去雾方法

吴共庆的其他基金

基于树结构模式Web信息抽取的关键问题研究

相似国自然基金