基于增量学习的主题爬虫关键技术研究

基本信息
批准号:60603066
项目类别:青年科学基金项目
资助金额:26.00
负责人:叶允明
学科分类:
依托单位:哈尔滨工业大学
批准年份:2006
结题年份:2009
起止时间:2007-01-01 - 2009-12-31
项目状态: 已结题
项目参与者:吴国宝,黄虎杰,张宏国,孙成柱,陈小军,王颜新,国宏志,许晓光
关键词:
超链接分析Web挖掘主题爬虫Web搜索
结项摘要

主题爬虫是一种重要的Web资源发现和信息检索方法,有着重要的理论研究价值和应用前景。本课题是针对现有主题爬虫缺乏有效的知识积累和增量学习机制问题提出的,将重点研究基于可靠增量学习机制的主题爬虫模型,以及该模型中的一些关键算法,主要包括:研究基于自动特征加权的超文本聚类算法和超链接结构模式发现算法,来实现对爬行结果的精确挖掘,并生成高可靠爬行知识,从而实现了主题爬虫的知识积累机制;同时还研究能从爬行知识库中增量学习的页面相关度评价算法和超链接评价算法,使主题爬虫实现高可靠增量学习的目标,从而可以不断优化其爬行策略,最终从根本上提高主题爬虫系统的性能。本课题的主要创新之处在于:提出了基于爬行知识库的主题爬虫模型,以及基于爬行知识库的增量式页面相关度评价算法和超链接评价算法。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

叶允明的其他基金

批准号:61272538
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:U1836107
批准年份:2018
资助金额:66.00
项目类别:联合基金项目
批准号:61073195
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:61572158
批准年份:2015
资助金额:64.00
项目类别:面上项目

相似国自然基金

1

多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究

批准号:61702207
批准年份:2017
负责人:刘智
学科分类:F06
资助金额:21.00
项目类别:青年科学基金项目
2

具有增量特性的移动式主题爬行技术

批准号:60373099
批准年份:2003
负责人:左万利
学科分类:F0202
资助金额:23.00
项目类别:面上项目
3

增量学习模型研究

批准号:60375022
批准年份:2003
负责人:吕宝粮
学科分类:F0603
资助金额:22.00
项目类别:面上项目
4

基于多义性码书学习和主题建模的图像语义分类技术研究

批准号:61273257
批准年份:2012
负责人:杨育彬
学科分类:F0604
资助金额:82.00
项目类别:面上项目