给定一个专业主题,如何在Web上搜集与该主题相关的网页是建造各种专业搜索引擎的核心问题. 本研究以蚁群系统、神经元网、进化计算等自然算法为基础,结合增强学习方法,探讨面向主题的智能化高效网页自动搜集技术,在国际上已有工作的基础上,提出新的主题爬行模型和算法,改善主题爬行策略和主题识别精度,从而提高收获率(harvest rate),同时重点解决:(1)移动式主题爬行问题;(2)增量式与二次主题爬行问题;(3)多agent协同爬行时的最大覆盖与最小重叠问题..主题爬行研究的目标是提供建立专业搜索引擎的一般技术和通用算法,通过提高网页搜集的效率和质量提高专业搜索引擎在领域内的权威性,降低专业搜索引擎的建造和运行代价,同时最大限度降低网络传输负载. .除专业搜索引擎外,主题爬行技术还可用于动态Web检索和个性化定制的Web检索服务,突破引擎检索的局限性,具有广阔的应用前景.
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
物联网中区块链技术的应用与挑战
基于增量学习的主题爬虫关键技术研究
增量调制数字信号处理技术
面向功能挖掘的代码主题建模技术研究
具有自治特性的服务协作关键技术研究