随着搜索引擎应用的普及和深入,越来越多的网站出于商业或其他目的,通过"认真研究"搜索引擎的排名技术,有针对性地使用一些spamming手段去欺骗搜索引擎,从而使这些网站的垃圾和不良信息页面获得较高排名。这些Web垃圾和不良信息的泛滥,不但大大浪费了搜索引擎的宝贵资源,而且大大降低了搜索引擎用户的查询和使用效率,已经成为困扰搜索引擎的一个严重问题。本项目希望在承继已有研究成果的基础上,突破单一的Web链接结构分析方法,使用Web结构挖掘和Web日志挖掘相结合的方法,对Web页面的链接特性、用户访问规律和Web站点演化情况进行研究,获得Web站点和页面的可信度,帮助搜索引擎过滤垃圾站点,节省时间与费用;同时还原那些使用了spamming技术的页面的本来面目,为用户提供高质量的信息,提供他们真正需要的查询结果。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于被动变阻尼装置高层结构风振控制效果对比分析
基于改进LinkNet的寒旱区遥感图像河流识别方法
A tale of two databases: the use of Web of Science and Scopus in academic papers
血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展
基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析
Web页面数据对象的感知理解与计算
主题无关的高质量WEB页面预选与检索研究
WEB数据挖掘技术研究
我国垃圾焚烧发电PPP项目关键风险分析及系统应对研究