随着搜索引擎应用的普及和深入,越来越多的网站出于商业或其他目的,通过"认真研究"搜索引擎的排名技术,有针对性地使用一些spamming手段去欺骗搜索引擎,从而使这些网站的垃圾和不良信息页面获得较高排名。这些Web垃圾和不良信息的泛滥,不但大大浪费了搜索引擎的宝贵资源,而且大大降低了搜索引擎用户的查询和使用效率,已经成为困扰搜索引擎的一个严重问题。本项目希望在承继已有研究成果的基础上,突破单一的Web链接结构分析方法,使用Web结构挖掘和Web日志挖掘相结合的方法,对Web页面的链接特性、用户访问规律和Web站点演化情况进行研究,获得Web站点和页面的可信度,帮助搜索引擎过滤垃圾站点,节省时间与费用;同时还原那些使用了spamming技术的页面的本来面目,为用户提供高质量的信息,提供他们真正需要的查询结果。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
中外学术论文与期刊的宏观差距分析及改进建议
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
Web页面数据对象的感知理解与计算
主题无关的高质量WEB页面预选与检索研究
WEB数据挖掘技术研究
我国垃圾焚烧发电PPP项目关键风险分析及系统应对研究