互联网中大规模的超链接拓扑结构包含了传统数据环境所没有的丰富信息,如链接数目的幂法则分布,连通域的规模等,对该结构进行研究可以加速Web信息资源的建设、利用和发展。中国Web链接结构图(简称Web Graph)属于整个互联网的一个很重要的子集,但其也包含了很多本地的特征与性质,这使得对应的很多应用模型也因结构等不同而异。本课题通过对中国Web Graph结构的研究,了解中国Web Graph的宏观结构、微观结构及其结构的各种统计特征,并针对中国Web Graph的结构与特性建立相应的模型,来分析中国Web的发展趋势。与此同时,根据以上分析我们结合数据挖掘,机器学习和信息检索技术来提出更为有效的应用,如在信息检索中分析网页重要性的链接分析算法、加速检索引擎页面更新的网络爬行策略等,来加强信息检索引擎的功能。这些研究对于促进中国互联网的发展,提高中文信息利用的效率与效果都具有十分重要的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
Web数据挖掘与知识发现
WEB搜索与挖掘的新理论与方法
Web搜索与挖掘的新理论和新方法—支持舆情监控的Web搜索与挖掘的理论与方法研究
Web社区用户个性挖掘与排序研究