社区是Web最有价值的结构特征之一。社区识别是Web领域的热点研究课题,在许多实际应用中起着重要的作用。现有的算法仅通过链接分析识别社区,求解质量偏低,不能满足实际应用的需求。我们通过前期大量研究和分析工作得出结论:仅通过链接分析不可能精确识别社区。本项目针对这个难题设计高质量的社区识别算法,算法以链接分析为主,辅以内容分析和页面结构分析,引入页面间引力模型、页面均匀抽样、页面语义块分割等技术,解决链接加权、准目标社区与层次聚类结果匹配、页面的多主题识别等一系列影响社区识别算法求解质量的关键问题。为了保证算法的效率,本项目将复杂的社区识别任务分解,采用逐步求精的策略分阶段地逼近目标社区。继而本项目对社区进行初步分析并设计友好的界面,以方便用户使用。本项研究将促进聚焦爬取、自动化门户、内容预取等一系列关键技术的进步,为保证我国在Web科学和信息检索等前沿领域取得优势发挥重要作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
Web图流算法及Web社区发现
Web社区管理系统研究
Web社区用户个性挖掘与排序研究
Web潜在社区的发现技术研究