随着互联网技术的飞速发展,网络信息呈指数级增长,"信息过载"和"信息迷航"等问题日益严重,对社会网络媒体信息进行组织和挖掘以丰富和增强现有的搜索和浏览技术变得越来越迫切。本课题拟在课题组已有研究成果基础上,借鉴数据挖掘、机器学习、拓扑学等领域的研究成果,深入研究社会网络媒体信息组织和挖掘方法,主要内容包括:研究基于拓扑方法的交互信息语义分析方法;研究基于对偶表示特征的相似用户组构建方法;研究潜在有影响力用户预测方法,研究基于拓扑层次结构及概率矩阵分解的用户、资源及交互信息的关系学习方法;在此基础上,研制一个社会化网络媒体信息组织与挖掘原型平台。本课题的研究将进一步丰富和拓展社会化网络信息服务的理论及应用领域,对促进社会化网络的发展有重要的理论意义和实际应用价值。
随着互联网技术的飞速发展,网络信息呈指数级增长,“信息过载”和“信息迷航”等问题日益严重,对社会网络媒体信息进行组织和挖掘以丰富和增强现有的搜索和浏览技术变得越来越迫切。本课题在课题组已有研究成果基础上,借鉴数据挖掘、机器学习、拓扑学等领域的研究成果,充分考虑用户、资源及交互信息的冗余性、模糊性,多维性、时效性等特点,深入研究了社会网络媒体信息组织和挖掘方法,主要研究了如下内容:1) 围绕主题词多阶、多层次语义关联学习、低维词向量的有效表示及重要词的识别、融合外在知识库的主题分类及层级关联学习开展了交互信息语义挖掘方面的研究,以发现深层次语义信息,在实际数据集上的实验分析表明,所提方法有助于帮助用户全方位深入理解主题,提高他们浏览感兴趣主题内容的效率;2)在“相似用户组发现”方面,研究了融合交互语义与用户链接特征的潜在特征空间的协同发现方法,融合信息传播影响因子的用户组演化模式挖掘方法,在实际数据集上的实验分析表明所提模型可以检测到有意义的相似用户组,并及时跟进事件的发展动态,从而为信息组织与浏览研究提供更高层次的动态视角;3) 在“有影响力用户预测”方面,研究了行为网络的构建方法,对行为网络结构特征进行挖掘,设计了基于数量、范围和时效三种要素的集成化影响力度量准则, 以此为基础,基于社交网络分析中用户潜在行为趋势分析理论中的同质性、个体影响、延续性及时效性四个因素,利用边预测模型研究了一种预测用户影响力的混合模型,在数据集上的实验分析表明,该方法能够有效的对用户影响力走势进行预测;4)在“用户、资源及交互信息关系挖掘”方面,研究了集成用户、资源及交互信息的概率矩阵分解信息空间构建模型,融合时间衰减函数,学习得到用户在潜在特征空间的兴趣分布向量,实现对未来兴趣的预测,在数据集上的实验结果表明,与现有方法相比,所研究的方法能更准确地捕捉用户的兴趣,为用户推荐满足其需求的信息。在上述研究基础之上,课题研制了面向社会网络媒体的信息组织和挖掘原型,实现事件的主题演化分析、影响力用户识别、用户兴趣分析预测及推荐,为用户提供更好的信息浏览与服务质量。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
服务经济时代新动能将由技术和服务共同驱动
基于Web2.0的信息自组织与有序化研究
基于社会化网络媒体数据的城市空气质量监测方法与模型研究
面向网络媒体信息的知识建模与行为预测方法研究
基于社会媒体信息挖掘的图像标注技术研究