语义主题与社交关系融合的特定群体发现关键技术研究

基本信息
批准号:61772075
项目类别:面上项目
资助金额:61.00
负责人:张华平
学科分类:
依托单位:北京理工大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:高凯,商建云,阮冬茹,赵燕平,李玉岗,徐程程,高莘,张玺,刘斌
关键词:
群体发现主题分析社交网络社会关系
结项摘要

Represented by weibo and wechat, the influence of social network is enhancing now, and it has become the main medium for public to access information and take part in the social interactions. Specific group refers to those units without direct strong relationship in social network, and it is usually formed by individuals focusing on particular topics or interests spontaneously. As the specific group usually has characteristics on strong thematic, minority, weak relationship and concealed attributes, the traditional community discovery methods cannot work well in this domain. Furthermore, it is also difficult for the pure content filtering method to find these inactivity “big V” groups. The main goal of this project is to study the key technologies on microblogging social network particular groups’ discovery automatically, and to construct the representation model for some specific groups. Besides, this project also does researches on the special group relationship discovery algorithms on the basis of the fusion on semantic theme and social relations, and realizes the special application on "Reincarnated Party" and "Shidu Family"( The Loss of Only Child Family) topic as the demonstration of the project. The details of the technical routes are: First, given group topics or seed lists, it needs to calculate the individual social network semantic similarity; Second, it needs to utilize four types of social relations (e.g., “attention”, “forward”, “thumb up”, “mentioned”) to extend or discovery the corresponding groups’ goals; Last, by the fusion on the similarity of semantic topic and the social relation, this project will realize the special group’s discovery automatically and its positioning accurately. This goal of this project is to find a breakthrough in theory on special group representation and knowledge. Furthermore, it can also provide technical support on social space for national security and social management innovation.

以微博与微信为代表的社交网络影响力日渐增强,已成为公众信息获取与社会交往的主要媒介。特定群体指的是在社交网络中没有直接的强关系,由聚焦特定主题或兴趣偏好的个体自发形成的集合。特定群体有着主题性强、小众化、弱关联、较为隐蔽等特点,很难通过传统的社区发现方法自动发现,纯粹靠内容来过滤则无法发现较少发言的幕后大V。本项目旨在研究微博类社交网络特定群体的自动发现关键技术,构建特定群体的表示模型,研究融合语义主题与社交关系的群体发现算法,实现“转世党”与“失独家庭”等小众化特定群体的示范应用。具体技术路线为:针对给定的群体主题或种子列表,计算社交网络个体的主题语义相似性,综合利用关注、转发、点赞、提及等四类社交关系扩展群体目标,最后融合语义主题与社交关系的相似性计算实现特定群体的自动发现与精准定位。本项目拟在特定群体表示与发现方面实现理论突破,在社交网络空间上为国家安全保障与社会治理创新提供技术支撑

项目摘要

社交网络中存在海量数据。以用户为核心,可延伸出很多有价值的信息。社交网络中的用户存在明显的群体属性,对用户群体进行形式化描述,有助于挖掘群体的特性,更好地满足国家社会等需求。本项目研究了微博类社交网络特定群体的自动发现关键技术。首先构建了社交网络特定群体的表示模型,依据给定的群体主题或种子列表,利用语义主题表示及主题特征词抽取方法对用户关系进行语义分析;其次通过社交关系拓展及个体相似度融合计算构建了融合语义主题与社交关系的特定群体发现算法;然后对特定群体的特征进行群体分析,综合利用其粉丝数及权重、参与度等进行影响力计算,并构建了群体画像;最后研究了小众特定群体发现示范应用,在小众化特定群体中进行语义、关系分析及种子用户发现,实现了该类特定群体的自动发现与精准定位,研究工作在舆情分析与选举预测方面取得了实战效果。本项目工作涉及的文档主题相似度计算和群体画像构建方法在文书生成领域同样适用,对于文书中抽取的习惯用语,利用相似度匹配算法实现了短语行文顺序描述规则的构建与重复词汇的归纳;针对不同操作用户,利用群体画像构建方法可以构建符合该用户特征的特有的用户画像。项目按计划完成了相关的研究内容,学术成果方面,本项目发表学术论文共27篇,其中SCI 1区1篇、SCI 2区4篇、CCF A B C类论文以及EI索引的学术论文及其他学术论文19篇;出版2部学术专著,完成1项标准、2项专利,申请计算机软件著作权12个等,获得了3项相关比赛的奖项,其中事件抽取全球第一,金融抽取第二。相关工作已经在中央网信办、国家计算机网络安全管理中心等国家机关进行实际应用,在巴基斯坦大选和美国大选预测方面取得了突出结果。本项目在特定群体表示与发现方面实现了理论突破,所涉及的主题特征关键词抽取在基于文本的推荐、基于文本的搜索以及文本挖掘领域有着很广泛的应用;以语义主题为导向的小众化群体发现是当前研究的难点,特定群体的自动发现与分析以语义主题为主,结合关联关系,可成为当前社交网络分析的一个新角度。本项目的研究在社交网络空间上为国家安全保障与社会治理创新提供了技术支撑,为特定群体社交网络研究领域、文本数据挖掘与文本生成领域的持续发展奠定基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

张华平的其他基金

批准号:61272362
批准年份:2012
资助金额:84.00
项目类别:面上项目

相似国自然基金

1

融合社交语义环境的网络图像标注关键技术研究

批准号:61402174
批准年份:2014
负责人:张静
学科分类:F0210
资助金额:24.00
项目类别:青年科学基金项目
2

基于主题发现的图像语义理解与识别

批准号:61165009
批准年份:2011
负责人:李志欣
学科分类:F0604
资助金额:50.00
项目类别:地区科学基金项目
3

基于语义理解的面向特定主题的微博舆情监控技术研究

批准号:61303190
批准年份:2013
负责人:李莎莎
学科分类:F0214
资助金额:23.00
项目类别:青年科学基金项目
4

基于知识图谱的社交媒体大数据主题发现与趋势预测关键问题研究

批准号:61772366
批准年份:2017
负责人:黄震华
学科分类:F0211
资助金额:63.00
项目类别:面上项目