跨网页多源异构数据社会关系挖掘方法及应用研究

基本信息
批准号:61363072
项目类别:地区科学基金项目
资助金额:43.00
负责人:熊李艳
学科分类:
依托单位:华东交通大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:钟茂生,曾辉,黄卫春,吴昊,柴亚辉,周美玲,雷莉霞,刘建林,陈建军
关键词:
人名识别社会网络跨网页社会关系挖掘同名消岐社会关系
结项摘要

It is a new research in the field of social computing to establish a real social relations network on how to mine the non-privacy real social relations between individuals from the cross-Webpage Multi-source heterogeneous data. Different from the existing entity relation extraction task, the social relations mining of the cross-Webpage Multi-source heterogeneous data extend the existing entity relation mining of internal partial range of the text (sentence or paragraph) to the task of entity extraction, disambiguation of the same name, relationship recognition, data fusion and so on in the cross-text or cross-Webpage data, which is a great challenge to the research. The project combines the Reverse Maximum Matching, the Hidden Markov Model and the Names Credibility Model to do with the tasks of word segmentation, POS tagging, name recognition and so on in a joint collaborative analysis way. And it uses a similarity calculation method of the personal key feature to achieve disambiguation of the same name. Based on the above name recognition and the disambiguation of the same name, those can help achieve cross-Webpage social relations mining by using a combination method of semantic rules, relations pattern matching and automatic relations classification, and another method of search engine-based, automatic relations classification, fusion elections thinking. The research provides a way to establish a real social network, which has great significance for the study of the social relations and social networks. Besides, the established real social network has much practical value for assessment evasive, interview evasive and the related work.

如何从跨网页多源异构数据中挖掘个体之间的非隐私真实社会关系,以构建真实的社会关系网络,是社会计算领域一个新的研究课题。区别于现有的实体关系抽取任务,跨网页多源异构数据社会关系挖掘将原有文本内部局部范围(句内或段内)的实体关系抽取扩展为跨文本跨网页中的实体抽取、同名消歧、关系识别和数据融合等任务,具有一定的挑战性。课题融逆向最大匹配、HMM模型和人名可信度模型对文本分词、词性标注和人名识别等任务进行联合协同分析处理,用个人关键特征信息相似度计算方法实现同名消歧;在人名识别和同名消歧基础上,用语义规则、关系模式匹配、关系自动分类相结合的方法,以及用搜索引擎、关系自动分类、融合选举投票思想等两种方案来实现跨网页社会关系挖掘。课题研究为构建真实社会关系网络提供了途径,对社会关系和社会网络的研究具有重要意义,构建的真实社会关系网络对于评审回避和面试回避等相关工作具有重要的实用价值。

项目摘要

如何从跨网页多源异构数据中挖掘个体之间的非隐私真实社会关系,是社会计算领域一个新的研究课题。课题研究将为构建真实社会关系网络提供途径,对评审回避等相关工作具有重要的实用价值。课题组在国家自然科学基金项目“跨网页多源异构数据社会关系挖掘方法及应用研究 ”(61363072)项目的支持下,对跨文本跨网页的人名识别与同名消歧方法、人物社会关系挖掘和关系强度度量方法等方面进行了重点研究。提出了一种基于Naive Bayes的中文人名识别方法和基于句义结构分析中文人名消歧方法,提高了人物关系特征以及人物属性特征提取的准确率;通过研究社交网络中用户的个人信息相似度、用户姓名共现频率以及用户之间互动行为强度来准确测量用户之间的社会关系强度;提出了基于特征选择、基于模板上下文信息增益和基于动词名词和CHI特征选择的多种中文人物社会关系抽取方法;在构建“区域科研人员社会关系网络”方面利用深度信念网络的深度学习方法构建了对中文语义组块进行自动抽取的模型,提出了根据用户社交网络关系的资源服务推荐算法和一种关联多本体的科技奖励检索方法,研究了人物社会关系挖掘平台中任务关系强度的排序算法,并通过一种基于图形处理单元的并行加权k-means聚类算法提高运行速度,并将基于人物关系强度等算法应用赣州科技奖励服务平台中,保证了评审工作的科学性。在项目基金的支持下,已发表论文15 篇,参加国内会议20余人次,邀请国内相关领域知名专家来校进行指导2次,获得专利1项,软件著作权5项,培养研究生12名。通过课题组成员的努力,已完成项目预期目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

熊李艳的其他基金

相似国自然基金

1

多源异构数据中的攻击关联模式挖掘方法研究

批准号:61802081
批准年份:2018
负责人:申国伟
学科分类:F0205
资助金额:27.00
项目类别:青年科学基金项目
2

O2O商务模式下多源异构大数据的挖掘、融合与应用研究

批准号:71871233
批准年份:2018
负责人:李慧嘉
学科分类:G0112
资助金额:45.00
项目类别:面上项目
3

基于子网特征的肿瘤多源数据深度挖掘方法及其应用研究

批准号:61602174
批准年份:2016
负责人:李雄
学科分类:F0213
资助金额:19.00
项目类别:青年科学基金项目
4

基于多源异构不确定数据的高效用信息挖掘的研究

批准号:61503092
批准年份:2015
负责人:林浚玮
学科分类:F0603
资助金额:20.00
项目类别:青年科学基金项目