融合多源社会化网络数据的个体价值发现与预测

基本信息
批准号:91646119
项目类别:重大研究计划
资助金额:43.00
负责人:孙宇清
学科分类:
依托单位:山东大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:王薇,刘辉,许浩然,谢翌,牛佳瑞,刘天元,曹琉,余贤棋,杨环
关键词:
服务协同社会网络计算机支持的协同工作协同计算
结项摘要

Nowadays, people are more and more relying on social media for both entertainment and work. The media providers collect a lot of data on user behaviors. Analysis of these data can learn and predicate different aspects of individual value, such as identity, character, attribute, social relationship etc. This project investigates the challenges in solving the above problem. ..The first challenge is modeling. Since user behavior data is noisy and in a random mode, this project would model user behaviors against selected open knowledge bases. Enrichment on domain dependent knowledge is also studied so as to solve the different characteristics caused by platform targets. To solve the problem of unbalanced and long tail data, this project would borrow external data to help profile individuals. ..The second challenge is the mismatch problem of the same user on different social platforms, which is caused by both the content characteristics and user behavior styles on them. We propose effective and efficient algorithms to recognize the representative and distinct characteristics of each target individual so as to match an individual identity cross platforms. To thoroughly understand individual value, this project analyzes user behaviors with various probabilistic methods on character tags, social role and community, as well as intrinsic characteristics besides the traditional explicit attributes such as sex or age etc. ..To help the findings be integrated into practical applications, this project would investigate some probabilistic metrics to quantify user behaviors and create a set of fingerprints for target users. The prototype would be designed and implemented to provide analysis services on individual value.

社会化媒体日益融入人们生活和工作,并积累了大量的用户数据,分析这些数据可以获得不同层面的个体信息,帮助识别和预测个体价值,为数据驱动的管理和决策提供依据.本课题面向多源异构社会化媒体的用户网络行为,分析个体身份、标签属性、社会角色和价值倾向等多元化个体社会价值.为了解决数据的碎片化和噪音等问题带来的不利影响,引入独立于平台的公共知识库辅助用户语义特征建模,并进行平台依赖的知识库学习,解决了平台定位不同带来的特征差异问题;针对数据的不均衡性和长尾特征,借助客体信息和外部数据对用户进行细粒度画像,增加个体可辨识性.提出可复用的用户特征建模和高效分析算法,对目标个体进行跨平台身份识别、推断标签属性和社会角色,通过学习行为模式的演化规律,预测跨平台的个体影响力.最后,设计原型系统,融合多源社会化网络平台数据,提供个体价值分析服务.

项目摘要

本课题针对社会化媒体用户数据,提出了基于用户离散行为数据的概念和实体表示方法,建立了平台独立的可辨识性个体行为指纹库;从统计和案例两个角度分析了跨数据集的个体身份表示向量语义;提出了个体身份映射问题在现实数据中的主导因素和制约因素,有效地划分了个体行为规律和群体行为分布的差异性,为个体行为的社会学分析提供了数据基础,为全视角识别个体社会价值提供了实例、统计结果和技术支撑。.提出了融合个体内在隐式特征和行为显示特征的用户画像方案,以及在属性推断问题上的特征重要性度量方法;提出了面向严重不均衡数据的概率包裹式分类算法,有效整合了客体信息、用户发布内容、交互数据和环境因素等, 解决了不均衡样本学习问题,进行个体标签属性推断,在分析碎片化和长尾特征数据方面,比相关工作更有效,因此适合社会化网络用户行为分析。.提出了面向用户行为的多因素联合表示学习模型,在相同的隐式空间中建模用户、时间、地点、行为类型等因素的表示向量,提出了两种基于这些要素的行为推断模型,结合了行为周期性、特异性、关联性,推断后继行为的概率分布。.上述工作为网络数据分析提供了有益思路和高效算法,以及可复用的数据结果和解决方案,训练得到的概念实体向量具有语义可解释性,对于个体价值问题的理解和分析方法具有理论价值。课题组与浪潮集团数据服务事业部合作,利用云海卓数采集互联网上公开的信息资源,通过分析电子商务和生活服务类数据,为国家统计局、山东省地税局等单位提供了面向个体企业的运行状况和信誉分析服务,从海量互联网资源中分析经济走势和预测市场风险,具有实际应用价值。.已申请国家发明专利3项,获授权发明专利1项;在国内外重要期刊和会议发表学术论文8篇,其中领域高影响力论文1篇,中文权威期刊论文1篇,获得中国计算机学会推荐国际会议最佳学生论文1篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
3

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

孙宇清的其他基金

批准号:61173140
批准年份:2011
资助金额:55.00
项目类别:面上项目

相似国自然基金

1

融合多源大数据的互联网金融个性化价值发现与风险评测

批准号:91546104
批准年份:2015
负责人:张成洪
学科分类:G0110
资助金额:43.00
项目类别:重大研究计划
2

融合多源大数据的大型商场顾客价值发现与个性化促销策略优化

批准号:91646110
批准年份:2016
负责人:罗开平
学科分类:G0103
资助金额:42.00
项目类别:重大研究计划
3

基于多源异构数据融合的miRNA与疾病高精度关联预测研究

批准号:61873270
批准年份:2018
负责人:李政伟
学科分类:F0305
资助金额:16.00
项目类别:面上项目
4

面向网络舆情大数据的决策价值发现

批准号:91746106
批准年份:2017
负责人:刘怡君
学科分类:G0409
资助金额:43.00
项目类别:重大研究计划