基于主题网络的用户内在兴趣发现及演进研究

基本信息
批准号:61502247
项目类别:青年科学基金项目
资助金额:21.00
负责人:李华康
学科分类:
依托单位:南京邮电大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:柯昌博,黄璞,仇呈燕,张迎亚,梁成良,夏崇欢
关键词:
用户建模内在兴趣个性化服务主题网络兴趣演进
结项摘要

The research of personalized service, as one of the most popular researches in Internet era, are focused on user profile, behavioral analysis, interest drift and personalized recommendation and so on. These studies are mainly to individual user’s pattern based on massive historical user data to make a forecasting. They ignore the user as an agent can generate new interests from the current knowledge base..This project intends to build a global interest topic network based on Internet content, which is used to explore the basic theory and key technology of the development and evolution of user’s inherent interests. Specific studies include: 1) in order to study the construction theory and modeling algorithm, keyword extraction techniques, analyzing of association between keywords and interest topic to build inter-related interest topics, feature extraction and machine learning algorithm will be used to determining the causal relationship between interest topics; 2) using page accessing frequency, residence time and other key feature to research interest measurement modeling method; 3) using improved GE algorithm to discover user’s inherent interest in the global interest network, revealing the basic evolution and update pattern for users inherent interest..The achievements of this research project can enrich user behavior analysis research content, and promote the application of personalized services significantly.

个性化服务作为互联网研究热点之一,主要集中在用户建模、行为分析、兴趣漂移和个性化推荐等方面。这些研究主要采用大量历史用户数据建立用户模型并以此对个体用户进行模式匹配与预测,忽视了用户作为智能体对兴趣具有内在认知、加工、演化的过程。本项目拟通过构建一个面向互联网内容的全局兴趣主题网络,并以此探索用户个体内在兴趣发现及演进的基础理论和关键技术。具体研究包括:1)通过关键字提取技术、分析关键词与兴趣主题之间的关联关系并以此构建兴趣主题间关联,特征提取和机器学习算法判别主题间的前后因果关系等技术研究兴趣主题网络的构建理论与建模方法;2)利用访问页面频度、停留时间等关键特征研究用户兴趣度量建模方法3)采用GE改进算法发现用户兴趣在全局兴趣网络上的内在兴趣,揭示用户兴趣内在的演进和更新规律。该项目的研究成果丰富用户行为分析的研究内涵,对推动个性化服务的应用有着重要的意义。

项目摘要

人工智能作为最新的研究热点,其中知识网络担负起类知识管理和知识演化的核心技术角色。在互联网大数据时代的个性化服务中,兴趣网络(知识网络)的的理论研究和应用技术探索,能够更好地发现用户作为智能体在认知和兴趣上的内在的行程、确立、自我演化及相互影响。..主要对以下个点展开研究:.(a) 提出基于多源数据融合的弱可信数据可用模型,对多份弱可信数据建立融合可信确认算法,并通过人物命名实体识别实例进行验证,该算法对互联网弱可信数据的认知度达到91.32%。(b) 提出BI-LSTM-Attention-CRF模型,解决了BI-LSTM-CRF模型在获取上下文信息方面的问题,改进了其在不规范短文本语料上的不良表现,在Weibo语料中F值提升了3.61%。(C) 提出多源知识网络融合构建方法,给出实体描述和结点关系,构建节点间相似度计算模型。(d) 提出语义网络结构相似计算模型,利用网络表示学习中的方法进行文本序列挖掘,并用struc2vec算法分析诺贝尔获奖作品和提名作品序列结构的异同点。(e) 提出图结构多关键字检索方法,采用多节点权重计算方式,设计出一种搜索子图的算法,得到每个关键字对应的节点集合,准确地为用户返回更符合用户查询意图的结果。(f) 提出基于兴趣的图游走优化算法,设计基于标签信息指导游走的深度学习网络表示算法,使用逻辑回归分类模型对结点的特征表示进行多标签分类。(g) 提出基于可信关系的用户兴趣挖掘,宏观传播模型将社交网络关系中的关系相似定义为新的可信关系并进行迭代;微观传递模型采用社会信息扩散理论进行兴趣主题的可信扩展。(h) 提出基于知识网络关系的非监督页面分类方法,使用维基中文知识库作为知识网络,标定少量词汇对知识网络的传递遍历计算所有节点关键词的类目属性。..项目组目前已经积累Wikipedia和知网融合数据库1个20G容量,存储ConceptNet、BaleNet等大型网络共300G。递交多个基于用户兴趣网络领域专利,部分算法有望投入实际应用。与中兴耀维一起申请的发明专利《一种基于业务知识图检索的智能问答系统》已经授权,准备落实基于知识检索的实体机器人平台。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

李华康的其他基金

相似国自然基金

1

基于用户标签和主题兴趣的社会媒体信息推荐研究

批准号:61806049
批准年份:2018
负责人:李洋
学科分类:F0606
资助金额:26.00
项目类别:青年科学基金项目
2

基于网络社交媒体的层次化用户兴趣建模

批准号:61272340
批准年份:2012
负责人:李晓明
学科分类:F0211
资助金额:80.00
项目类别:面上项目
3

基于深度神经网络的社会媒体用户情感及兴趣挖掘方法研究

批准号:61671450
批准年份:2016
负责人:李秋丹
学科分类:F0113
资助金额:58.00
项目类别:面上项目
4

融合多网络社区身份的用户话题兴趣建模研究

批准号:61502502
批准年份:2015
负责人:赵鑫
学科分类:F0211
资助金额:20.00
项目类别:青年科学基金项目