In recent times, more and more people try to obtain much information from the Internet to improve their efficiency of decision-making. However, with the rapid development of rich-information technologies, such as online transaction systems, IoT and social media, the information has been characterized by massive volume, multi-dimension, heterogeneity, and multi-application. Thus, users could be facing with two serious challenges of selecting information: how to choose those information whose granularity is corresponding to the risk factors, and how to learn to identify helpful information. To that end, this research is dedicated to study efficient methods to extract multi-granularity theme (both decision theme and behavioral theme) structures for information selection, and to explore mechanisms for information in users' decision-making. .The research results could have both theoretical innovation and practical significance on 1) studying the efficient representation for information structures of decision-making, 2) mining semantic patterns in sequence data, and 3) exploring the mechanisms for users' information selection.
在海量、多维度、异质、多应用的大数据环境中,用户选择决策相关信息时面临着两项挑战:如何选择与风险因素具有对应语义粒度的信息,以及如何通过学习来识别有用信息并纳入决策行为。.本研究以海量数据为中心,首先设计出面向决策主题的多粒度信息结构抽取方法,并通过其建立起主题特征之间的语义关系、以及语义之间的层级关系网络来服务用户决策中的不同信息粒度需求。然后,通过分析网络上信息协同过程中的数据生成及演化规律,同时设计新的序列数据表示模型来挖掘用户行为中的语义模式,进而发掘用户在海量数据中的信息选择、评价及决策行为机理。.研究结果在决策信息结构表示,序列数据语义模式挖掘以及用户信息选择机理上有理论创新和技术实践意义。同时有望为研究成果在电子商务中的应用提供技术支持和系统示范。
项目自2017年执行以来,项目组紧紧围绕"面向用户决策的多粒度主题信息结构抽取及行为机理"课题开展研究。主要包括:"多粒度主题信息结构抽取"、"面向(决策)行为的用户信息挖掘"和"用户决策中信息使用机理研究"三个研究方面。第一方面的研究成果提供了一套多粒度/多源异质海量文本数据的语义关系发现-特征识别-关系匹配的信息结构抽取方法,为有效分析用户的行为模式提供技术支撑,拓展了自然语言处理领域的相关理论研究。第二方面的研究成果主要体现在用户行为画像建模、行为数据语义建模及决策行为关联分析、以及用户决策行为预测研究,为基于情景的推荐系统实践提供理论方法。第三方面的研究成果主要集中探索关于信息主题生成机理、群组信息协同机理、以及用户信息选择机理的研究,为基于数据驱动的管理及优化应用提供具有可解释性的理论与方法。截止2020年底,共发表(含被接收)论文22篇,期刊论文11篇(其中Dallas24期刊论文2篇,SCI/SSCI论文6篇),会议论文11篇(其中EI检索6篇);授权发明专利1项,研究成果较为丰富。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
拥堵路网交通流均衡分配模型
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向维基百科的多粒度一体化信息抽取方法研究
面向社交媒体的多粒度主题演化关键问题研究
面向领域用户知识发现的数据结构化建模与多粒度融合
面向微博的地理兴趣点抽取及其用户行为意图分析研究