互联网的快速发展产生了海量的动态文本流,作为一种特殊的媒体形式,这类数据除了通常涉及多个主题外,其所含信息中往往带有反映社会性特征的身份(作者)。综合考虑动态社会文本流信息中所包含的各种数据可提高文本挖掘准确性,有助于理解媒体内容的演化过程和作者之间的社会关系(变化)。本项目针对动态社会文本流中所包含的"时间、内容和社会信息"三个重要因素,对各个层面之间交互作用进行研究,重点研究三因素的集成机制及相关算法,主要包括:(1)集成作者背景信息的增量文本聚类方法;(2)集成文本聚类关系的动态社区挖掘算法;(3)集成文本主题和作者合作关系的动态分析及动态社区建模方法。通过本课题研究可望得到面向大规模动态社会文本流的集成学习框架,以有效解决"文本内容演化、作者社会关系发展、内容演化与作者社会关系发展联系"等问题,为网络上更加复杂的文本流数据和舆情分析等应用提供核心技术支撑,为公共安全提供技术保障。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
黄河流域水资源利用时空演变特征及驱动要素
内点最大化与冗余点控制的小型无人机遥感图像配准
针灸治疗胃食管反流病的研究进展
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
融合多模态文本关联分析与挖掘的跨媒体社会图像检索方法研究
基于文本挖掘的社会媒体药品不良反应抽取研究
基于多重分形和文本数据流技术的网络金融信息动态挖掘研究
基于深度学习的文本和语音多模态数据挖掘研究