基于倾向性演化学习的新闻话题变种检测方法研究

基本信息
批准号:61003152
项目类别:青年科学基金项目
资助金额:20.00
负责人:洪宇
学科分类:
依托单位:苏州大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:姚建民,李艳翠,孙静,颜振祥,葛运东,张剑峰,华松
关键词:
新闻话题变种检测倾向性演化
结项摘要

新闻话题检测是舆情分析领域中的重要研究课题,对于舆情的监督、管理和调控有着很高的实用价值。特别是新闻话题的变种检测对于突发事件和敏感话题的预报尤为重要。目前,针对话题变种检测问题的探索尚未开展,借助舆情的倾向演化解释话题变种衍生规律的研究在国内外尚属空白。本课题将重点研究新闻话题和倾向性的协同演化规律以及相应的机器学习策略,并探索话题变异锚点的实时检测和话题变种的描述方法。本课题的主要研究内容包含如下四个方面:基于时序事件链的话题建模、基于"能愿"动词的倾向性识别、话题与倾向性协同演化的自适应学习、实时话题变种检测。特别是研究融入事件时序属性的结构化动态话题建模;利用"能愿"强度层次体系的倾向性演化描述;以及依赖倾向强度和事件突发性依存关系的协同演化数学建模。目标是实现针对舆情信息中倾向性和话题协同演化的自动监控,以及话题变种的有效识别与预报。

项目摘要

本课题旨在实现一种面向新闻流媒体的话题变种检测方法。针对这一目标,计划研究任务包括:自由文本的事件抽取方法;以事件为元素的动态话题建模方法;基于能愿倾向的话题变异识别方法;以及变种话题的组装与描述方法。根据研究计划,课题组于近三年对上述各个研究点进行了系统分析与研究,提出成型方法多套,学术成果得到国际顶级学术会议的认可与发布,总体进展顺利。下面对本课题取得的研究成果进行概述。一)建立了以分类技术为基础的自由文本事件抽取方法,测试并验证了各类语言特征和统计信息在事件类型、触发词、元素和角色的分类抽取过程中的作用,并重点形成一种跨实体推理的事件分类抽取方法,抽取性能优于国际同期相关技术7个百分点。这一成果于2011年在国际A类学术会议ACL上以长文形式发表;二)验证了动态话题模型对捕捉话题在新闻信息流中变迁轨迹的优越适应性。在此基础上,提出并实践了多种动态话题模型,如时序事件链式话题结构,双层事件聚类的层次话题结构,基于聚类树的树形话题结构。其中,动态话题模型的验证尚属首次,由此形成的事件链动态话题模型在国际权威数据TDT上的话题检测与跟踪任务上,分别获得约16%和6%的性能提高。此外,层次话题模型和聚类树模型已实际应用于微博话题检测;三)构建了一套能愿词库,包含能愿词1,896项,相应能愿强度指标和应用实例。开发了一种自适应的能愿词新词识别和挖掘方法。借助该词库,本课题形成了一套以人的能愿倾向为线索,对话题变化进行先验识别与估计的方法。该方法在以商品评论满意度预测为应用场景的实验中,取得了评论话题变异的准确识别。相关成果以长文发表于2012年国际A类学术会议SIGIR;四)提出一种以篇章关系检测为基础变种话题描述方法,建立了基于能愿倾向的话题变种检测系统。三年来,发表核心和EI论文30余篇;国际顶级会议CIKM/SIGIR/ACL等论文5篇;国内一级学报“计算机学报”和“软件学报”3篇,形成并申请专利4件。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

二维FM系统的同时故障检测与控制

二维FM系统的同时故障检测与控制

DOI:10.16383/j.aas.c180673
发表时间:2021
2

黄曲霉毒素B1检测与脱毒方法最新研究进展

黄曲霉毒素B1检测与脱毒方法最新研究进展

DOI:10.3969/j.issn.1000-4440.2021.03.031
发表时间:2021
3

GF-4序列图像的云自动检测

GF-4序列图像的云自动检测

DOI:CNKI:SUN:YGXB.0.2018-01-012
发表时间:2018
4

基于多像素光子计数器的弱光可见光通信实验系统

基于多像素光子计数器的弱光可见光通信实验系统

DOI:10.16798/j.issn.1003-0530.2020.07.015
发表时间:2020
5

西秦岭北缘构造带新生代盆地南部边界断层带结构与构造变形演化

西秦岭北缘构造带新生代盆地南部边界断层带结构与构造变形演化

DOI:10.12017/dzkx.2020.066
发表时间:2020

洪宇的其他基金

批准号:41906180
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目
批准号:61672368
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:61373097
批准年份:2013
资助金额:76.00
项目类别:面上项目

相似国自然基金

1

新闻话题线索与主题的探测研究

批准号:60873134
批准年份:2008
负责人:李芳
学科分类:F0211
资助金额:30.00
项目类别:面上项目
2

基于深度强化学习的新闻事件预测方法研究

批准号:61806020
批准年份:2018
负责人:胡琳梅
学科分类:F0606
资助金额:25.00
项目类别:青年科学基金项目
3

基于迁移学习的社交网络虚假新闻检测关键技术研究

批准号:61906039
批准年份:2019
负责人:方兰婷
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目
4

基于演化本体的网络舆情自适应话题跟踪方法研究

批准号:71373123
批准年份:2013
负责人:马静
学科分类:G0414
资助金额:54.00
项目类别:面上项目