The research of text semantics is a difficult but hot issue in the field of Natural Language Processing and Artificial Intelligence. This proposal is one of the first attempts where semantic and programmatic information of texts is incorporated so that the goal of precise reasoning according to these information can be undertaken. Three aspects (semantics, precise reasoning and multi-classification) will be addressed in this proposal: 1) The research of semantics will summarize the state-of-the-art in the field of linguistics, including lexical semantics, cognitive linguistics, cognitive science, and the field of computer knowledge engineering as well as ontology research. The task of semantics research will investigate and answer the question that on which aspects or by what methods can the meaning of words(the knowledge hiding behind) be better expressed in a formal or computerized way. 2) The research of precise reasoning will study on what condition a certain piece of knowledge in the knowledge base should be (or not be) used, and answer whether different semantic rules have some properties in common. 3) The research of text multi-classification will investigate the "social attributes" of texts and attack the problem of how to classify texts from different dimensions (such as: topic labels, propagation abilities, sentiment polarities and political sensitivity) and different levels (article, paragraph and sentence).
对文本的语义研究是自然语言处理以及人工智能的难点与热点问题。本项目首次将"精确语义推理"作为研究重点,从语义、精确推理以及多分类三个方面对短文本感知展开全面的研究。主要研究内容包括:①语义研究,即从词汇语义学、认知语言学、认知学等语言学领域以及计算机领域的知识工程,本体知识库等入手,研究探索从哪个方面或者用哪种方法可以更好地将词义(即词汇所蕴含的知识)用一种形式化或计算机化的方法表示出来;②精确推理研究,即研究在什么条件下、应该用或者不应该知识库中的哪些知识,以及研究如何使用语义知识、各种语义知识在使用时是否有共性、有哪些共性等;③多分类研究:即在语义以及精确推理机制的支持下,研究如何将文本按照不同的维度,即文本的社会属性,如:主题类别、传播等级、情感极性以及政治敏感性等,和不同的层次,如篇张、段落和句子,进行分类。
本项目以“精确语义推理”作为研究重点,从语义、精确推理以及多分类三个方面对短文本感知展开全面的研究。主要研究内容包括:①语义研究,即从词汇语义学、认知语言学、认知学等语言学领域以及计算机领域的知识工程,本体知识库等入手,研究探索了如何更好地将词义(即词汇所蕴含的知识)用一种形式化或计算机化的方法表示出来; ②精确推理研究,即研究了在什么条件下、应该用或者不应该知识库中的哪些知识,以及研究如何使用语义知识、各种语义知识在使用时是否有共性、有哪些共性等; ③多分类研究:即在语义以及精确推理机制的支持下,研究如何将文本按照不同的维度进行分类。项目执行过程中采用本体知识库的构建、语义形式化表示方法、规则库的构建与推理、以及基于深度学习的词向量编码等方法对短文本数据展开研究,并取得了如下研究成果:提出以“规则+统计”为基础的观点识别算法,并研究开发了“评论观点提取”系统验证平台;相关研究成果申请了 7 项发明专利;课题组有选择性的在国际会议上发表论文2篇;国际学术期刊发表论文 2 篇(EI检索);培养了 3 名硕士研究生,另有1名新加入的在读研究生。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于铁路客流分配的旅客列车开行方案调整方法
基于多色集合理论的医院异常工作流处理建模
基于腔内级联变频的0.63μm波段多波长激光器
结直肠癌免疫治疗的多模态影像及分子影像评估
具有随机多跳时变时延的多航天器协同编队姿态一致性
不良文本内容在线感知的多粒度语义模式研究
内容语义感知的Web文本可信鉴别与求证方法
基于多源语义表示学习的社交媒体文本属性情感分类研究
面向文本信息安全的类别语义模型分类方法研究