Natural language processing is one of the core research content of artificial intelligence, aiming at exploring the nature of humans' language ability and thinking activity. To understand Chinese texts accurately, the representation, analysis, computing and reasoning of Chinese semantics are essential and urgently need to be addressed means. This project combines traditional methods of Chinese understanding and currently popular deep machine learning methods, aiming to build efficient and high-performance new ways of Chinese semantic computing, and studies on three layers: semantic representation, semantic computing and semantic reasoning. A new set of theory frameworks and implement methods of Chinese semantic computing are expected to be built, including: efficient methods of automatically building semantic knowledge base, to settle the problem of shortage of Chinese semantic knowledge resources; new ways of semantic representation and computing based on deep learning and distributed representation, solving the sparse problem of current symbol-based semantic representation and computing methods; expanding the current unit of semantic logical calculus from words to sentences, and even to discourses, meeting more complex demands of text intelligent reasoning, because current reasoning algorithms do not consider global information. To demonstrate our theories and methods, we will implement an advanced domain specific automatic question-answering system.
自然语言理解是人工智能研究的核心内容之一,旨在探索人类自身语言能力和思维活动的本质。要实现对汉语文本的正确理解,汉语语义的表示、分析、计算和推理都是不可缺少且亟待解决的手段。本项目将结合面向汉语文本理解的传统方法以及当前流行的深度机器学习方法,以建立有效的高性能汉语语义计算新方法为总体研究目标,从语义表示、语义计算模型和语义推理三个层次展开研究。期望能够创建出一套新的汉语语义计算的理论框架和实现方法。包括:为解决汉语语义知识资源不足的问题,创建有效的语义知识库自动构建新方法;为解决现有基于符号的语义表示和计算方法的稀疏性问题,创建基于深度学习和分布式表达的语义表示和计算新方法;为解决现有推理算法不能考虑全局信息的问题,将现有的语义逻辑演算单元从词汇级别扩展到句子乃至篇章的级别上,满足更加复杂的文本智能推理的需求。在上述理论研究基础上,实现面向特定领域领域的高水平汉语自动问答系统。
自然语言理解是人工智能研究的核心内容之一,旨在探索人类自身语言能力和思维活动的本质。要实现对汉语文本的正确理解,汉语语义的表示、分析、计算和推理都是不可缺少且亟待解决的手段。本项目结合了面向汉语文本理解的传统方法以及当前流行的深度机器学习方法,以建立有效的高性能汉语语义计算新方法为总体研究目标,从语义表示、语义计算模型和语义推理三个层次展开了研究。本项目创建了一套新的汉语语义计算的理论框架和实现方法,具体说,包括了以下研究成果:(1)创建了基于海量查询日志的中文句法语义知识获取方法、基于跨语言映射的汉语语义知识自动获取方法;(2)创建了基于深度学习和分布式表达的词语、子句、句子层次及面向篇章的语义表示与计算方法,创建了无监督跨语言语义表示学习方法;(3)为解决现有神经机器翻译方法考虑全局信息不足的问题,扩展了面向句子和篇章的上下文语义表示,满足了复杂文本理解需求;(4)完成了基于神经网络与基于特征模版相结合的汉语句法分析方法,构建了汉语功能成分树库(句法逻辑知识库);(5)完成了基于模板的算数应用题理解与推理模型。在上述理论研究基础上,研究实现了基于分布式表示和知识库的中国地理常识问答系统、基于多轮对话的旅行问答机器人、面向医疗咨询的自动问答系统。。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
采用深度学习的铣刀磨损状态预测模型
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
计及焊层疲劳影响的风电变流器IGBT 模块热分析及改进热网络模型
基于关系对齐的汉语虚词抽象语义表示与分析
人类T淋巴细胞白血病1型病毒HBZ蛋白通过抑制C/EBPalpha信号通路促进肿瘤细胞生长的机制研究
面向文本推理的汉语语义计算模型研究
面向短文本理解的带约束语义文法自动学习方法研究
语义指导的汉语理解及词分割
基于语义的汉语新闻文本的零形回指消解研究