24 research outputs found
融合篇章结构位置编码的神经机器翻译
现有的文档级神经机器翻译方法在翻译一个句子时大多只利用文档的上下文词汇信息,而忽视了跨句子的篇章语义单元之间的结构关系。针对此问题,提出了多种篇章结构位置编码策略,利用基于修辞结构理论的篇章树结构,对篇章树上位于不同篇章单元的单词之间的位置关系进行了表示。实验表明,通过位置编码的方式,在基于Transformer框架的神经机器翻译模型中有效地融合了源端的篇章结构信息,译文质量得到了显著提升
利用上下文相似度增强词对齐效果的自然语言推理方法
当前的自然语言推理方法在进行词对齐时往往只关注如何利用上下文信息改善词汇的表示,而忽略了上下文相似度对词汇对齐的帮助。推理方法在融合局部判定信息进行结果预测时,通常赋予局部判定信息相同的权重,而实际上不同词汇对应的局部判定信息对最终结果具有不同的影响。因此,提出一种通过增强词对齐性能改善自然语言推理性能的方法,该方法在词对齐时同时考虑词汇的词义相似度和上下文相似度,并且利用选择门机制对不同的局部判定信息进行加权。实验表明,该方法能够获得与当前最优的模型相当的准确率,而且该方法更加符合人脑推理判定行为过程,且具有很好的可解释性
Opportunities and Challenges for Machine Translation Research in China —Summary and Prospects for the Eighth China Workshop on Machine Translation
随着统计方法逐渐成为机器翻译研究的主流,机器翻译系统评测的分值越来越高,人们对机器翻译的信心和期望逐渐增加,社会对机器翻译应用的需求也越来越大.然而,现有的机器翻译理论和方法在系统性能上提升的空间逐渐减小,而且距离用户实际需求仍有很长的路要走.那么,面对期望、面对需求,机器翻译之路应该如何走?为此,第八届全国机器翻译研讨会对当前机器翻译研究所面临的挑战和机遇进行了深入研讨.该文详细介绍了该次研讨会六个专题的讨论情况,对机器翻译研究面临的机遇和挑战进行了认真的分析和总结.In recent years,statistical based methods have been dominating the research and application of machine translation(MT).Meanwhile,the higher and higher evaluation scores for MT campaigns raise peoples confidence and expectations,which results in an increasing demand for high-quality MT systems.However,on one hand,it is difficult to have a big breakthrough on the MT theories and methodology in terms of translation quality;on the other hand,current practical systems cannot fully meet userssatisfaction.Where and how should we go forward?Therefore, the Eighth China Workshop on Machine Translation(CWMT)is held to carry out a comprehensive and indepth discussion on challenges and opportunities for current MT research.This paper details the six MT sessions, analyzes and concludes the key points and important findings
Language cognition and language computation — human and ma chine language understanding
语言理解是认知科学和计算机科学交叉领域共同关心的问题,但两个学科在选择具体研究问题时却十分不同.认知科学领域的研究侧重解析大脑的工作机制,更多地关注于描述大脑对语言的响应,缺乏对大脑语言功能整体化、系统化的研究,而计算机科学家在选择研究问题时重点关注实际应用效能,往往忽略了对语言最本质规律的研究.那么,如何实现两种思路的交叉融合,为智能语言计算模型的构建和语言认知机理的研究带来新的机遇和启发呢?本文首先简要回顾了认知科学和计算机科学在语言理解方向上的研究问题、发展历程和研究方法,重点阐述研究现状和面临的挑战,之后对比认知科学和计算机科学领域对于语言理解问题的主要观点,分析两者之间的异同.最后对现有语言认知和语言计算两个领域的交叉融合方法进行归纳和总结,并对未来发展趋势予以展望.</p
Language cognition and language computation &mdash; human and machine language understanding
中国森林生物多样性监测:科学基础与执行计划
中国森林生物多样性保护和恢复措施的制订依赖于生物多样性的监测信息。设计一个有效的生物多样性监测网络是一项复杂的系统工程。监测网络的设计框架可分为监测目标、监测对象、监测指标、取样策略、数据采集和处理、网络维护以及组织工作等几个部分。目前,国际上已有5个得到广泛认可的生物多样性监测网络,包括地球观测组织–生物多样性监测网络、全球森林监测网络、热带生态评估与监测网络、泛欧洲森林监测网络和亚马逊森林清查网络,它们的监测目标、监测内容和方法、样地布局及部分监测成果各有特色。我们试图在全国生物多样性监测、森林资源清查和森林生态系统定位研究的基础上,通过网络布局、建设和运行,形成中国森林生物多样性监测网(Chinese Forest Biodiversity Monitoring Network,Sino BON-CFor Bio)及其监测规范体系。该网络的科学目标是,在全国尺度上研究不同典型地带性森林的生物多样性维持机制、监测森林生物多样性变化并阐明其机理、研究生物多样性变化的效应。该网络布局以《中国植被区划》中的森林植被区划成果作为顶层设计和监测样地选择的核心依据,设计了4个层级的监测系统;其监测指标体系以生物多样性核心指标为主,并结合我国传统森林群落调查方法进行拓展;预期建成国家水平上的森林生物多样性监测网络,阐明森林生物多样性维持机制和生物多样性变化的效应,同时对重大生态保护工程的生物多样性保护效果进行有效性监测和验证型监测
