-
题名基于语境的语义排歧方法
被引量:13
- 1
-
-
作者
郑杰
茅于杭
董清富
-
机构
清华大学自动化系
-
出处
《中文信息学报》
CSCD
北大核心
2000年第5期1-7,15,共8页
-
文摘
本文针对英汉机器翻译系统 (ECMT)中的语义排歧问题 ,提出了一种根据单词与语境之间的关系以消除单词语义歧义的模型。该模型利用反映单词之间语义共现关系的知识库词典 ,对有歧义的单词作出排歧。为提高知识库的覆盖率 ,本模型在对大量语料进行分析的基础上建立起单词语义分类之间的相关程度矩阵 ,同时采用动态链表来表示和维护语境 ,给出了寻找歧义单词的最可能的语义的排歧算法。开放测试的实验结果表明本方法使语义排歧的正确率提高约 1 0 %。
-
关键词
自然语言处理
语义排歧
机器翻译
语境
ECMT
-
Keywords
natural language processing
word sense tagging
machine translation
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名基于义类同现频率的汉语语义排歧方法
被引量:4
- 2
-
-
作者
张永奎
张国清
-
机构
山西大学计算机科学系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第7期892-896,共5页
-
基金
国家自然科学基金
山西省留学归国人员基金
-
文摘
义类标注是信息检索和自然语言处理中的一个重要问题.但依靠人工对义类进行标注不仅是一个十分烦琐的工作,而且很难把握标准.因此,对义类代码自动标注的研究就显得尤为迫切,而要实现自动标注,必须解决多义词排歧这一重要问题.在对《现代汉语词典》(以下简称《词典》)的义类标注过程中,文中通过统计相邻词语义类组合串的出现频率构造了一个同现频率矩阵集.这一同现频率矩阵集充分利用了义类体系的层次结构,极大地减少了数据稀疏和数据冗余.在此基础上,对《词典》中的多义词进行了排歧,结果较为满意.
-
关键词
义类代码串
汉语语义排歧法
自然语言处理
-
Keywords
co occurrence frequency matrix, sense code combination(SCC)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名共现语境特征对情态动词语义排歧的限制作用
被引量:1
- 3
-
-
作者
于建平
孙亚楠
孙锐
张涛
洪文学
-
机构
燕山大学建筑学院外国语学院
天津大学建筑学院王学仲艺术研究所
燕山大学信息科学与工程学院
燕山大学电气工程学院
-
出处
《江苏科技大学学报(自然科学版)》
CAS
2019年第6期60-67,共8页
-
基金
教育部人文社会科学规划基金项目(19YJA740076)
河北省社科基金项目(HB17YY047)
-
文摘
情态动词具有非常复杂的语义系统.情态动词的意义是其词汇基本意义与语境因素相互作用的结果.因此,语境对于情态动词的意义识别和语义排歧都具有重要的互动限制作用.文中基于形式概念分析理论和属性偏序图方法,以英语情态动词can为例,研究了共现语境特征对英语情态动词语义排歧的限制作用;将语境特征划分为言内语境和言外语境两部分,言内语境包括12个语义特征和6个共现的句法特征;言外语境选取了7个情景语境特征;构建了表达情态动词can不同语义的对象与语境特征属性关系的形势背景,并以生成的可视化属性偏序结构图作为语义排歧和知识发现的模型;排歧正确率达91.33%;基于该模型发现了对can的语义排歧限制作用大的属性特征.文中研究结果为语义排歧和自然语言处理中的特征选择提供了重要的实践依据.
-
关键词
英语情态动词can
语境特征
语义排歧
属性偏序图
-
Keywords
English modal verb can
contextual feature
word sense disambiguation
attribute partial-ordered structure diagram
-
分类号
H087
[语言文字—语言学]
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于神经网络的语境特征对must语义排歧影响研究
- 4
-
-
作者
于建平
付继林
白塔娜
徐学萍
-
机构
燕山大学外国语学院
燕山大学里仁学院英语系
-
出处
《软件导刊》
2020年第5期33-36,共4页
-
基金
河北省社会科学基金项目(HB17YY047)。
-
文摘
英语情态动词的一词多义给自然语言处理带来了很大困难。情态动词语义对语境很敏感,发现影响情态动词语义的主要语境因素对情态动词特征选择、机器翻译等都十分重要。因此,采用神经网络技术对英语情态动词进行语义排歧,并确定不同语境特征对语义排歧结果的影响。基于一个100万字的语料库,以英语情态动词must为例,从语境中提取影响must语义的语义特征和句法特征,计算并确定这些特征向量值,建立可区分根情态与认识情态语义的BP神经网络,排歧正确率达到94%。在此基础上,通过实验研究确定不同语境特征对情态动词must语义排歧的影响程度等级。该研究结果为情态动词语义排歧及情态动词语义人工识别提供了重要依据。
-
关键词
神经网络
英语情态动词
语义排歧
语境特征
-
Keywords
neural network
English modal
word sense disambiguation
contextual feature
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名机器翻译语义排歧的方法
被引量:9
- 5
-
-
作者
鲁孝贤
-
机构
上海理工大学外语学院
-
出处
《中国科技翻译》
北大核心
2007年第4期22-25,共4页
-
文摘
常用的排歧方法过于追求词义变化规律的普遍性和排歧方法的通用性,而忽略了多义词词义变化是没有什么普遍规律可言的事实,所以不能最终解决语义排歧的难题。要提高排歧效率就必须在深入研究语义变化一般规律的同时,研究每个多义词词义变化的特殊规律,选择何种排歧方法要因词而异,这样才能提高排歧效率。
-
关键词
机器翻译
语义排歧
多义词
排歧方法
-
Keywords
machine translation disambiguation
-
分类号
H085
[语言文字—语言学]
-
-
题名关于英语情态动词语义排歧中的知识发现分析
- 6
-
-
作者
黄雪梅
-
机构
湖南科技学院外国语学院
-
出处
《新丝路》
2020年第7期190-190,195,共2页
-
基金
2018年湖南科技学院科研课题《“如果”违实条件句的情态动词研究》,项目编号:18XKY020。
-
文摘
自然语言中存在着歧义,这是语言领域存在的普遍现象。根据语义、语法等因素,判断歧义词词义,这个过程就是语义排歧。语义排歧在自然语言中十分不易,是语言学研究重点问题。随着语言学发展,语义排歧也得到不断的进步。本文以英语情态动词作为排歧对象进行语义排歧,并探讨语义排歧中的知识发现,利用观念分析的方式,探究语义排歧中的知识发现框架,便于其他自然语言领域应用。
-
关键词
歧义
语义排歧
知识发现
-
分类号
C
[社会学]
-
-
题名基于规则的机器翻译技术综述
被引量:8
- 7
-
-
作者
袁小于
-
机构
重庆师范大学数学学院
-
出处
《重庆文理学院学报(自然科学版)》
2011年第3期56-59,共4页
-
文摘
回顾基于规则的机器翻译中的文本处理、文本分析、词典构成、词典查询和语义排歧技术,指出基于规则的机器翻译因为词义选择、层次切分、特殊句型结构等固有难题难以圆满解决,只有发展新的翻译技术,才能使机器翻译质量达到实用水平.
-
关键词
机器翻译
文本分析
词典构成
语义排歧
-
Keywords
machine translation
text analysis
dictionary constitutes
semantic disambiguation
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-