期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
词典多义词义项关系与词义区分 被引量:7
1
作者 肖航 《云南师范大学学报(哲学社会科学版)》 CSSCI 2010年第1期41-46,共6页
从为语料库标注多义词词义的实践来看,词典普遍存在词义可区分性不足的情况。根据对《现代汉语词典》的分析,本文认为词典中多义词的义项之间存在重叠、相离、包含等关系,这些关系对词义的准确区分带来不利影响,具体表现为词义区分线索... 从为语料库标注多义词词义的实践来看,词典普遍存在词义可区分性不足的情况。根据对《现代汉语词典》的分析,本文认为词典中多义词的义项之间存在重叠、相离、包含等关系,这些关系对词义的准确区分带来不利影响,具体表现为词义区分线索不足、义项缺失等形式,降低了词义区分的准确率和可操作性。本文结合词义标注语料数据对这些表现分别进行了分析,指出厘清多义词义项之间的关系、改善词义可区分性能够提高词义消歧的准确率,同时有助于提高词典编纂的质量。 展开更多
关键词 义项划分 词义区分 词义标注 多义词 语料库
下载PDF
汉语形容词的自动词义区分研究 被引量:1
2
作者 朱虹 刘扬 俞士汶 《中文信息学报》 CSCD 北大核心 2009年第6期19-25,共7页
词义知识获取是词义知识库建设、词义消歧等任务的基础和起点,目前该工作基本依赖人类专家的智慧和洞察力,在大规模文本处理上缺乏意义计算的客观性和一致性。该文以汉语的中高频形容词为样本,深入挖掘词义特征并采用有参数初始化过程... 词义知识获取是词义知识库建设、词义消歧等任务的基础和起点,目前该工作基本依赖人类专家的智慧和洞察力,在大规模文本处理上缺乏意义计算的客观性和一致性。该文以汉语的中高频形容词为样本,深入挖掘词义特征并采用有参数初始化过程的EM迭代算法,实现了从真实文本中自动发现并区分词语词义的过程。该词义区分算法选取易获取的词形特征、基于大规模语料的搭配特征、基于网络语料的属性—宿主关系特征,替代以往难以获取的句法结构特征,并进一步利用HowNet优化了词形特征的选择。该工作可以应用于信息检索等领域,能够对现有词典起到修改和补充的作用,该思路亦可扩展到其他汉语词类上去。 展开更多
关键词 计算机应用 中文信息处理 知识获取 词义区分 特征选择 EM算法
下载PDF
基于词典的语料库词义标注研究 被引量:4
3
作者 肖航 杨丽姣 《语言文字应用》 CSSCI 北大核心 2010年第2期135-141,共7页
本文从主要难点、可实现性等方面对基于词典的语料库词义标注进行了分析。词义标注的主要难点可归纳为两个,一是词典词义区分不清晰带来的标注不一致性,二是词典提供的词义不能覆盖语料库中词语的所有语言使用情况。这些困难导致语料库... 本文从主要难点、可实现性等方面对基于词典的语料库词义标注进行了分析。词义标注的主要难点可归纳为两个,一是词典词义区分不清晰带来的标注不一致性,二是词典提供的词义不能覆盖语料库中词语的所有语言使用情况。这些困难导致语料库词义标注存在可实现与否的争论。本文通过华语文教材语料库词义标注实践指出,仅从词典词义划分来看,词义的准确区分具有操作上的明显困难;但若考虑词义在语料库中具体使用与分布,高准确率的词义标注是可以实现的。 展开更多
关键词 词义标注 词义消歧 词义区分 语料库标注
下载PDF
词义消歧相关术语简介 被引量:1
4
作者 吴云芳 《术语标准化与信息技术》 2010年第3期18-20,24,共4页
词义消歧是计算语言学领域的基础性关键研究课题。本文介绍了与词义消歧相关的一些重要术语概念,包括词义消歧、词义区分、基于词典的词义消歧方法、有监督的词义消歧方法、词义标注语料库等。
关键词 词义消歧 词义区分 有监督的词义消歧方法 词义标注语料库
下载PDF
有关词义分类的几点思考
5
作者 马壮寰 《北京第二外国语学院学报》 2012年第2期1-6,共6页
作为语义学的重要部分,对词义的研究通常以词义分类或区分开始。如何区分词义一直是一个有争论的、开放的议题。本文主要针对被普遍接受的sense与reference(或sense与denotation)的二项对立中的sense加以某些诠释并对sense"完全是... 作为语义学的重要部分,对词义的研究通常以词义分类或区分开始。如何区分词义一直是一个有争论的、开放的议题。本文主要针对被普遍接受的sense与reference(或sense与denotation)的二项对立中的sense加以某些诠释并对sense"完全是语言内部的"这一界定进行了一定批评性思考。 展开更多
关键词 词义 词义区分 SENSE 语言内部的
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部