期刊文献+
共找到239篇文章
< 1 2 12 >
每页显示 20 50 100
中文WordNet的研究及实现 被引量:20
1
作者 张俐 李晶皎 +1 位作者 胡明涵 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期327-329,共3页
提出了一种从英文WordNet转换生成中文WordNet的方法 ,并设计实现了中文WordNet的转换生成系统·论述了在构造中文WordNet的语义网络时 ,概念结点的转换原则 ,中文词形与词义映射关系的重新聚合 ,以及转换生成中文WordNet的可行性... 提出了一种从英文WordNet转换生成中文WordNet的方法 ,并设计实现了中文WordNet的转换生成系统·论述了在构造中文WordNet的语义网络时 ,概念结点的转换原则 ,中文词形与词义映射关系的重新聚合 ,以及转换生成中文WordNet的可行性及转换中的相关问题 。 展开更多
关键词 wordnet 中文wordnet 同义词集合 概念映射
下载PDF
一种基于WordNet的短文本语义相似性算法 被引量:34
2
作者 翟延冬 王康平 +2 位作者 张东娜 黄岚 周春光 《电子学报》 EI CAS CSCD 北大核心 2012年第3期617-620,共4页
短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信... 短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信息来计算短文本的语义相似性.在R&B及Miller数据集上进行实验,实验结果验证了算法的有效性. 展开更多
关键词 短文本语义相似性 wordnet 基于文集的方法
下载PDF
WordNet综述 被引量:33
3
作者 姚天顺 张俐 高竹 《语言文字应用》 CSSCI 北大核心 2001年第1期27-32,共6页
WordNet是一个在线的词典参照系统 ,它是在当前基于人类词汇记忆的心理语言学理论推动下产生的。这个系统中的名词、动词和形容词都聚类为代表某一基本词汇概念的同义词集合 。
关键词 词典参照系统 心理语言学 同义词 wordnet 词汇
下载PDF
基于WordNet和自然语言处理技术的半自动领域本体构建 被引量:15
4
作者 徐力斌 刘宗田 +1 位作者 周文 宋二伟 《计算机科学》 CSCD 北大核心 2007年第6期219-222,共4页
现有的大多数本体都是通过手工构建的,然而,本体的构建是一项非常费时费力的过程,近年来有关如何半自动地构建领域本体的研究越来越多。本文提出了一种基于WordNet和自然语言处理技术的领域本体半自动构建方法,该方法能够大大提高本体... 现有的大多数本体都是通过手工构建的,然而,本体的构建是一项非常费时费力的过程,近年来有关如何半自动地构建领域本体的研究越来越多。本文提出了一种基于WordNet和自然语言处理技术的领域本体半自动构建方法,该方法能够大大提高本体的构建效率,并且一定程度上能够保证结果本体的质量。实验表明,本文的方法在一定程度上令本体的生成过程实现自动化。 展开更多
关键词 领域本体 语义单元 wordnet 自然语言处理
下载PDF
基于边权重的WordNet词语相似度计算 被引量:10
5
作者 郭小华 彭琦 +1 位作者 邓涵 朱新华 《计算机工程与应用》 CSCD 北大核心 2018年第1期172-178,共7页
针对目前词语相似度算法中普遍存在的信息源单一化,计算结果非线性偏高,以及计算性能和效率的不一致的缺陷,提出了一种基于边权重的WordNet词语相似度的计算方法。该方法在路径与深度的基础上,通过边权重改善WordNet结构中的层次不均匀... 针对目前词语相似度算法中普遍存在的信息源单一化,计算结果非线性偏高,以及计算性能和效率的不一致的缺陷,提出了一种基于边权重的WordNet词语相似度的计算方法。该方法在路径与深度的基础上,通过边权重改善WordNet结构中的层次不均匀性,引入编码概念唯一标识两个概念间的相似度,并利用余弦函数修正计算结果的非线性偏差。实验结果表明,对于MC30和RG65测试集,使用该方法计算的词语相似度值与人工判定值计算得到的Pearson相关系数均达到0.87;此外,该方法在计算性能和效率上均保持较高水平。 展开更多
关键词 词语相似度 边权重 wordnet 编码
下载PDF
基于WordNet的中泰文跨语言文本相似度计算 被引量:12
6
作者 石杰 周兰江 +1 位作者 线岩团 余正涛 《中文信息学报》 CSCD 北大核心 2016年第4期65-70,共6页
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该... 文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该文提出一种基于WordNet的中泰文跨语言文本相似度的计算方法。首先对中泰文本进行预处理和特征选择,然后利用语义词典WordNet将中泰文本转换成中间层语言,最后在中间层上计算中泰文本的相似度。实验结果表明,该方法准确率达到82%。 展开更多
关键词 wordnet 中间层语言 跨语言文本相似度
下载PDF
基于Wordnet关系数据库的专利本体半自动构建研究 被引量:6
7
作者 吴鹏 马文虎 严明 《情报学报》 CSSCI 北大核心 2011年第6期598-604,共7页
专利本体满足用户对专利信息系统检索的语义需求,但是目前缺乏有效的构建方法,基于WordNet关系数据库的本体构建方法可以根据领域概念直接从关系数据库中获得实体的关系,并扩展原有的领域概念,实现专利领域本体的半自动构建。本文提出... 专利本体满足用户对专利信息系统检索的语义需求,但是目前缺乏有效的构建方法,基于WordNet关系数据库的本体构建方法可以根据领域概念直接从关系数据库中获得实体的关系,并扩展原有的领域概念,实现专利领域本体的半自动构建。本文提出了一种基于WordNet关系数据库的本体半自动构建方法,其核心思想是以WordNet关系数据库为主要知识来源,来生成可被本体工具编辑的OWL格式文件,包括两个部分:专利本体数据库半自动构建系统和基于关系数据库本体生成器,本文分析了专利本体数据库半自动构建系统模型,以及专利本体生成与转换流程,并结合实例进行专利本体的构建和应用。 展开更多
关键词 wordnet 专利本体 关系发现 概念发现
下载PDF
基于WordNet概念向量空间模型的文本分类 被引量:16
8
作者 张剑 李春平 《计算机工程与应用》 CSCD 北大核心 2006年第4期174-178,共5页
文章提出了一种文本特征提取方法,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,建立文本的概念向量空间模型作为文本特征向量,使得在训练过程中能够提取出代表类别的高层次信息。实验结果表... 文章提出了一种文本特征提取方法,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,建立文本的概念向量空间模型作为文本特征向量,使得在训练过程中能够提取出代表类别的高层次信息。实验结果表明,当训练文本集合很小时,方法能够较大地提高文本的分类准确率。 展开更多
关键词 文本自动分类 wordnet 概念向量 向量空间模型
下载PDF
WordNet中基于IC的概念语义相似度算法 被引量:5
9
作者 王艳娜 周子力 何艳 《计算机工程》 CAS CSCD 北大核心 2011年第22期42-44,共3页
提出一种计算WordNet中概念间语义相似度的算法,该算法同时考虑概念的信息内容(IC)以及2个概念在WordNet is_a关系分类树中的距离信息,由此提高算法性能。给出一种计算概念IC值的新方法,通过考虑概念的子节点数及概念所处WordNet分类树... 提出一种计算WordNet中概念间语义相似度的算法,该算法同时考虑概念的信息内容(IC)以及2个概念在WordNet is_a关系分类树中的距离信息,由此提高算法性能。给出一种计算概念IC值的新方法,通过考虑概念的子节点数及概念所处WordNet分类树中的深度,使计算结果更精确。与其他5种语义相似度算法的比较结果表明,该算法能够求得更准确的相似度。 展开更多
关键词 信息内容 wordnet本体 语义相似度 子节点 分类树
下载PDF
基于WordNet重用的领域本体构建方法 被引量:11
10
作者 赵天忠 苗壮 +2 位作者 张亚非 徐伟光 陆建江 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第19期4583-4586,4598,共5页
构建本体是开发基于语义信息系统的重要步骤,提出了一种基于WordNet重用的领域本体构建方法。该方法分析了WordNet的结构和语义关系,将WordNet抽象为图模型,从中抽取以领域术语为节点的子图,得到一个领域子本体,再利用编辑工具对其进行... 构建本体是开发基于语义信息系统的重要步骤,提出了一种基于WordNet重用的领域本体构建方法。该方法分析了WordNet的结构和语义关系,将WordNet抽象为图模型,从中抽取以领域术语为节点的子图,得到一个领域子本体,再利用编辑工具对其进行修改和完善。实验结果表明,该方法可以重用WordNet的结构并从中获取领域知识,并半自动地快速构建领域本体。 展开更多
关键词 wordnet 本体 重用 图模型
下载PDF
基于中文WordNet的中英文词语相似度计算 被引量:21
11
作者 吴思颖 吴扬扬 《郑州大学学报(理学版)》 CAS 北大核心 2010年第2期66-69,共4页
介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算... 介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算英-英、汉-英、汉-汉词语之间相似度的算法,所得结果比较符合人们对词语的理解. 展开更多
关键词 中文wordnet 词语相似度 语义相似度
下载PDF
基于WordNet的无导词义消歧方法 被引量:6
12
作者 王瑞琴 孔繁胜 潘俊 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第4期732-737,共6页
有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性... 有导词义消歧机器学习方法由于需要大量人力进行词义标注,难以适用于大规模词义消歧任务.提出一种避免人工词义标注的无导消歧方法.该方法综合利用WordNet知识库中的多种知识源(包括:词义定义描述、使用实例、结构化语义关系、领域属性等)描述歧义词的词义信息,生成词义的"代表词汇集"和"领域代表词汇集",结合词汇的词频分布信息和所处的上下文环境进行词义判定.利用通用测试集Senseval-3对6个典型的无导词义消歧方法进行开放实验,该方法取得平均正确率为49.93%的消歧结果. 展开更多
关键词 词义消歧 wordnet知识库 结构化语义关系
下载PDF
FrameNet、WordNet、VerbNet比较研究 被引量:10
13
作者 贾君枝 董刚 《情报科学》 CSSCI 北大核心 2007年第11期1682-1686,共5页
FrameNet、WordNet、VerbNet作为语义型词典,在自然语言处理及其电子词典编纂领域得到广泛应用。这三种语义类型的词典各自从不同侧面表达词汇概念及语义关系,彼此之间互为补充,并且建立相互之间的映射,共同为语义分析提供了丰富知识资... FrameNet、WordNet、VerbNet作为语义型词典,在自然语言处理及其电子词典编纂领域得到广泛应用。这三种语义类型的词典各自从不同侧面表达词汇概念及语义关系,彼此之间互为补充,并且建立相互之间的映射,共同为语义分析提供了丰富知识资源。但这些语义型词典构建理论基础不同,形成各自明显的特征,因此文章从理论基础、组织结构、语义关系、应用范围四个层面上对这三种语义词典进行具体比较分析,明确其各自侧重点及差异,以帮助词典使用者及语言信息处理人员更好地应用。 展开更多
关键词 FRAMENET wordnet VerbNet 比较研究
下载PDF
基于WordNet的关联数据本体映射研究 被引量:7
14
作者 潘有能 刘朝霞 《情报杂志》 CSSCI 北大核心 2013年第2期99-102,共4页
随着越来越多的数据集以关联数据的形式发布到数据网络中,不同数据集之间的本体映射成为当前的研究热点。本文以WordNet为基础,通过对从数据网络中获取的XML格式的本体文档进行解析以获取待映射概念,并建立待映射概念节点的父概念树和... 随着越来越多的数据集以关联数据的形式发布到数据网络中,不同数据集之间的本体映射成为当前的研究热点。本文以WordNet为基础,通过对从数据网络中获取的XML格式的本体文档进行解析以获取待映射概念,并建立待映射概念节点的父概念树和子概念树并计算其相似度,提出了一种新的关联数据本体映射方法。 展开更多
关键词 关联数据 本体映射 wordnet DOM 相似度计算 概念树
下载PDF
WNCT:一种WordNet概念自动翻译方法 被引量:6
15
作者 王石 曹存根 《中文信息学报》 CSCD 北大核心 2009年第4期63-70,94,共9页
WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分... WordNet是在自然语言处理领域有重要作用的英语词汇知识库,该文提出了一种将WordNet中词汇概念自动翻译为中文的方法。首先,利用电子词典和术语翻译工具将英语词汇在义项的粒度上翻译为中文;其次,将特定概念中词汇的正确义项选择看作分类问题,归纳出基于翻译唯一性、概念内和概念间翻译交集、中文短语结构规则,以及基于PMI的翻译相关性共12个特征,训练分类模型实现正确义项的选择。实验结果表明,该方法对WordNet 3.0中概念翻译的覆盖率为85.21%,准确率为81.37%。 展开更多
关键词 人工智能 机器翻译 wordnet翻译 词汇翻译 翻译消歧 中文词汇知识库 中文信息处理
下载PDF
WordNet与BNC介入下的第二语言心理词汇联系模式实证研究 被引量:4
16
作者 李小撒 王文宇 《语言科学》 CSSCI 北大核心 2016年第1期74-84,共11页
文章旨在通过词汇联想测试手段探索中国英语学习者心理词汇的联系模式。八十四名美国与中国大学生分别独立完成英语词汇联想测试。数据收集结束后,研究者借助WordNet及BNC对联想测试的反应词加以分类。研究结果表明:第一,英语本族语者... 文章旨在通过词汇联想测试手段探索中国英语学习者心理词汇的联系模式。八十四名美国与中国大学生分别独立完成英语词汇联想测试。数据收集结束后,研究者借助WordNet及BNC对联想测试的反应词加以分类。研究结果表明:第一,英语本族语者纵聚合联系、横组合联系与百科式联系呈逐级递减态势,而学习者这三种联系则呈现U型态势,横组合联系比例偏低,并且横组合联系词整体提取速度较慢;第二,高水平学习者纵聚合词汇联系的比例显著高于中等水平的学习者,而两组学习者的横组合联系却没有显著差异,这在某种程度上验证了语言间概念共享节点远多于搭配共享节点。 展开更多
关键词 心理词汇 wordnet BNC 纵聚合联系 横组合联系
下载PDF
融合WordNet的无监督语义分析研究 被引量:2
17
作者 杨博 蔡东风 +1 位作者 赵奇猛 杨华 《小型微型计算机系统》 CSCD 北大核心 2014年第2期368-373,共6页
应用机器学习方法处理机器阅读的相关任务是人工智能的长远目标,但通常需要大量的人工监督操作.研究一种无监督学习在机器阅读的一个主要任务-语义分析中的应用,这种无监督方法得益于统计关系学习统一框架-Markov逻辑网.鉴于该方法通过... 应用机器学习方法处理机器阅读的相关任务是人工智能的长远目标,但通常需要大量的人工监督操作.研究一种无监督学习在机器阅读的一个主要任务-语义分析中的应用,这种无监督方法得益于统计关系学习统一框架-Markov逻辑网.鉴于该方法通过依存句法信息无法解析语义分析中普遍存在的反义词、词形变化等语言现象,该文融合WordNet进行改进,促进概念的抽取及合并,并将机器阅读的主要目标-问答作为评价手段,结果表明这种WordNet词典与无监督机器学习相结合的方法可更好地进行语义分析,并且问答正确率可提高至90.6%. 展开更多
关键词 MARKOV逻辑网 无监督学习 开放式信息抽取 wordnet
下载PDF
基于WordNet与Wikipedia的平面几何本体的构建 被引量:1
18
作者 符红光 刘莉 +2 位作者 钟秀琴 蒋彦 孙媛媛 《电子科技大学学报》 EI CAS CSCD 北大核心 2014年第4期575-580,共6页
针对目前本体构建中存在的如手工构建难以确保高效性和可扩展性,且自动构建难度大,可操作性不强等研究现状,提出了一种基于WordNet和Wikipedia的学科领域本体半自动构建方法。首先构建一个领域顶层本体,在此基础上,重用WordNet的结构,... 针对目前本体构建中存在的如手工构建难以确保高效性和可扩展性,且自动构建难度大,可操作性不强等研究现状,提出了一种基于WordNet和Wikipedia的学科领域本体半自动构建方法。首先构建一个领域顶层本体,在此基础上,重用WordNet的结构,从深度上对其进行术语和术语层次的扩展;同时根据Wikipedia中的页面信息,从广度上对其进行术语间关系的扩展和术语的补充;并将该本体构建方法应用于平面几何领域。实验表明该方法能大大提高本体构建的效率,并在一定程度上保证了本体的质量。 展开更多
关键词 领域本体 半自动构建 维基百科 wordnet
下载PDF
WordNet和词向量相结合的句子检索方法 被引量:3
19
作者 刘欣 席耀一 +1 位作者 王波 魏晗 《信息工程大学学报》 2017年第4期486-491,共6页
针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一... 针对当前句子检索方法中因数据稀疏而存在的"词不匹配"问题,提出了一种Word Net和词向量相结合的句子检索方法。首先在Word Net语义关系图中应用个性化PageRank算法计算与查询项最相关的同义词集合,实现查询项扩展,从而在一定程度上解决了查询项数据稀疏的问题;然后利用在大规模语料中训练神经网络语言模型获取的词向量对查询项和句子进行表示;最后引入WMD(word mover's distance)计算查询项与句子的语义相似度,从而利用语义信息进一步降低"词不匹配"问题带来的影响,将句子按相似度值从高到低排序作为句子检索结果。文章方法在TREC2003和TREC2004会议的项目中进行评测,MAP和R-Precision值相较于次优结果分别提高了13.29%和13.54%。 展开更多
关键词 wordnet 查询项扩展 词向量 语义相似度 句子检索
下载PDF
基于wordNet的类别可拓展网页分类系统(英文) 被引量:1
20
作者 彭小刚 明仲 +1 位作者 王海涛 周景洲 《深圳大学学报(理工版)》 EI CAS 北大核心 2009年第2期116-120,共5页
基于文本写作常采用一个意思由多个不同写法的单词来表述,研究词义文本分类法被用来替代使用关键词分类算法以提高分类准确率.分析wordNet内Synset架构,认为一个兼顾词义以及词义间关系的词义文本分类系统可应用到网页分类中.该系统同... 基于文本写作常采用一个意思由多个不同写法的单词来表述,研究词义文本分类法被用来替代使用关键词分类算法以提高分类准确率.分析wordNet内Synset架构,认为一个兼顾词义以及词义间关系的词义文本分类系统可应用到网页分类中.该系统同时注意到固定的文本类别结构以及结构内不断增长的文件数目间的区别,加入了基于类别信息聚类方法的类别拓展的功能.仿真实验证明,该分类系统与现有的基于语义的分类系统相比,在分类准确度性能上能提高13%.基于类别信息类聚的文本拓展功能与采用基于相似度的类聚方法的系统相比获得了一个质量更高的新增类别. 展开更多
关键词 信息提取 网页分类 wordnet 基于词义分类 类别拓展
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部