期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
《同义词词林》在中文实体关系抽取中的作用 被引量:26
1
作者 刘丹丹 彭成 +1 位作者 钱龙华 周国栋 《中文信息学报》 CSCD 北大核心 2014年第2期91-99,共9页
语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了... 语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了词汇语义信息和实体类型信息之间的冗余性。在ACE2005中文语料库上的关系抽取实验表明,在未知实体类型的前提下,语义信息能显著提高抽取性能;而在已知实体类型的情况下,语义信息也能明显提高某些关系类型的抽取性能,这说明《词林》语义信息和实体类型信息在中文语义关系抽取中具有一定的互补性。 展开更多
关键词 中文实体关系抽取 树核函数 同义词 语义信息
下载PDF
知网与同义词词林的信息融合研究 被引量:28
2
作者 梅立军 周强 +1 位作者 臧路 陈祖舜 《中文信息学报》 CSCD 北大核心 2005年第1期63-70,共8页
本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上... 本文主要探讨了将知网 (HowNet)和同义词词林进行信息融合的方法。我们针对知网对词的概念描述和同义词词林对词的语义分类的特点 ,提出了一种词典信息融合的方法 :首先为词林的每个词集确定一个与知网中DEF类似的概念描述 ,在此基础上对两部词典中同时收录且均只有一个义项的词语进行双向意义联结 ,最后根据分类算法对两部词典中同时收录非单一义项的词语进行双向意义联结。实验表明 ,本文提出的处理策略达到了 93%的信息融合正确率 ,融合后形成的新词典兼有词林的分类学信息和知网的概念描述信息。 展开更多
关键词 计算机应用 中文信息处理 词典信息融合 知网 同义词 分类
下载PDF
基于路径与深度的同义词词林词语相似度计算 被引量:29
3
作者 陈宏朝 李飞 +1 位作者 朱新华 马润聪 《中文信息学报》 CSCD 北大核心 2016年第5期80-88,共9页
该文提出了一种基于路径与深度的同义词词林词语语义相似度计算方法。该方法通过两个词语义项之间的最短路径以及它们的最近公共父结点在层次树中的深度计算出两个词语义项的相似度。在处理两个词语义项的最短路径与其最近公共父结点的... 该文提出了一种基于路径与深度的同义词词林词语语义相似度计算方法。该方法通过两个词语义项之间的最短路径以及它们的最近公共父结点在层次树中的深度计算出两个词语义项的相似度。在处理两个词语义项的最短路径与其最近公共父结点的深度时,为提高路径与深度计算的合理性,为分类树中不同层之间的边赋予不同的权值,同时通过两个义项在其最近公共父结点中的分支间距动态调节词语义项间的最短路径,从而平衡两个词语的相似度。该方法修正了目前相关算法只能得出几个固定的相似度值,所有最近公共父结点处于同一层次的义项对之间的相似度都相同的不合理现象,使词语语义相似度的计算结果更为合理。实验表明,该方法对MC30词对的相似度计算值与人工判定值相比,取得了0.856的皮尔逊相关系数,该结果高于目前大多数词语相似度算法与MC30的相关度。 展开更多
关键词 同义词 路径 深度 分支间距 最近公共父结点
下载PDF
基于同义词词林的文本特征选择与加权研究 被引量:9
4
作者 吕震宇 林永民 +1 位作者 赵爽 朱卫东 《情报杂志》 CSSCI 北大核心 2008年第5期130-132,共3页
特征选择与加权是文本分类的关键问题之一,而噪音与数据稀疏则是特征选择过程中遇到的主要障碍。介绍了一种基于同义词词林的统计与语义相结合的文本特征选择与加权方法。该方法首先对同义词进行合并,将原有的特征提取从词的层面上升到... 特征选择与加权是文本分类的关键问题之一,而噪音与数据稀疏则是特征选择过程中遇到的主要障碍。介绍了一种基于同义词词林的统计与语义相结合的文本特征选择与加权方法。该方法首先对同义词进行合并,将原有的特征提取从词的层面上升到主题概念层面,然后采用词频与相对熵的剩余度的组合TF*Ensu对特征进行加权,强化对分类贡献大的主题特征。实验结果表明,这种方法较之传统方法在特征选择与加权的效果上有明显改善,并能提高文本分类的精度。 展开更多
关键词 文本分类 特征选择 特征加权 同义词
下载PDF
基于同义词词林的词语相似度计算方法 被引量:178
5
作者 田久乐 赵蔚 《吉林大学学报(信息科学版)》 CAS 2010年第6期602-608,共7页
为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点。该算法同时考虑了词语的相似性,和词语的相关性。... 为解决词语相在语义网自适应学习系统中相似度计算不清的问题,以同义词词林为基础,提出并实现了一种基于同义词词林的词语相似度计算方法,充分分析并利用了同义词词林的编码及结构特点。该算法同时考虑了词语的相似性,和词语的相关性。进行人工测试,替换测试以及与当前流行的基于"知网"的词语相似度算法对比测试的结果表明,该算法与人们思维中的相似度值基本一致,有较高的准确性。 展开更多
关键词 词语相似度 同义词 自适应学习系统
下载PDF
基于同义词词林信息特征的语义角色自动标注 被引量:7
6
作者 李国臣 吕雷 +2 位作者 王瑞波 李济洪 李茹 《中文信息学报》 CSCD 北大核心 2016年第1期101-107 114,共8页
该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语... 该文使用同义词词林语义资源库,以词林中编码信息为基础构建新的特征,使用条件随机场模型,研究了汉语框架语义角色的自动标注。该文在先前的基于词、词性、位置、目标词特征的基础上,在模型中加入不同的词林信息特征,以山西大学的汉语框架语义知识库为实验语料,研究了各词林信息特征分别对语义角色边界识别与分类的影响。实验结果表明,词林信息特征可以显著提高语义角色标注的性能,并且主要作用在语义角色分类上。 展开更多
关键词 语义角色标注 同义词 条件随机场 正交表
下载PDF
基于同义词词林的中文文本主题词提取 被引量:11
7
作者 程涛 施水才 +1 位作者 王霞 吕学强 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期145-148,共4页
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下... 中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明。 展开更多
关键词 主题词提取 同义词 权值 同义词
下载PDF
基于同义词词林和规则的中文远程监督人物关系抽取方法 被引量:6
8
作者 谢明鸿 冉强 王红斌 《计算机工程与科学》 CSCD 北大核心 2021年第9期1660-1667,共8页
远程监督是一种根据知识库自动对齐实体进行大规模语料标注的方法,但过强的假设导致获取的语料混有大量的噪声。针对这一问题,提出了一种基于同义词词林和规则的中文远程监督人物关系抽取方法,该方法基于多示例学习思想将人物关系句子... 远程监督是一种根据知识库自动对齐实体进行大规模语料标注的方法,但过强的假设导致获取的语料混有大量的噪声。针对这一问题,提出了一种基于同义词词林和规则的中文远程监督人物关系抽取方法,该方法基于多示例学习思想将人物关系句子划分为包(bag)级,利用同义词词林对人物关系触发词做词频统计,确定最大词频候选关系和次大词频候选关系,再结合特定的人物关系判别规则判断人物关系。对bag判断出某个人物关系后,再对其进一步进行多关系预测,最终得到人物关系预测结果。在大规模的中文远程监督人物关系抽取公开数据集(IPRE)上的实验结果表明,所提方法得到的结果具有较好的F1值,并且能识别远程监督数据测试集标签所没标注出的人物关系。 展开更多
关键词 同义词 规则 远程监督 人物关系 关系抽取
下载PDF
基于《同义词词林》深度的词义相似度计算研究 被引量:13
9
作者 杨泉 孙玉泉 《计算机工程与应用》 CSCD 北大核心 2020年第17期48-54,共7页
针对词义相似度计算问题,在《同义词词林》的基础上,从语言学角度分析了《词林》中词语间的组织关系,阐述了父结点深度对词义相似度的决定性作用。统计了各层结点及原子词群大小的分布情况。提出了仅使用父结点深度的计算模型和父结点... 针对词义相似度计算问题,在《同义词词林》的基础上,从语言学角度分析了《词林》中词语间的组织关系,阐述了父结点深度对词义相似度的决定性作用。统计了各层结点及原子词群大小的分布情况。提出了仅使用父结点深度的计算模型和父结点深度与其分支信息相结合的计算模型。运用上述两种方法的词义相似度计算结果与Miller的人工标注值之间的皮尔逊相关系数达到0.854和0.857,根方误差达到1.003和0.991。 展开更多
关键词 词义相似度 同义词 深度 鱼群算法
下载PDF
基于同义词词林扩展的短文本分类 被引量:9
10
作者 王东 熊世桓 《兰州理工大学学报》 CAS 北大核心 2015年第4期104-108,共5页
针对短文本特征稀疏导致的信息表示能力不足,提出基于同义词词林扩展的短文本分类方法.该方法首先利用同义词词林确定短文本中主干词的同义关系,引入大规模词语搭配资源实现无指导多义词义项判别,从而确定候选扩展特征,最后计算候选扩... 针对短文本特征稀疏导致的信息表示能力不足,提出基于同义词词林扩展的短文本分类方法.该方法首先利用同义词词林确定短文本中主干词的同义关系,引入大规模词语搭配资源实现无指导多义词义项判别,从而确定候选扩展特征,最后计算候选扩展特征与给定上下文的语义关联性,将满足条件的候选特征扩展到特征向量中.实验结果表明,该方法综合考虑的因素较全面,能够有效改善短文本的分类性能. 展开更多
关键词 短文本分类 特征扩展 同义词 搭配词库
下载PDF
一种基于同义词词林的中文大规模本体映射方案 被引量:2
11
作者 王汀 邸瑞华 李维铭 《计算机科学》 CSCD 北大核心 2014年第5期120-123,共4页
本体映射是解决本体异构问题的重要途径和手段,中文知识是网络开放知识库的重要组成部分,但现有的中文本体映射系统在面对大规模本体映射任务时,显得效率较低且可用性不高,目前仍缺乏针对中文大规模本体映射的相关系统。为了解决中文大... 本体映射是解决本体异构问题的重要途径和手段,中文知识是网络开放知识库的重要组成部分,但现有的中文本体映射系统在面对大规模本体映射任务时,显得效率较低且可用性不高,目前仍缺乏针对中文大规模本体映射的相关系统。为了解决中文大规模本体的映射问题,设计并实现了一个面向中文的大规模本体映射系统。首先,提出了一种基于拟核力场势函数的大规模本体压缩方法;其次,提出了一种基于同义词词林的中文概念等价关系确定算法;再次,实现了大规模中文本体映射的原型系统;最后,将本系统与相似度计算相关典型算法进行比较,证明其具备一定的可用性和较高的总体性能。 展开更多
关键词 语义网 本体 本体映射 同义词 相关度计算
下载PDF
基于同义词词林的句子语义相似度方法及其在问答系统中的应用 被引量:13
12
作者 周艳平 李金鹏 蔡素 《计算机应用与软件》 北大核心 2019年第8期65-68,81,共5页
提出一种基于同义词词林的句子语义相似度方法,借助同义词词林来计算句子的词形相似度,使用向量距离法得到句子间的词序相似度。同时,对句子进行语义依存句法分析。通过对词形、词序、语义依存相似度加权结合获得句子之间的最终相似度... 提出一种基于同义词词林的句子语义相似度方法,借助同义词词林来计算句子的词形相似度,使用向量距离法得到句子间的词序相似度。同时,对句子进行语义依存句法分析。通过对词形、词序、语义依存相似度加权结合获得句子之间的最终相似度。将该方法应用于常问问题问答系统(Frequency Asked Questions,FAQ)的问句匹配。实验结果表明,该方法在问句匹配上相比传统方法具有更高的准确率。 展开更多
关键词 问答系统 句子相似度 同义词 语义依存
下载PDF
基于同义词词林的社会化标签等级结构构建研究 被引量:6
13
作者 熊回香 叶佳鑫 《情报杂志》 CSSCI 北大核心 2018年第1期126-131,共6页
[目的/意义]利用同义词词林,挖掘标签间的相互关系,构建标签等级结构,对标签进行规范化控制,从而提高利用标签检索的效率。[方法/过程]首先,按照标签间关系联系的紧密大小对标签间的关系进行了层级划分;随后,通过分析标签与资源的联系强... [目的/意义]利用同义词词林,挖掘标签间的相互关系,构建标签等级结构,对标签进行规范化控制,从而提高利用标签检索的效率。[方法/过程]首先,按照标签间关系联系的紧密大小对标签间的关系进行了层级划分;随后,通过分析标签与资源的联系强度,将标签与关系紧密的资源联系起来;最后,根据标签间及标签与资源的关系来确定标签间的父子关系,构建标签等级结构。[结果/结论]选取了"豆瓣读书"中的实例数据进行实证研究,研究表明,该算法具有一定的可行性和有效性,能够较好地构建标签等级结构。 展开更多
关键词 大众分类 标签 同义词 等级结构
下载PDF
基于Logistic函数的《同义词词林》语义相似度计算 被引量:3
14
作者 杨泉 《计算机与现代化》 2021年第1期111-119,共9页
目前,词语语义相似度计算结果与人工判别结果存在一定差距主要是因为基于知识本体的语义相似度计算一般都是从数学计算的角度直接利用语义分类词典,而没有从词汇学角度充分利用词典中的语言学知识。因而提出运用语义场理论分析《同义词... 目前,词语语义相似度计算结果与人工判别结果存在一定差距主要是因为基于知识本体的语义相似度计算一般都是从数学计算的角度直接利用语义分类词典,而没有从词汇学角度充分利用词典中的语言学知识。因而提出运用语义场理论分析《同义词词林》中词语间的组织关系,阐述深度对语义相似度的决定性作用及分支信息的辅助作用。并且在《词林》深度与分支信息相结合的基础上,提出Logistic函数计算模型。运用上述方法对MC30语义相似度的计算结果与人工标注值之间的皮尔逊相关系数达到0.9540;均方根误差为0.0191;对RG65语义相似度的计算结果与人工标注值之间的皮尔逊相关系数达到0.9434;均方根误差为0.0193。 展开更多
关键词 语义相似度 同义词 深度 Logistic函数
下载PDF
基于同义词词林和《知网》的短语主题提取 被引量:8
15
作者 曾聪 张东站 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第2期263-269,共7页
提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进K最近邻分类算法(KNN)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提... 提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进K最近邻分类算法(KNN)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提出一种根据中文表达习惯的基于加权主题词的短语主题抽取算法.实验结果表明,后两种算法对短语主题抽取效果良好,平均查全率分别达到78.88%和83.39%,平均查准率达99.06%和99.70%. 展开更多
关键词 短语主题 主题抽取 同义词 知网
下载PDF
基于同义词词林的文本特征选择方法 被引量:5
16
作者 郑艳红 张东站 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第2期200-203,共4页
特性选择是文本分类、机器学习以及模式识别领域的重要问题之一.特征选择能在保证数据完整性的情况下减少高维数据的特征维数,同时提高分类的精度.以往提出的基于同义词词林的特征选择方法虽然能有效避免提取出的特征值在概念上的重复性... 特性选择是文本分类、机器学习以及模式识别领域的重要问题之一.特征选择能在保证数据完整性的情况下减少高维数据的特征维数,同时提高分类的精度.以往提出的基于同义词词林的特征选择方法虽然能有效避免提取出的特征值在概念上的重复性,但并未考虑到权值最优的特征向量构成的子集可能并非是最优的.为了解决此问题,结合同义词和遗传算法,提出了一种新的基于同义词词林的文本特征选择方法.该方法首先对特征词进行同义词过滤、合并,在降低特征向量维度的同时避免了同义词带来的影响.然后采用改进的遗传算法选出具有较好适应度值的特征向量.实验结果表明,这种方法较之以往提出的方法,在保证特征选择准确率的基础上能明显地减小特征向量的维度. 展开更多
关键词 特征选择 同义词 遗传算法 文本分类
下载PDF
《同义词词林》的嵌入表示与应用评估 被引量:2
17
作者 段宇光 刘扬 俞士汶 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第6期867-875,共9页
在自然语言处理中,嵌入表示是表达语言知识的重要途径和手段,以《同义词词林》为例,提出基于知识库训练嵌入表示的伪句式构造方法,并在多项任务上测试新方法的有效性.根据《同义词词林》词义编码反映的层级结构,将这些编码扩展为多种伪... 在自然语言处理中,嵌入表示是表达语言知识的重要途径和手段,以《同义词词林》为例,提出基于知识库训练嵌入表示的伪句式构造方法,并在多项任务上测试新方法的有效性.根据《同义词词林》词义编码反映的层级结构,将这些编码扩展为多种伪句式,并据此生成不同的伪语料库,采用word2vec模型在伪语料库上训练义素向量及词向量,得到CiLin2Vec资源,并应用于词义合成、类比推理和词义相似度计算等任务.在词义合成、类比推理任务上的准确率达到90%以上,超过了以往在语料库上训得的结果.证明该方法可以有效地将知识库中的理性知识注入嵌入表示中,也显示了CiLin2Vec嵌入表示资源在应用上的巨大潜力. 展开更多
关键词 同义词 嵌入表示 词义合成 类比推理 相似度
下载PDF
基于知网和同义词词林的词汇语义倾向计算 被引量:5
18
作者 黄硕 周延泉 《软件》 2013年第2期73-74,94,共3页
在互联网飞速发展的今天,海量的数据在网络上共享传输,文本中的情感倾向获取对于文本的处理有着重要作用。而词汇的褒贬倾向研究是文本情感倾向研究的基础。本文基于知网(HowNet)和同义词词林信息融合的方法,为词林的词集添加知网def与... 在互联网飞速发展的今天,海量的数据在网络上共享传输,文本中的情感倾向获取对于文本的处理有着重要作用。而词汇的褒贬倾向研究是文本情感倾向研究的基础。本文基于知网(HowNet)和同义词词林信息融合的方法,为词林的词集添加知网def与情感倾向,进行词汇的语义倾向计算。实验结果表明,该方法更趋于合理,结果更符合人们的日常体验。 展开更多
关键词 情感计算 知网 同义词 语义倾向
下载PDF
类义词典中的两种类型:“同义”与“同类”──《同义词词林》与《朗文多功能分类词典》比较 被引量:4
19
作者 宋婧婧 苏新春 《辞书研究》 北大核心 2004年第4期89-97,共9页
义类单位、义类体系、分类标准 ,是类义词典的核心内容。本文以现代汉语第一部类义词典《同义词词林》与有广泛影响的英语类义词典《朗文多功能分类词典》为比较对象 ,主要对它们的最小一级语义类别进行全面比较 ,得出了它们虽然同属义... 义类单位、义类体系、分类标准 ,是类义词典的核心内容。本文以现代汉语第一部类义词典《同义词词林》与有广泛影响的英语类义词典《朗文多功能分类词典》为比较对象 ,主要对它们的最小一级语义类别进行全面比较 ,得出了它们虽然同属义类词典 ,但有着分类标准为“同义性”与“同类性”的差别。本文还依据语义场理论 ,分析造成它们最小义类差异的原因 ,展望两部词典在词汇学、计算语言学、外语教学及翻译写作等方面的应用前景与研究价值 ,并对编纂对外汉语用的类义词典提出了若干建议。 展开更多
关键词 类义词典 同义词 《朗文多功能分类词典》 语义场理论
下载PDF
基于同义词词林的平滑BLEU研究 被引量:2
20
作者 于俊婷 何宏业 +1 位作者 刘伍颖 易绵竹 《郑州大学学报(理学版)》 CAS 北大核心 2017年第2期54-59,共6页
基于同义词词林提出一种语义空间变换算法,并将其应用于平滑BLEU中,提出一种改进的基于同义词词林的BLEUS评测方法,该方法针对候选译文中短译文或英文缩写可能导致一元语法零匹配的情况,对传统BLEUS的n元语法均进行了平滑处理,并且以参... 基于同义词词林提出一种语义空间变换算法,并将其应用于平滑BLEU中,提出一种改进的基于同义词词林的BLEUS评测方法,该方法针对候选译文中短译文或英文缩写可能导致一元语法零匹配的情况,对传统BLEUS的n元语法均进行了平滑处理,并且以参考译文的一元语法为标准,对候选译文进行语义空间变换.在俄汉双语句子数据集上对谷歌、百度、必应、有道在线翻译系统的俄汉翻译输出译文进行评测,改进方法与传统BLEUS的评测结果一致;基于同义词词林的BLEUS提升传统BLEUS的评测性能,使得百度的NBLEUS值提高了3.99%,谷歌提高了7.66%,必应提高了11.15%,有道提高了4.65%.与此同时,验证了基于同一类型评测方法的纵向比较方法的有效性. 展开更多
关键词 同义词 评测
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部