-
题名基于《知网》的词语相似度计算
- 1
-
-
作者
薛慧芳
-
机构
西安外事学院
-
出处
《商情》
2011年第18期136-136,142,共2页
-
文摘
词语相似度计算是计算机中文处理中的基础和重要环节,目前基于《知网》的词语相似度计算是一种常见的方法,本文将对该方法做系统介绍。
-
关键词
《知网》
词语相似度计算
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名融合HowNet和词林信息含量的词语相似度计算
被引量:1
- 2
-
-
作者
陈靖元
周刚
卢记仓
-
机构
郑州大学中原网络安全研究院
数学工程与先进计算国家重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第6期1303-1308,共6页
-
基金
国家自然科学基金项目(U1736214)资助
河南科技攻关项目(192102210129)资助.
-
文摘
目前基于信息含量的中文词语相似度算法普遍使用单一的知识库,存在信息不完备的问题.本文在现有的基于HowNet信息含量的词语相似度算法和基于同义词词林信息含量的词语相似度算法基础上,改进了信息含量的计算方法,并根据词语的不同分布情况将两种算法进行动态融合,充分利用了HowNet和同义词词林中的体系结构信息,改善了现有方法的局限性.经Miller&Charles(MC30)数据集测评,该算法所得到的词语相似度值与人工判定值之间的皮尔森相关系数为0.927,验证了融合多知识库策略的可行性,也证明了本文方法在实用方面可以达到符合人类主观判断的效果.
-
关键词
HOWNET
同义词词林
信息含量
词语相似度计算
-
Keywords
HowNet
CiLin
IC(information content)
word similarity algorithms
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义构词的汉语词语语义相似度计算
被引量:3
- 3
-
-
作者
康司辰
刘扬
-
机构
北京大学中国语言文学系
北京大学计算语言教育部重点实验室
北京大学计算语言学研究所
-
出处
《中文信息学报》
CSCD
北大核心
2017年第1期94-101,111,共9页
-
基金
国家社科基金(16BYY137)
国家社科基金(12&ZD119)
国家重点基础研究发展计划资助项目(2014CB340504)
-
文摘
汉语词语语义相似度计算,在中文信息处理的多种应用中扮演至关重要的角色。基于汉语字本位的思想,我们采用词类、构词结构、语素义等汉语语义构词知识,以"语素概念"为基础,计算汉语词语语义相似度。这种词义知识表示简单、直观、易于拓展,计算模型简洁、易懂,采用了尽可能少的特征和参数。实验表明,该文方法在典型"取样词对"上的表现突出,其数值更符合人类的感性认知,且在全局数据上也表现出了合理的分布规律。
-
关键词
词语语义相似度计算
语义构词
词义知识表示
语素概念
-
Keywords
Chinese word similarity computing
Chinese semantic word-formation
lexical knowledge representation
morphemic concepts
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于词向量与框架语义分析的句子相似度计算方法
被引量:2
- 4
-
-
作者
刘馨婷
蔡晓东
-
机构
桂林电子科技大学计算机与信息安全学院
桂林电子科技大学信息与通信学院
-
出处
《桂林电子科技大学学报》
2017年第6期494-497,共4页
-
基金
广西科学研究与技术开发计划(AB16380264)
物联网技术与产业化推进协同创新中心创新创业人才培养项目(WLW200601)
-
文摘
针对现有的汉语句子相似度计算方法不能完整地分析出句子的语义特征的问题,提出了一种基于词向量与框架语义分析的句子相似度计算方法。用搜狗语料对Word2vec模型进行训练,得到词向量词典,并通过查询该词典得到句子特征向量;采用语义框架对句子进行全面的语义刻画,计算句子中每个框架元素特征向量之间的相似度,通过相似度计算法则,得到句子相似度。实验分析结果表明,与现有的基于框架语义分析的句子相似度计算方法相比,本方法能够显著提高句子相似度计算的准确性。
-
关键词
框架语义分析
词向量
词语相似度计算
句子相似度计算
-
Keywords
semantic frame analysis
word vector
word similarity calculation
sentence similarity calculation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词语相似度技术在离境退税系统中的应用研究
被引量:1
- 5
-
-
作者
王培元
-
机构
浪潮软件集团有限公司
-
出处
《信息技术与信息化》
2018年第2期150-152,共3页
-
文摘
随着中国全面实施境外旅客离境退税政策,越来越多的境外旅客前往我国旅游购物。离境退税的基本流程包括退税商店开具退税申请单、海关验核确认、代理机构退税办理三个环节。目前境外旅客在海关处验核确认时经常发生购买的商品属于海关限制或禁止携带出境的物品,这主要由于退税商店申请单开具的工作人员对海关物品出境政策不了解,难以准确把握商品是否能够出境。本文旨在通过引入词语相似度计算,在离境退税系统增加海关验核确认信息反馈机制,逐步完善商品风险库,退税商店工作人员在开具退税申请单时,系统自动通过词语相似度计算匹配商品风险库,系统自动提示存在风险疑点的物品,这样不仅提升了开单的准确性,还提高了服务质量。
-
关键词
离境退税
词语相似度计算
反馈机制
-
分类号
F812.42
[经济管理—财政学]
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名中文关键词-主题词自动映射方法研究综述
被引量:2
- 6
-
-
作者
孙海霞
吴英杰
李军莲
李丹亚
-
机构
中国医学科学院医学信息研究所
-
出处
《医学信息学杂志》
CAS
2012年第3期47-52,共6页
-
基金
中国医学科学院医学信息研究所基本科研业务专项"基于CMeSH的中文生物医学文献文本概念映射研究"(项目编号:10R0115)
-
文摘
阐述关键词-主题词映射的基本内涵和主要实现方式,综述近10年主要中文关键词-主题词自动映射方法,包括基于词汇相似度的方法、基于词汇共现的方法、基于规则的方法、基于信息检索的方法和基于链接的方法。
-
关键词
互操作
自动映射
同义词识别
词语相似度计算
-
Keywords
Interoperability Automatic mapping Recognition of synonyms Words similarity measuring
-
分类号
G354
[文化科学—情报学]
-
-
题名基于自然语言处理的主观题智能阅卷技术
被引量:3
- 7
-
-
作者
柏雪
-
机构
西南交通大学信息科学与技术学院
-
出处
《计算机光盘软件与应用》
2013年第7期47-48,共2页
-
文摘
本文主要探讨使用自然语言处理技术来实现主观题智能阅卷的方法,使用到的关键技术包括分词、句法分析、词语相似度计算以及句子相似度计算。文章对如何使用这些关键技术来实现主观题智能阅卷系统进行了详细的阐述。
-
关键词
智能阅卷
分词
词语相似度计算
句子相似度计算
-
分类号
TP391.7
[自动化与计算机技术—计算机应用技术]
-
-
题名统一智能搜索处理技术的研究与应用
被引量:2
- 8
-
-
作者
许宇华
黄倩云
-
机构
广东电网公司珠海供电局
-
出处
《自动化与仪器仪表》
2017年第5期144-146,共3页
-
文摘
随着新的科学技术层出不穷,供电服务的远程渠道也趋向多元化。本文将探索统一智能搜索处理技术在供电企业远程服务渠道上的应用方式,为完成精益化管理供电企业远程服务渠道奠定坚实的技术根底。远程服务渠道统一智能搜索处理技术除能提供快速检索、相关度排序之外,还结合自然语言的智能处理,快速地检索出对用户而言最有价值最感兴趣的信息。通过对四大技术要点,即信息辅助抽取、词语相似度计算、分词及关键词维护以及基于Lucene搜索引擎来说明统一智能搜索处理技术在远程服务渠道统一运营管理平台上的应用。
-
关键词
统一智能搜索
信息辅助抽取
词语相似度计算
分词及关键词维护
基于Lucene搜索引擎
-
Keywords
unified intelligent search
auxiliary information extraction
word similarity calculation
word segmentation andkeywords maintenance
engine based on Lucene
-
分类号
TM73
[电气工程—电力系统及自动化]
-