一种基于语义关系图的词语语义相关度计算模型被引量：10

A Model for Calculating Semantic Relatedness of Words Considering Semantic Relationship Graph

下载PDF

导出

摘要词语的语义计算是自然语言处理领域的重要问题之一,目前的研究主要集中在词语语义的相似度计算方面,对词语语义的相关度计算方法研究不够.为此,本文提出了一种基于语义词典和语料库相结合的词语语义相关度计算模型.首先,以HowNet和大规模语料库为基础,制定了相关的语义关系提取规则,抽取了大量的语义依存关系;然后,以语义关系三元组为存储形式,构建了语义关系图;最后,采用图论的相关理论,对语义关系图中的语义关系进行处理,设计了一个基于语义关系图的词语语义相关度计算模型.实验结果表明,本文提出的模型在词语语义相关度计算方面具有较好的效果,在Word Similarity-353数据集上的斯皮尔曼等级相关系数达到了0.5358,显著地提升了中文词语语义相关度的计算效果. Word semantic computation is one of the important issues in nature language processing. Current studies usually focus on semantic similarity computation of words, not paying enough attention to the semantic relatedness computation. For this reason, we present a word semantic relatedness calculation model based on semantic dictionary and corpus. First of all, the semantic extraction rules are formulated with ＂HowNet＂ and corpus, and a large number of semantic dependency relations are extracted based on these rules. Then, a semantic relationship graph is constructed by storing the semantic relationship triplet tuple. At last, graph theory is used to process the semantic relation in the semantic relationship graph and a semantic relatedness calculation model is designed by means of the semantic relationship graph. Experimental results show that this method has a better performance in word semantic relatedness computation, the Spearman rank correlation on the WordSimilarity-353 dataset being up to 0.5358, a significant efficiency improvement of semantic relatedness computation of Chinese words.

作者张仰森郑佳李佳媛

机构地区北京信息科技大学智能信息处理研究所

出处《自动化学报》 EI CSCD 北大核心 2018年第1期87-98,共12页 Acta Automatica Sinica

基金国家自然科学基金(61370139 61602044)资助~~

关键词语义相关度语义关系图 HOWNET 依存语义关系语义相似度 Semantic relatedness, semantic relationship graph, HowNet, dependency semantic relation, semantic similarity

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1田萱,杜小勇,李海华.语义查询扩展中词语-概念相关度的计算[J].软件学报,2008,19(8):2043-2053. 被引量：51
2万富强,吴云芳.基于中文维基百科的词语语义相关度计算[J].中文信息学报,2013,27(6):31-37. 被引量：9
3刘康,张元哲,纪国良,来斯惟,赵军.基于表示学习的知识库问答研究进展与展望[J].自动化学报,2016,42(6):807-818. 被引量：27
4汪祥,贾焰,周斌,丁兆云,梁政.基于中文维基百科链接结构与分类体系的语义相关度计算[J].小型微型计算机系统,2011,32(11):2237-2242. 被引量：18
5郑丽娟,邵艳秋,杨尔弘.中文非投射语义依存现象分析研究[J].中文信息学报,2014,28(6):41-47. 被引量：7
6张沪寅,刘道波,温春艳.基于《知网》的词语语义相似度改进算法研究[J].计算机工程,2015,41(2):151-156. 被引量：22
7王宏显,周强,邬晓钧.《知网》语义关系图的自动构建[J].中文信息学报,2008,22(5):90-96. 被引量：4
8辛宇,谢志强,杨静.基于话题概率模型的语义社区发现方法研究[J].自动化学报,2015,41(10):1693-1710. 被引量：1

二级参考文献212

1张敏,宋睿华,马少平.基于语义关系查询扩展的文档重构方法[J].计算机学报,2004,27(10):1395-1401. 被引量：55
2许云,樊孝忠,张锋.基于知网的语义相关度计算[J].北京理工大学学报,2005,25(5):411-414. 被引量：53
3袁晓峰.《知网》义原相似度计算的研究[J].辽宁大学学报（自然科学版）,2011,38(4):358-361. 被引量：5
4赵鹏,蔡庆生.一种基于《知网》的中文文本聚类算法的研究[J].计算机工程与应用,2007,43(12):162-163. 被引量：7
5李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：106
6Philip Resnik. Using information content to evaluate semantic simi- larity in a taxonomy [A]. In: C. Raymond Perrault, Chris S. Mellish, Renato deMori eds. Proceedings of the 14th International Joint Conference on Artificial InteUigence [ C]. Montreal: AAAI Press, 1995:448-453.
7George A Miller. WordNet: a lexical database for english [ C].Communications of the ACM, 1995:38( 11 ) :39-41.
8Ted Pedersen, Siddharth Patwardhan, Jason Michelizzi. WordNet: similarity: measuring the relatedness of concepts [ C ]. In: David Palmer, Joseph Polifroni, Deb Roy, eds. Proc. of Human Lan- guage Tectmology conference. Montteal: Association for Computa- tional Linguistics, 2004:38-41.
9Li Yun. Mining semantic knowledge from chinese Wikipedia [D]. Beijing University of Posts and Telecommunications,2009.
10Evgeniy Gabrilovich, Shaul Markovitch. Computing semantic relat edness using Wikipedia-based explicit semantic analysis [ A]. InI Manuela Veloso. Proceedings of the 20th International Joint Confe1 ence on Artificial Intelligence [ C ]. Hyderabad: AAAI Press 2007 : 1606-1611.

共引文献127

1田钟林,吴旭,颉夏青,许晋,陆月明.一种基于领域语义关系图的短文本实时分析模型[J].数据分析与知识发现,2020,4(2):239-247.
2张琳,胡杰,应力,浦丽娜.汉语问答系统概念查询扩展研究[J].郑州大学学报（理学版）,2009,41(1):69-72. 被引量：1
3王瑞琴,孔繁胜.基于无导词义消歧的语义查询扩展[J].情报学报,2011,30(2):131-137. 被引量：4
4郭艳阳,王圆圆.电子政务领域基于本体的智能信息检索研究[J].中国科技信息,2009(6):109-111.
5张玉连,刘娟,齐峰,周兴林.基于摘要和日志中相关词共现策略的移动查询扩展[J].现代图书情报技术,2009(10):40-44. 被引量：2
6胡哲,朱强.基于本体的查询扩展研究[J].电脑知识与技术,2010(02Z):1025-1026. 被引量：2
7赵应秋,罗军,张君艳.基于知网的词语语义相关度计算[J].信息技术,2010,34(3):90-93. 被引量：6
8王志晓,张大陆,王玉红,王东.P2P语义搜索研究进展[J].计算机科学,2010,37(4):21-26. 被引量：1
9王昭龙,李霞,许瑞芳.多关键字查询中LCA剪枝概念树的查询扩展技术研究[J].计算机科学,2010,37(4):132-135. 被引量：4
10霍林,王力,黄俊文,潘英花.一种结合同义词典和词对共现距离的查询扩展方法[J].广西大学学报（自然科学版）,2010,35(2):303-309. 被引量：5

同被引文献85

1陈振亚,徐建民,吴树芳.利用术语本体关系扩展SBN检索模型[J].计算机研究与发展,2013,50(S1):257-263. 被引量：1
2高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
3徐建民,陈振亚,白彦霞.利用查询术语同义词关系扩展信念网络检索模型[J].情报学报,2008,27(3):363-368. 被引量：6
4王宏显,周强,邬晓钧.《知网》语义关系图的自动构建[J].中文信息学报,2008,22(5):90-96. 被引量：4
5徐建民,王平.小型中文信息检索测试集的构建与分析[J].情报杂志,2009,28(1):13-16. 被引量：13
6曹亦薇,杨晨.使用潜语义分析的汉语作文自动评分研究[J].考试研究,2007,3(1):63-71. 被引量：24
7黄名选,严小卫,张师超.基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J].软件学报,2009,20(7):1854-1865. 被引量：70
8李卫疆,赵铁军,王宪刚.基于上下文的查询扩展[J].计算机研究与发展,2010,47(2):300-304. 被引量：32
9蒋昌金,彭宏,陈建超,马千里,严桂夺.基于组合词和同义词集的关键词提取算法[J].计算机应用研究,2010,27(8):2853-2856. 被引量：18
10徐建民,崔琰,刘清江.基于同义词关系改进的局部共现查询扩展[J].情报杂志,2010,29(9):145-147. 被引量：3

引证文献10

1田钟林,吴旭,颉夏青,许晋,陆月明.一种基于领域语义关系图的短文本实时分析模型[J].数据分析与知识发现,2020,4(2):239-247.
2罗枭.基于深度学习的自然语言处理研究综述[J].智能计算机与应用,2020(4):133-137. 被引量：13
3翟社平,李兆兆,段宏宇,李婧,董迪迪.多特征融合的句子语义相似度计算方法[J].计算机工程与设计,2019,40(10):2867-2873. 被引量：14
4金鹏,杨菁,王宗伟,刘鲲鹏,卜晓阳,ZHENG Xuan.一种基于最小距离编辑法的模糊地址识别模型[J].电力大数据,2019,22(10):9-15. 被引量：3
5徐建民,何丹丹,吴树芳.基于文档关系的扩展信念网络检索模型[J].情报学报,2019,38(11):1160-1165. 被引量：3
6何丹丹,吴树芳,徐建民.基于文档关系改进的向量空间模型[J].河北大学学报（自然科学版）,2020,40(3):322-327. 被引量：5
7尤丛丛,高盛祥,余正涛,毛存礼,潘润海.基于同义词数据增强的汉越神经机器翻译方法[J].计算机工程与科学,2021,43(8):1497-1502. 被引量：11
8荣维东,李自然.智能写作评价及其技术发展[J].中小学数字化教学,2021(9):5-9.
9梅蓉,张友能.基于“编译原理”课程的在线答疑系统设计与实现[J].通化师范学院学报,2022,43(2):110-117. 被引量：1
10赵小虎,蔡长煦.基于农田墒情监测的轻量级语义传感网络[J].湖南大学学报（自然科学版）,2023,50(8):181-193.

二级引证文献50

1刘洋,刘明利,王伟.基于决策偏好逼近的网络数据安全稳态评估分析[J].科技通报,2023,39(2):30-33.
2何丹丹,吴树芳,徐建民.基于文档关系改进的向量空间模型[J].河北大学学报（自然科学版）,2020,40(3):322-327. 被引量：5
3李凡,白尚旺,党伟超,潘理虎.基于Do-Bi-LSTM模型的电子政务文本相似度评估模型[J].计算机与现代化,2020,0(7):71-75. 被引量：1
4宗祥瑞,王洋,金尧,周斌,任新颜,庞玉志.基于FaceNet的无人值守变电站智能监控终端[J].电力大数据,2020,23(7):1-8. 被引量：2
5付鹏斌,杨广越,杨惠荣.结合学科同义词与词向量的相似度评分算法[J].计算机工程与设计,2020,41(12):3390-3396. 被引量：3
6巫奕君,秦永红.基于相似度模型的英语机器翻译研究[J].现代科学仪器,2020(6):159-162. 被引量：1
7赵梓超,黄浩.基于Word2vec技术的主流媒体新闻报道主题研究[J].科学大众（科技创新）,2020(12):218-220.
8周钦强,李建勇,王明辉,陈冰怀.基于相似度排名的天气雷达故障案例检索[J].广东气象,2021,43(2):73-77.
9韩志恒.浅析深度学习在自然语言处理NLP中的应用[J].电子元器件与信息技术,2020,4(11):46-47. 被引量：2
10杨延娇,赵国涛,王丕栋.基于语义与情感的句子相似度计算方法[J].计算机工程与应用,2021,57(16):151-158. 被引量：1

1荆琪,段利国,李爱萍,赵谦.基于维基百科的短文本相关度计算[J].计算机工程,2018,44(2):197-202. 被引量：7
2沈冰.试析“并”字句的句法结构[J].海南广播电视大学学报,2017,18(3):30-35. 被引量：1
3宋佳,高少华,杨杰,诸云强.科技资源元数据的关联与推荐方法[J].中国科技资源导刊,2017,49(5):37-44. 被引量：3
4李静纯.谈谈概念关系图[J].小学教学设计（英语）,2018,0(2):1-1.
5李志明.政治体制改革必须同经济体制改革相互配合[J].中共山西省委党校学报,2000,23(3):25-26. 被引量：1
6项本武.论国际依存深化条件下发展中国家的制度安排[J].党政干部论坛,2002,0(10):32-34.
7张振梅,刘明,毕利,高玉琢.基于HowNet查询扩展方法的探究[J].计算机应用与软件,2018,35(3):27-31. 被引量：1
8单瑞华.试议“知敬畏”生态理念新内涵[J].经济师,2018(3):43-43.
9YUAN Lichi.A New Word Clustering Algorithm Based on Word Similarity[J].Chinese Journal of Electronics,2017,26(6):1221-1226. 被引量：2
10全国知识图谱与语义计算大会(CCKS 2017)在四川成都隆重召开[J].中文信息学报,2017,31(5):113-113.

自动化学报

2018年第1期

浏览历史

内容加载中请稍等...

一种基于语义关系图的词语语义相关度计算模型被引量：10

参考文献8

二级参考文献212

共引文献127

同被引文献85

引证文献10

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

一种基于语义关系图的词语语义相关度计算模型 被引量：10

参考文献8

二级参考文献212

共引文献127

同被引文献85

引证文献10

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

一种基于语义关系图的词语语义相关度计算模型被引量：10