一种基于《知网》的文本语义相似度的计算方法被引量：4

A Method of Computing the Semantic Similarity of Sentences Based on HowNet

下载PDF

导出

摘要论文提出一个基于语义的文本间的相似度算法,以文本的特征词相似度为基础,来计算文本间的相似度,利用聚类算法对文本簇进行聚类。实验结果证明基于知网的文本语义相似度方法在对文本相似度计算以及文本聚类方面,能有效提高聚类的效果。 A similarity algorithm based on semantic similarity is proposed,which calculates the similarity of texts according to feature words of the text and makes text clusters by employing clustering algorithm.The experimental results prove that the method of text semantic similarity based on CNKI is very efficient in text similarity calculation and text clustering,which can effectively improve the effect of clustering.

作者孙滨刘林

机构地区郑州华信学院信息工程系

出处《计算机与数字工程》 2014年第2期187-189,209,共4页 Computer & Digital Engineering

基金河南省教育厅科学技术研究重点项目(编号:12B520063)资助

关键词文本聚类义原相似度语义相似度 text clustering primitive similarity semantic similarity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1刘群;李素建.基于《知网》的词汇语义相似度的计算[A]中国台北,2002.
2Pandya A,Bhattacharyya P. Text similarity measurement using concept representation of texts[A].Berlin,Germ any:Springer,2005.678-689.
3Rodriguez M A,Egenhofer M J. Determining Semantic Similarity Among Entity Classes from Different Ontologies[J].{H}IEEE Transactions on Knowledge and Data Engineering,2003,(02):442-456.
4Budanitsky A,Hirst G. Evaluating Word Net-based Measures of Lexical Semantic Relatedness[J].{H}COMPUTATIONAL LINGUISTICS,2006,(01):13-47.
5Giunhiglia F,Shvaiko P,Yatskevich M. Semantic Schema Matching[R].Trento,Italy:University of Trento,2005.
6王晓东,郭雷,方俊,董淑福.一种基于EMD的文档语义相似性度量[J].电子与信息学报,2008,30(9):2156-2161. 被引量：3
7江敏,肖诗斌,王弘蔚,施水才.一种改进的基于《知网》的词语语义相似度计算[J].中文信息学报,2008,22(5):84-89. 被引量：106
8吴雅娟,陈尧,尚福华.一种新的基于相似度计算的本体映射算法[J].计算机应用研究,2009,26(3):870-872. 被引量：11
9徐茜,彭进业,李展.本体映射中一种综合的概念相似度计算方法[J].计算机工程与应用,2010,46(24):34-36. 被引量：6
10高炜,梁立.一种改进的基于相似度的本体映射方法[J].甘肃联合大学学报（自然科学版）,2009,23(5):59-63. 被引量：5

二级参考文献47

1梁敏,郭新涛,阮备军,朱扬勇.X_Dist——一个柔性语义距离函数[J].计算机研究与发展,2004,41(10):1728-1736. 被引量：2
2夏天,樊孝忠,刘林,骆正华.基于ALICE的汉语自然语言接口[J].北京理工大学学报,2004,24(10):885-889. 被引量：11
3吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
4朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
5程勇,黄河,邱莉榕,史忠植.一个基于相似度计算的动态多维概念映射算法[J].小型微型计算机系统,2006,27(6):975-979. 被引量：27
6何娟,高志强,陆青健,瞿裕忠.基于词汇相似度的元素级本体匹配[J].计算机工程,2006,32(16):185-187. 被引量：25
7聂朝晖,王英林.相似本体间属性映射方法的研究[J].计算机仿真,2006,23(9):133-135. 被引量：7
8徐德智,肖文芳,王怀民.本体映射过程中的概念相似度计算[J].计算机工程与应用,2007,43(9):167-169. 被引量：16
9李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：105
10曹泽文,钱杰,张维明,邓苏.一种综合的概念相似度计算方法[J].计算机科学,2007,34(3):174-175. 被引量：35

共引文献124

1张培颖.基于句子特征和语义距离的文本摘要技术[J].微计算机应用,2009,30(7):14-18. 被引量：3
2杨昱昺,吴贤伟.改进的基于知网词汇语义褒贬倾向性计算[J].计算机工程与应用,2009,45(21):91-93. 被引量：15
3蒋溢,丁优,熊安萍,王化晶.一种基于知网的词汇语义相似度改进计算方法[J].重庆邮电大学学报（自然科学版）,2009,21(4):533-537. 被引量：22
4黎明.基于本体串连的XML语义发现和查询的研究[J].四川师范大学学报（自然科学版）,2010,33(1):132-136.
5赵应秋,罗军,张君艳.基于知网的词语语义相关度计算[J].信息技术,2010,34(3):90-93. 被引量：6
6吴奎,周献中,王建宇,赵佳宝.基于贝叶斯估计的概念语义相似度算法[J].中文信息学报,2010,24(2):52-57. 被引量：12
7张振幸,李金厚.一种基于义原重合度的词语相似度计算[J].信阳师范学院学报（自然科学版）,2010,23(2):296-299. 被引量：4
8刘汉兴,刘财兴,林旭东.基于问句相似度的本体问答系统[J].广西师范大学学报（自然科学版）,2010,28(1):88-91. 被引量：4
9谈文蓉,冯山,刘莉.语义分析在汉语相似性文献检测中的应用研究[J].四川师范大学学报（自然科学版）,2010,33(4):554-558. 被引量：1
10安峰,谢强,丁秋林.基于Ontology的专家系统研究[J].计算机工程,2010,36(13):167-169. 被引量：7

同被引文献54

1吴菲菲,李倩,黄鲁成.基于专利SAO结构的技术应用领域识别方法研究[J].科研管理,2014,35(6):1-7. 被引量：27
2吴菲菲,杨梓,黄鲁成.基于创新性和学科交叉性的研究前沿探测模型——以智能材料领域研究前沿探测为例[J].科学学研究,2015,33(1):11-20. 被引量：48
3金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量：79
4刘群,李素建.基于《知网》的词汇语义相似度计算[J].中文计算语言学,2002,7(2):59-76.
5Henry S, Kevin W. B, Richard K. Identifying emerging topics in science and technology [ J ]. Research Policy, 2014,43(8) :1450 - 1467.
6Garfield E. Historiographic mapping of knowledge do- mains literature [ J 1. Journal of Information Science, 2004, 30(2) :119 - 145.
7Small H. Tracking and predicting growth areas in sci- ence [ J ]. Seientomitrics, 2006, 68 ( 3 ) :595 - 6 lO.
8Wolfgang G. Bibliometric methods for detecting and an- alysing emerging research topics [ J]. El Profesional De La Informacion, 2012, (21) :194 -201.
9Hanning G, Scott W, Katy B. Mixed- indicators model for identifying emerging research areas [ J ]. Scientomet- rics, 2011, 89(1) :421 -435.
10Yi - Ning Tu, Jia - Lang Seng. Indices of novelty for e- merging topic detection [ J ]. Information Processing & Management, 2012, 48(2): 303-325.

引证文献4

1朱宝华.基于HowNet的用户兴趣挖掘研究及应用[J].计算机与数字工程,2014,42(10):1949-1951. 被引量：1
2黄鲁成,张璐,吴菲菲,唐月强.基于突现文献和SAO相似度的新兴主题识别研究[J].科学学研究,2016,34(6):814-821. 被引量：25
3赵谦,荆琪,李爱萍,段利国.一种基于语义与句法结构的短文本相似度计算方法[J].计算机工程与科学,2018,40(7):1287-1294. 被引量：17
4门业堃,钱梦迪,于钊,滕景竹,陈少坤,颜旭.基于检索重排序模型的文本差异化研究[J].电测与仪表,2023,60(1):57-63.

二级引证文献43

1周波,冷伏海.技术识别研究进展[J].情报学进展,2022(1):315-348. 被引量：4
2秦瑞,方乐,俞敏.文本分析方法在医学研究中的应用进展[J].浙江预防医学,2015,27(10):1008-1011. 被引量：2
3杨超,朱东华,衡晓帆,汪雪锋.基于语法树的SAO结构识别方法研究[J].图书情报工作,2016,60(21):113-121. 被引量：5
4程结晶,丁慢慢,朱彦君.国外信息管理领域知识流的新兴趋势及可视化分析[J].现代情报,2017,37(4):170-177. 被引量：18
5张思凤,梁梦丽,曹高辉.基于引文的科技文献主题抽取研究[J].情报理论与实践,2017,40(6):122-127. 被引量：7
6段庆锋,潘小换.利用社交媒体识别学科新兴主题研究[J].情报学报,2017,36(12):1216-1223. 被引量：21
7徐路路,王效岳,白如江.基于PLDA模型与多数据源融合相关性分析的新兴主题探测研究——以石墨烯领域为例[J].情报理论与实践,2018,41(4):63-69. 被引量：25
8王坤,王京安,汤月,校姜文.基于专利和科技论文的技术机会识别研究——以金属3D打印技术为例[J].科技管理研究,2018,38(7):73-79. 被引量：14
9隗玲,许海云,刘春江,李婧,方曙.技术领域主题发现研究——以基因工程疫苗领域为例[J].数字图书馆论坛,2017(1):37-45. 被引量：5
10徐建国,李孟军,游翰霖.新兴技术识别研究进展[J].情报杂志,2018,37(12):8-12. 被引量：20

1孙建旺,吕学强,张雷瀚.基于语义与最大匹配度的短文本分类研究[J].计算机工程与设计,2013,34(10):3613-3618. 被引量：18
2秦添轶,林蝉,宋博宇,关毅.一种实体描述短文本相似度计算方法[J].智能计算机与应用,2015,5(2):34-37. 被引量：3
3孙润志,于放.基于《知网》的词语相似度计算方法[J].计算机系统应用,2015,24(7):155-158. 被引量：1
4刘卫红.基于非功能语义的语义Web服务匹配方法研究[J].微型电脑应用,2008,24(7):20-22.
5刘影,陈立,宋自林,董庆超,陈兴华,朱卫星,何继贤.一种改进的基于本体概念相似度计算方法研究[J].南京邮电大学学报（自然科学版）,2011,31(6):60-66. 被引量：1
6黄高峰,周学广,李娟,刘华.具有权重因子的细粒度情感词库构建方法[J].计算机工程,2014,40(11):211-214. 被引量：4
7刘燕美,李华.基于语义的词语相似度算法研究[J].世界科技研究与发展,2012,34(4):617-620.
8张沪寅,刘道波,温春艳.基于《知网》的词语语义相似度改进算法研究[J].计算机工程,2015,41(2):151-156. 被引量：22
9韩兴邦,毛峡.一种改进的词义相似度算法[J].中国科技论文,2016,11(2):202-207. 被引量：1
10袁晓峰.《知网》义原相似度计算的研究[J].辽宁大学学报（自然科学版）,2011,38(4):358-361. 被引量：5

计算机与数字工程

2014年第2期

浏览历史

内容加载中请稍等...

一种基于《知网》的文本语义相似度的计算方法被引量：4

参考文献10

二级参考文献47

共引文献124

同被引文献54

引证文献4

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

一种基于《知网》的文本语义相似度的计算方法 被引量：4

参考文献10

二级参考文献47

共引文献124

同被引文献54

引证文献4

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

一种基于《知网》的文本语义相似度的计算方法被引量：4