基于概念间边权重的概念相似性计算方法被引量：9

Concept similarity computation method based on edge weighting between concepts

下载PDF

导出

摘要介绍了传统的基于距离的相似度计算方法,针对其在距离计算中包含语义信息不充足的现状,提出了一种改进的使用WordNet的基于概念之间边的权重的相似性度量方法。该方法综合考虑了概念在词库中所处层次的深度和密度,即概念的语义丰富程度,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题。实验结果表明,所提方法在Rubenstein数据集上与人工判断有着0.910 9的相关性,与其他经典的相似性计算方法相比有着更高的准确性。 The traditional distance-based similarity calculation method was described.Concerning that the method of distance calculation does not contain sufficient semantic information,this paper proposed an improved method which used WordNet and edge weighting information between the concepts to measure the similarity.It considered the level of depth and density of concepts in corpus,i.e.the semantic richness of concept.Using this method,the authors can solve the semantic similarity calculation issues and make the calculation of similarity among concepts easy.The experimental results show that,the proposed method has a 0.910 9 correlation with the benchmark data set-Rubenstein concept pairs.Compared with the classical method,the proposed method has higher accuracy.

作者冯永张洋

机构地区重庆大学计算机学院信息物理社会可信服务计算教育部重点实验室(重庆大学)

出处《计算机应用》 CSCD 北大核心 2012年第1期202-205,共4页 journal of Computer Applications

基金国家自然科学基金资助项目(61103114) 重庆市高等教育教学改革研究重点项目(112023) "211工程"三期建设项目(S-10218) 中央高校基本科研业务基金资助项目(CDJXS11181164)

关键词概念相似度计算 WORDNET 边权重语义信息 concept similarity calculation WordNet edge weight semantic information

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1FELLBAUM C. WordNet: An electronic lexical database [M]. Cambridge, MA: MIT Press, 1998.
2RADA R, MILI H, BICHNELL E, et al. Development and application of a metric on semantic nets [ J]. IEEE Transactions on Systems, Man, and Cybernetics, 1989, 9(1): 17-30.
3WU Z, PALMER M. Verb semantics and lexical selection [ C]// Proceedings of the 32nd Annual Meeting of the Association for Computational Linguistics. Stroudsburg: Association for Computational Linguistics, 1994:133-138.
4LEACOCK C, CHODOROW M. Combining local context and Word- Net similarity for word sense identification [ M]// WordNet: An electronic lexical database. Cambridge, MA: MIT Press, 1998:265 - 283.
5LI Y, BANDAR Z A, MCLEAN D. An approach for measuring semantic similarity between words using muhiple information sources [J]. IEEE Transactions on Knowledge and Data Engineering, 2003, 15(4): 871-882.
6AL-MUBAID H, NGUYEN H A. A cluster-based approach for semantic similarity in the biomedical domain [ C]//Proceedings of the IEEE Engineering in Medicine and Biology Society. New York: IEEE Press, 2006:2713 -2717.
7LIND. An information-theoretic definition of similarity [ C]// Proceedings of the 15th International Conference on Machine Learning. San Francisco: Morgan Kaufmann, 1998:296-304.
8JIANG J, CONRATH D. Semantic similarity based on corpus statistics and lexical taxonomy [ C ]// Proceedings of the International Conference on Research in Computational Linguistics. Cambridge, MA: MIT Press, 1997:19-33.
9SECO N, VEALE T, HAYES J. An intrinsic information content metric for semantic similarity in WordNet [C]// Proceedings of the 16th European Conference on Artificial Intelligence. Amsterdam: IOS Press, 2004:1089 - 1090.
10RUBENSTEIN H, GOODENOUGH J B. Contextual correlates of synonymy [J]. Communications of the ACM, 1965, 8(10) : 627 - 633.

同被引文献108

1余飞,周文莉,阚家义,彭灿.11种盐酸小檗碱片剂在不同溶出度介质中溶出度曲线特征的比较[J].Journal of Chinese Pharmaceutical Sciences,2020,29(2):102-112. 被引量：3
2刘清飞,王义明,罗国安.多指标定量指纹图谱用于中药复方缓释制剂体外释放度的评价[J].中国中药杂志,2009,34(2):143-147. 被引量：24
3王茜,杨莉云,杨德礼.面向用户偏好的属性值评分分布协同过滤算法[J].系统工程学报,2010,25(4):561-568. 被引量：24
4蔡虹,许晓雯.我国技术知识存量的构成与国际比较研究[J].研究与发展管理,2005,17(4):15-20. 被引量：37
5张婷婷,徐文,胡生亮,何仲贵.水飞蓟宾在不同介质中平衡溶解度和表观油水分配系数的测定[J].中国药学杂志,2006,41(20):1569-1571. 被引量：48
6潘星,王君,刘鲁.一种基于概念聚类的知识地图模型[J].系统工程理论与实践,2007,27(2):126-132. 被引量：22
7刘平峰,聂规划,陈冬林.语义网技术在电子商务中的应用研究[J].情报杂志,2007,26(3):98-100. 被引量：5
8席运江,党延忠.基于加权知识网络的组织知识存量表示与度量[J].科学学研究,2007,25(3):493-497. 被引量：13
9LIU H Z, BAO H, XU D. Concept vector for semantic similarity and relatedness based on WordNet structure [ J ]. The Journal of Systems and Software, 2012 ( 85 ) : 370 - 381.
10NIE G H, ZHANG B. The design and implementation on Chinese E - ecommerce semantic lexicon ECNET [ C ]//2008 International Conference on Computer Sci- ence and Software Engineering. [ S. 1. ]: [s. n. ], 2008:753 - 755.

引证文献9

1刘平峰,朱孔真,聂规划.中文数字家庭语义词典的构建与应用研究[J].武汉理工大学学报（信息与管理工程版）,2013,35(2):232-235.
2刘丹,贾晓斌,萧伟.质量分数权重系数法表征银杏内酯组分溶解性及表观油水分配系数的探讨[J].中国中药杂志,2013,38(12):1865-1870. 被引量：18
3刘丹,贾晓斌,萧伟.质量权重系数整合法表征整体银杏黄酮组分在水中及不同pH磷酸盐缓冲液中的平衡溶解度[J].中国中药杂志,2013,38(12):1871-1875. 被引量：9
4张自慧,江敬尧.基于本体的教育资源语义检索研究[J].智能计算机与应用,2014,4(6):28-30. 被引量：1
5张威,刘嘉,杨海军,朱粉霞,朱劲华.多组分中药整体性质的表征研究概述[J].中医药信息,2015,32(2):125-126. 被引量：7
6高长元,杨雨佳,何晓燕,张树臣.云环境下IT产业联盟知识存量测度研究[J].情报科学,2016,34(4):124-128. 被引量：1
7盛艳梅,周子力,马淑丽.基于CP加权的概念语义相似度算法[J].电子技术（上海）,2016,0(4):31-36. 被引量：1
8张美敬,刘志宏,房盛楠,余越,王天宇,薛丹平,田雪梅,宋洪涛.中药多组分缓释制剂体外释放评价体系的研究进展[J].中国药房,2017,28(10):1408-1411. 被引量：4
9江美芳,高崎,王丹丹.银杏酮酯片中萜内酯、黄酮苷整合溶出度的测定[J].中成药,2020,42(10):2716-2719. 被引量：4

二级引证文献38

1杨群,李晓辉,胡海英,张锴,廖红德,姚航宇,吴邵杰,张淑慧.基于理化性质的枸橼酸托法替布处方前研究[J].中国现代应用药学,2022,39(2):174-180. 被引量：1
2刘丹,张振海,陈小云,贾晓斌.银杏内酯组分固体分散体微丸释药单元的制备[J].中国中药杂志,2014,39(6):1002-1006. 被引量：6
3刘丹,张振海,陈小云,贾晓斌.银杏内酯组分释药单元体外释药行为评价研究[J].中国中药杂志,2014,39(8):1426-1429. 被引量：3
4饶小勇,尹姗,张国松,罗晓健,简晖,冯育林,杨世林.HPLC测定白头翁皂苷D的油水分配系数及平衡溶解度[J].中国中药杂志,2014,39(9):1593-1596. 被引量：13
5贾晓斌,杨冰,封亮,石心红,汪豪,刘利根.中药药剂学研究前沿:组分制剂技术基础与关键科学问题[J].药学学报,2018,53(12):1943-1953. 被引量：16
6柯仲成,林传燕,贾晓斌.基于代表性成分辨识的中药组分整体生物药剂学性质表征探讨[J].中国中药杂志,2018,43(23):4592-4598. 被引量：5
7严红梅,陈小云,夏海建,刘丹,贾晓斌,张振海.丹酚酸组分中各代表性成分药效贡献率的评价及其油水分配系数的整合表征[J].中国中药杂志,2015,40(3):430-436. 被引量：12
8张威,刘嘉,杨海军,朱粉霞,朱劲华.多组分中药整体性质的表征研究概述[J].中医药信息,2015,32(2):125-126. 被引量：7
9种晓阳,周子力,吴玲玲.基于互信息的概念语义相似度算法[J].通信技术,2016,49(9):1175-1180.
10刘丹,田燕,张振海,贾晓斌.银杏内酯组分自微乳释药系统的制备及各成分溶出行为相似度分析[J].中草药,2016,47(21):3798-3804. 被引量：4

1王刚,邱玉辉,蒲国林.一个基于语义元的相似度计算方法研究[J].计算机应用研究,2008,25(11):3253-3255. 被引量：13
2王松,马勇,王刚,刘晓光.高效的异构本体的映射算法研究[J].计算机工程与科学,2010,32(10):93-96. 被引量：2
3曾辉,江健健,熊李艳,黄卫春.一种关联多本体的科技奖励检索方法[J].华东交通大学学报,2014,31(2):112-118.
4黄涛,崔弘扬,刘清堂,杨宗凯.一种基于虚拟路径的本体匹配算法[J].计算机科学,2010,37(11):206-211. 被引量：3
5李海华,杜小勇,田萱.基于WSMO的语义Web服务发现框架研究[J].华中科技大学学报（自然科学版）,2007,35(S2):160-163.
6翟延冬,王康平,张东娜,黄岚,周春光.一种基于WordNet的短文本语义相似性算法[J].电子学报,2012,40(3):617-620. 被引量：34
7张东娜,周春光,刘彦斌,郭东伟.一种基于WordNet和Corpus Statistics的语义相似性计算方法[J].吉林大学学报（理学版）,2010,48(5):811-816. 被引量：6
8于剑.相似性的二值表示[J].计算机研究与发展,2010,47(12):2117-2122.

计算机应用

2012年第1期

浏览历史

内容加载中请稍等...

基于概念间边权重的概念相似性计算方法被引量：9

参考文献16

同被引文献108

引证文献9

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

基于概念间边权重的概念相似性计算方法 被引量：9

参考文献16

同被引文献108

引证文献9

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

基于概念间边权重的概念相似性计算方法被引量：9