《知网》义原相似度计算的研究被引量：5

Research of Word Relativity Based on HowNet

下载PDF

导出

摘要词语之间相似度的计算广泛应用于信息检索、文本主题抽取、文本分类、机器翻译等研究领域.词语之间的相似度的计算通常有两方法,基于统计的方法和基于世界知识的方法.对于中文的词语相似度计算,有人提出一种利用《知网》计算词语相似度的方法,该方法通过计算《知网》义原的相似度进而计算词语的相似度,但是该方法在计算义原相似度时没有考虑义原在层次体系树上的深度以及区域密度.在此基础之上深入研究《知网》的义原层次体系,将义原在层次体系树上的深度和区域密度两个因素添加到义原相似度计算中.最后,实现了该计算方法并得到实验结果,将实验结果与改进前的计算方法的结果比较,发现考虑义原在层次体系树上的深度和区域密度得到的结果比不考虑这两个因素得到结果更符合实际. The similarity computation between words is widely used in many research area,such as information retrieval,extracting subject of documents,text clutering,machine translation and so on.There used to be two ways to compute the similarity between words,one is based on statistics,another is base on the ontology.There is a method based HowNet to calculate the similarity between Chinese words already.This method calculate the similarity between words thought calculate the similarity between primitives of HowNet.But this method have ignored the depth and density of primitives.We add the factor of primitive depth and density to the method above though researching of HowNet carefully.We realize our method and got the experimental data,and we find our method is more practical than the method already existent.

作者袁晓峰

机构地区盐城师范学院信息科学与技术学院

出处《辽宁大学学报（自然科学版）》 CAS 2011年第4期358-361,共4页 Journal of Liaoning University：Natural Sciences Edition

关键词知网义原相似度自然语言处理 HowNet Primitive Similarity Natural Language Processing

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1林丽,薛方,任仲晟.一种改进的基于《知网》的词语相似度计算方法[J].计算机应用,2009,29(1):217-220. 被引量：26

二级参考文献5

1董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：58
2荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48. 被引量：41
3董振东董强.知网简介[EB／OL].http://www.keenage.com/.,1999.
4刘群李素建.基于《知网》的词汇语义相似度计算[C]..第三界汉语词汇语义研讨会[C].台北,2002..
5郝秀兰,杨尔弘,舒鑫柱.基于How Net的事件角色语义特征提取[J].中文信息学报,2001,15(5):26-32. 被引量：9

共引文献25

1褚海墨,王英林.基于参与者行为建模的知识流仿真[J].计算机工程与设计,2010,31(20):4447-4450. 被引量：3
2王凌燕,丁露露,李鹏坤.基于褒贬倾向的句子相似度计算[J].河南师范大学学报（自然科学版）,2010,38(6):46-49. 被引量：1
3兰美辉.一种改进的本体概念相似度计算算法[J].苏州科技学院学报（自然科学版）,2011,28(2):45-49. 被引量：3
4王小林,王义.改进的基于知网的词语相似度算法[J].计算机应用,2011,31(11):3075-3077. 被引量：38
5李明涛,罗军勇,尹美娟,路林.结合词义的文本特征词权重计算方法[J].计算机应用,2012,32(5):1355-1358. 被引量：9
6于海群,刘万军,邱云飞.基于用户话题偏好的社会网络二级人脉推荐[J].计算机应用,2012,32(5):1366-1370. 被引量：9
7刘燕美,李华.基于语义的词语相似度算法研究[J].世界科技研究与发展,2012,34(4):617-620.
8吴旭东,成卫青,黄卫东.改进的主客观结合的词语语义相似度算法[J].计算机技术与发展,2012,22(9):45-49. 被引量：1
9李华,储荷兰,高旻.中文网络评论观点词汇语义褒贬倾向性判断[J].计算机应用,2012,32(11):3023-3025. 被引量：5
10Wang Yang,Zhang Linjing,Huang Yakun,Zhao Baohua,Zhao Chuanxin.SERVICE COMMUNITY CONSTRUCTION METHOD OF INTERNET OF THINGS BASED ON SEMANTIC SIMILARITY[J].Journal of Electronics(China),2013,30(1):49-56. 被引量：1

同被引文献36

1董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44. 被引量：56
2罗欣,夏德麟,晏蒲柳.基于词频差异的特征选取及改进的TF-IDF公式[J].计算机应用,2005,25(9):2031-2033. 被引量：55
3程玉柱,邬书跃.基于部件的文本相似度计算[J].计算机工程与设计,2006,27(18):3444-3446. 被引量：4
4赵鹏,蔡庆生.一种基于《知网》的中文文本聚类算法的研究[J].计算机工程与应用,2007,43(12):162-163. 被引量：7
5李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：105
6夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6):191-194. 被引量：63
7刘群李素建.基于《知网》的词汇语义相似度的计算[A]..第三届汉语词汇语义学研讨会[C].台北,2002..
8刘群李素建.基于《知网》的词汇语义相似度计算.中文计算语言学,2002,7(2):59-76.
9Sahon G, Yang C S. On the specification of term value in automatic indexing. Journal of Documentation, 1973 ;29(4) :351-372.
10Wong S K M, Ziarko W, Wong P C N. Generalized vector model in information retrieval. Proceedings of the 8th Annual International ACM SIGIR Conference on Research and Development in Information Re- trieval, Montreal, 1985 : 18-25.

引证文献5

1肖志军,冯广丽.基于《知网》义原空间的文本相似度计算[J].科学技术与工程,2013,21(29):8651-8656. 被引量：9
2张沪寅,刘道波,温春艳.基于《知网》的词语语义相似度改进算法研究[J].计算机工程,2015,41(2):151-156. 被引量：22
3黄洪,屠肖龙.基于角度—相似度转换模型的义原相似度计算[J].浙江工业大学学报,2017,45(6):597-603.
4李蕾,杨丽花.基于知网的词语语义相似度改进算法[J].计算机技术与发展,2019,29(4):42-46. 被引量：5
5刘城霞.基于柔性逻辑的词语相似度计算方法的改进[J].计算机科学与应用,2016,6(11):755-760.

二级引证文献34

1魏飞,杨春波,刘守鹏.面向网络舆情分析的语义相似度算法研究[J].山东科学,2014,27(6):73-77.
2赵涛,张太红,陈燕红.中文农业网页去重及相似度判断研究[J].计算机技术与发展,2015,25(1):191-194. 被引量：2
3刘怀亮,杜坤,秦春秀.基于知网语义相似度的中文文本分类研究[J].现代图书情报技术,2015(2):39-45. 被引量：15
4赵士杰,陈秋.基于语义和TF-IDF的项目相似度计算方法[J].计算机时代,2015(5):1-3. 被引量：8
5魏勇,胡丹露,郝晨光,欧小平.基于分类关键词词频模型的地缘政治主题爬虫设计[J].计算机工程,2016,42(2):45-50. 被引量：4
6韩兴邦,毛峡.一种改进的词义相似度算法[J].中国科技论文,2016,11(2):202-207. 被引量：1
7肖雷,王旭,粟武林.一种基于词义降维的主题特征选择算法[J].计算机应用与软件,2016,33(3):244-247. 被引量：1
8池哲洁,张全.基于概念基元的词语相似度计算研究[J].电子与信息学报,2017,39(1):150-158. 被引量：4
9康司辰,刘扬.基于语义构词的汉语词语语义相似度计算[J].中文信息学报,2017,31(1):94-101. 被引量：3
10史俊冰.一种基于《知网》的词语相似度计算方法[J].太原学院学报（自然科学版）,2017,35(1):69-72.

1袁晓峰.基于《知网》的词语相似度计算研究[J].成都大学学报（自然科学版）,2011,30(4):339-341. 被引量：5
2孙建旺,吕学强,张雷瀚.基于语义与最大匹配度的短文本分类研究[J].计算机工程与设计,2013,34(10):3613-3618. 被引量：18
3刘影,陈立,宋自林,董庆超,陈兴华,朱卫星,何继贤.一种改进的基于本体概念相似度计算方法研究[J].南京邮电大学学报（自然科学版）,2011,31(6):60-66. 被引量：1
4黄高峰,周学广,李娟,刘华.具有权重因子的细粒度情感词库构建方法[J].计算机工程,2014,40(11):211-214. 被引量：4
5孙滨,刘林.一种基于《知网》的文本语义相似度的计算方法[J].计算机与数字工程,2014,42(2):187-189. 被引量：4
6韦晓飞,李文杰.本体映射中概念相似度的计算[J].天津理工大学学报,2009,25(2):41-43. 被引量：3
7郭天舒.基于车牌自身结构特征的车牌定位算法[J].计算机与信息技术,2008(10):51-53. 被引量：5
8关学忠,刘勇智.基于数字图像处理的车牌定位及字符分割方法[J].装备制造,2010,0(A01):143-143. 被引量：3
9何亚.词语相似度算法的分析与改进[J].硅谷,2011,4(24):93-94.
10秦添轶,林蝉,宋博宇,关毅.一种实体描述短文本相似度计算方法[J].智能计算机与应用,2015,5(2):34-37. 被引量：3

辽宁大学学报（自然科学版）

2011年第4期

浏览历史

内容加载中请稍等...

《知网》义原相似度计算的研究被引量：5

参考文献1

二级参考文献5

共引文献25

同被引文献36

引证文献5

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

《知网》义原相似度计算的研究 被引量：5

参考文献1

二级参考文献5

共引文献25

同被引文献36

引证文献5

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

《知网》义原相似度计算的研究被引量：5