一种改进的基于《知网》的词语相似度计算方法被引量：26

Modified word similarity computation approach based on HowNet

下载PDF

导出

摘要《知网》是一部比较详尽的中文语义知识词典,共用1618个义原描述词语,故相关的词语用《知网》的概念描述时,有相同的义原。通过这一规律,与当前的词语相似度计算方法结合,提出改进的方法计算相关词对的相似度。并引入弱义原的概念,排除弱义原对词语相似度计算的干扰。实验证明:该改进方法更符合人的直观,更适用于文本挖掘。 HowNet is a lexical base with rich semantic information. It uses 1618 sememes to describe words. The related words have the same sememe when they are described by the HowNet. Combined with the current computation algorithm of the words＇ similarity, the paper proposed an improved algorithm to compute the similarity between the related words. It also introduced concept about weak sememes and excluded such sememes＇ interference when they appeared in the computation of the word＇s similarity. The experiment proves the improved word similarity computation meets the peoples＇ intuition and text mining better.

作者林丽薛方任仲晟

机构地区集美大学计算机工程学院福建师范大学计算机实验中心

出处《计算机应用》 CSCD 北大核心 2009年第1期217-220,共4页 journal of Computer Applications

关键词《知网》词语相似度相关词对弱义原 HowNet word similarity related word weak sememe

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP311.53 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1刘群李素建.基于《知网》的词汇语义相似度计算[C]..第三界汉语词汇语义研讨会[C].台北,2002..
2董振东董强.知网简介[EB／OL].http://www.keenage.com/.,1999.
3董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：58
4郝秀兰,杨尔弘,舒鑫柱.基于How Net的事件角色语义特征提取[J].中文信息学报,2001,15(5):26-32. 被引量：9
5荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48. 被引量：41

二级参考文献11

1马庆株.关于《语法研究入门》的组编[J].世界汉语教学,1999,13(4):96-99. 被引量：2
2George A.Miller,Richard Beckwith,Christiane Fellbaum,Derek Gross,and Katherine Miller.Introduction to WordNet:An On-line Lexical Database[EB].Cognitive Science Laboratory,Princeton University,1993.51 ～ 57
3关毅,王晓龙.基于统计的汉语词汇间语义相似度计算.语言计算与基于内容的文本处理,清华大学出版社,2003.221～227
4Rada R.etc.Development and application of a metric on semantic nets.IEEE Transactions on System,Man and Cybernetics,1989
5Lee J.H.etc.Information retrieval based on conceptual distance in ISA hierarchies.Journal of Documentation,1993(49)
6Agirre E.and Rigau G..A proposal for word sense disambiguation using conceptual distance.In:International Conference "Recent Advances in Natural Language Processing"RANLP'95,Tzigov Chark,Bulgaria,1995.91 ～ 98
7P.Brown etc.Word sense disambiguation using tactical methods.In:Proceedings of 29th Meeting of the Association for Computational Linguistics (ACL-91),1991.201 ～ 207
8Lillian Lee.Similarity-Based Approaches to Natural Language Processing:[Ph.D.Thesis].Harvard University Technical Report TR-11-97
9刘群李素建.基于《知网》的词汇语义相似度计算[A]..Computational Linguistics and Language Processing[C].,2002.7.2:59-76.
10于江生,俞士汶.中文概念词典的结构[J].中文信息学报,2002,16(4):12-20. 被引量：67

共引文献224

1钟冬,朱怡安,王云岚.一种新的基于隐式经验的服务发现模型[J].西北工业大学学报,2009,27(1):71-76.
2谌志群,周其力.基于综合语义的XML文档相似度计算方法[J].杭州电子科技大学学报（自然科学版）,2009,29(3):64-67.
3赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量：17
4冯志伟.汉字和汉语的计算机处理[J].当代语言学,2001,3(1):1-21. 被引量：23
5董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44. 被引量：56
6田雯,曹存根,王海涛.心理常识概念的表示、获取和分析[J].计算机科学,2004,31(6):5-12. 被引量：2
7董振东,董强.面向信息处理的词汇语义研究中的若干问题[J].语言文字应用,2001(3):27-32. 被引量：35
8祁坤钰.《机器翻译用现代藏语语义词典》的设计研究[J].西北民族大学学报（自然科学版）,2004,25(3):33-37. 被引量：8
9尹一瓴,陈群秀.现代汉语语义知识库用于句法分析的研究[J].计算机应用,2004,24(B12):264-267. 被引量：1
10刘扬,俞士汶,于江生.CCD语义知识库的构造研究[J].小型微型计算机系统,2005,26(8):1411-1415. 被引量：9

同被引文献211

1曹立勇,郑诚.基于知网的语义相似度的改进算法[J].电子技术（上海）,2010(5):1-3. 被引量：2
2刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：197
3刘亚军,徐易.一种基于加权语义相似度模型的自动问答系统[J].东南大学学报（自然科学版）,2004,34(5):609-612. 被引量：35
4王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29. 被引量：28
5梁时英,于欣.艾宾浩斯遗忘曲线在计算机基础教学中的应用[J].石家庄职业技术学院学报,2004,16(6):45-46. 被引量：16
6金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量：79
7吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
8周密,承文,韩立岩,张海峰.知识流模型及其在航天企业中的应用[J].中国管理科学,2005,13(5):79-86. 被引量：21
9章成志.基于多层特征的字符串相似度计算模型[J].情报学报,2005,24(6):696-701. 被引量：38
10朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：325

引证文献26

1袁晓峰.《知网》义原相似度计算的研究[J].辽宁大学学报（自然科学版）,2011,38(4):358-361. 被引量：5
2褚海墨,王英林.基于参与者行为建模的知识流仿真[J].计算机工程与设计,2010,31(20):4447-4450. 被引量：3
3王凌燕,丁露露,李鹏坤.基于褒贬倾向的句子相似度计算[J].河南师范大学学报（自然科学版）,2010,38(6):46-49. 被引量：1
4兰美辉.一种改进的本体概念相似度计算算法[J].苏州科技学院学报（自然科学版）,2011,28(2):45-49. 被引量：3
5王小林,王义.改进的基于知网的词语相似度算法[J].计算机应用,2011,31(11):3075-3077. 被引量：38
6李明涛,罗军勇,尹美娟,路林.结合词义的文本特征词权重计算方法[J].计算机应用,2012,32(5):1355-1358. 被引量：9
7于海群,刘万军,邱云飞.基于用户话题偏好的社会网络二级人脉推荐[J].计算机应用,2012,32(5):1366-1370. 被引量：9
8刘燕美,李华.基于语义的词语相似度算法研究[J].世界科技研究与发展,2012,34(4):617-620.
9吴旭东,成卫青,黄卫东.改进的主客观结合的词语语义相似度算法[J].计算机技术与发展,2012,22(9):45-49. 被引量：1
10李华,储荷兰,高旻.中文网络评论观点词汇语义褒贬倾向性判断[J].计算机应用,2012,32(11):3023-3025. 被引量：5

二级引证文献125

1焦自程,赵旭章,史珂轩.双语问答小程序的设计与实现[J].新一代信息技术,2022,5(5):18-20.
2徐智威.基于《知网》的词语相似度计算算法研究[J].包装世界,2018,0(4):101-102.
3吴巧玲.关于最优指派问题匈牙利算法的改进与句子语义相似度计算[J].中国电子商务,2011(12):126-127.
4王义,王小林.基于改进的义原关联度算法的词语相关度计算[J].情报学报,2012,31(12):1271-1275. 被引量：7
5兰美辉,李红林.基于扩展AUC量度模型的本体算法[J].苏州科技学院学报（自然科学版）,2013,30(1):71-74. 被引量：2
6张爱科,符保龙.基于高维聚类的探索性文本挖掘算法[J].计算机应用,2013,33(4):988-990. 被引量：4
7俞卫华,王剑.基于Chord扩展的对等定位模型研究[J].计算机工程与设计,2013,34(5):1542-1545. 被引量：1
8徐健.基于多种测度的术语相似度集成计算研究[J].情报学报,2013,32(6):618-628. 被引量：3
9王超,李书琴,肖红.基于本体的旱区农业垂直搜索引擎研究[J].农机化研究,2013,35(8):184-187. 被引量：4
10朱征宇,孙俊华.改进的基于《知网》的词汇语义相似度计算[J].计算机应用,2013,33(8):2276-2279. 被引量：58

1陈晓明,周渝.基于知网的文本标注[J].贵州大学学报（自然科学版）,2001,18(3):170-175. 被引量：1
2余正涛,宋丽哲,樊孝忠.基于本体的个性化领域信息服务[J].计算机工程,2005,31(5):22-24. 被引量：17
3刘洁.议“囧”[J].文教资料,2009(10):56-57. 被引量：1
4李维银,石玉龙,陈杰,施重阳.基于分类模型的查询扩展方法[J].计算机科学,2015,42(6):18-22. 被引量：3
5陈航,张辉.一种面向微生物领域的知识库构建方法[J].微电子学与计算机,2016,33(8):5-9. 被引量：2
6杨立公,樊孝忠,朱俭.利用语义词典的情感词快速识别[J].计算机工程与设计,2013,34(8):2978-2982. 被引量：2
7章智竹.搜索引擎在压榨？[J].商业周刊（中文版）,2009(2):11-11.
8张瑞霞,杨国增,闫新庆.基于知网的汉语普通未登录词语义分析模型[J].计算机应用与软件,2012,29(8):126-130. 被引量：4
9我国首部现代科学技术知识词典问世[J].大众科技,2009,11(3):1-1.
10买日旦.吾守尔,维尼拉.木沙江.电子词典软件系统中对维、哈、柯文进行自动判别技术的研究[J].新疆大学学报（自然科学版）,2011,28(1):88-92. 被引量：4

计算机应用

2009年第1期

浏览历史

内容加载中请稍等...

一种改进的基于《知网》的词语相似度计算方法被引量：26

参考文献5

二级参考文献11

共引文献224

同被引文献211

引证文献26

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

一种改进的基于《知网》的词语相似度计算方法 被引量：26

参考文献5

二级参考文献11

共引文献224

同被引文献211

引证文献26

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

一种改进的基于《知网》的词语相似度计算方法被引量：26