概念树在短文本语义相似度上的应用被引量：4

Application of Concept Tree in Semantic Similarity of Short Texts

下载PDF

导出

摘要随着网络的发展,短文本语言计算的研究方兴未艾,且语义相似度在人工智能、认知学、语义学、心理学和生物学等领域里占有重要位置。在已有的传统的相似度研究算法上,为了能更快更准确地计算出相似度,文中通过构建概念树,设法把短文本集中到某个特定的领域。因概念树、概念词典既能表现概念之间的语义关系,又能表现概念层次结构,故而更能大大提高检索效率。在此基础上的相似度计算也使得检索结果更加准确,进而方便研究短文本之间的相似性与唯一性,大大增加了后期对挖掘的正确性。 With the development of the network, short texts have attracted numerous researchers＇ attention, semantic similarity occupies an important positions in artificial intelligence, cognitive linguistics, semantics, psychology and biology. It is different from traditional essays on the research of semantic similarity, which tries to put the short text focus on some special area by building the concept tree. It＇ s concept tree that shows the relationship and hierarchical structure between concepts, which more greatly improve the efficiency of searching, so as the concepts dictionary. On the basis of the similarity calculation makes the retrieval results more accurate, so it＇ s more convenient to study the similarity and the uniqueness in short texts and the late mining.

作者赵小谦郑彦储海庆

机构地区南京邮电大学计算机学院

出处《计算机技术与发展》 2012年第6期159-162,共4页 Computer Technology and Development

基金国家重点基础研究发展规划(973)课题(2006AA01Z201)

关键词短文本 WORDNET 概念树语义相似度 short texts WordNet concept tree semantic similarity

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1黄果,周竹荣.基于领域本体的概念语义相似度计算研究[J].计算机工程与设计,2007,28(10):2460-2463. 被引量：67
2张凯勇.基于WordNet的词语及短文本语义相似度算法研究[D].长春:吉林大学,2008.
3贾文娟,何丰.基于HowNet的中文本体学习方法研究[J].计算机技术与发展,2011,21(6):77-80. 被引量：6
4江磊,郑彦,余志虎.基于概念树的语义相似度计算的研究[J].广东通信技术,2010,30(8):46-49. 被引量：1
5樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70
6王洪伟,吴家春.本体的形式化模型及在语义查询中的应用[M].北京:高等教育出版社,2003.
7冉婕,孙瑜.语义检索中的词语相似度计算研究[J].计算机技术与发展,2011,21(4):94-97. 被引量：8
8郑诚,秦多荣.本体映射中的概念相似度计算[J].计算机技术与发展,2008,18(11):125-127. 被引量：4
9谢信喜,王士同.适用于区间数据的基于相互距离的相似性传播聚类[J].计算机应用,2008,28(6):1441-1443. 被引量：8
10Montejo-Raez A, Dallman D. Experience in Automatic Key- wording of Particle Physics Literature [ J ]. High Energy Phys- ics Libraries Webzine ,2001 (5) : 124-131.

二级参考文献68

1洪志令 ,姜青山 ,董槐林 ,Wang Sheng-Rui .模糊聚类中判别聚类有效性的新指标[J].计算机科学,2004,31(10):121-125. 被引量：15
2辛日华.HowNet的构成分析与研究[J].呼伦贝尔学院学报,2003,11(3):81-83. 被引量：1
3黄烟波,张红宇,李建华,谭立球,李志.本体映射方法研究[J].计算机工程与应用,2005,41(18):27-29. 被引量：38
4章志凌,虞立群,陈奕秋,罗海飞,邵晓敏.基于Corpus库的词语相似度计算方法[J].计算机应用,2006,26(3):638-640. 被引量：17
5张小峰,唐新亭,赵永升,李明.基于本体技术的Internet智能搜索研究[J].计算机工程与设计,2006,27(7):1194-1197. 被引量：6
6杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：242
7秦春秀,赵捧未,刘怀亮.词语相似度计算研究[J].情报理论与实践,2007,30(1):105-108. 被引量：30
8梁健,王惠临.基于文本的本体学习方法研究[J].情报理论与实践,2007,30(1):112-115. 被引量：11
9黄果,周竹荣.基于领域本体的概念语义相似度计算研究[J].计算机工程与设计,2007,28(10):2460-2463. 被引量：67
10李佳,祝铭,刘辰,杨正球.中文本体映射研究与实现[J].中文信息学报,2007,21(4):27-33. 被引量：10

共引文献156

1孙登林,李生红,荆涛,刘功申.一种针对不良主题的文本过滤方法[J].信息安全与通信保密,2008,30(2):92-93. 被引量：4
2王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量：36
3彭昱忠,元昌安,王艳,覃晓.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009,26(2):433-438. 被引量：19
4胡哲,郑诚.一种改进的基于领域本体的概念语义相似度算法[J].齐齐哈尔大学学报（自然科学版）,2013,29(1):1-6. 被引量：1
5彭京,杨冬青,唐世渭,王腾蛟,高军.基于概念相似度的文本相似计算[J].中国科学（F辑:信息科学）,2009,39(5):534-544. 被引量：17
6王毅,陈庆新,毛宁.基于本体的改模方案聚类研究[J].机械科学与技术,2015,34(4):570-576.
7张雪英.基于机器学习的文本自动分类研究进展[J].情报学报,2006,25(6):730-739. 被引量：11
8LI Yanling,DAI Guanzhong,ZHU Yehang,QIN Sen.A High-Performance Extraction Method for Public Opinion on Internet[J].Wuhan University Journal of Natural Sciences,2007,12(5):902-906. 被引量：3
9刘磊,刘克彬,韩颖,李芳.基于两次分类的校友搜索系统的设计与实现[J].小型微型计算机系统,2007,28(10):1916-1920.
10耿焕同,李杰.范例推理在文本自动分类中的应用研究[J].情报理论与实践,2007,30(6):837-840. 被引量：1

同被引文献54

1董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44. 被引量：57
2胡佳妮,徐蔚然,郭军,邓伟洪.中文文本分类中的特征选择算法研究[J].光通信研究,2005(3):44-46. 被引量：47
3李峰,李芳.中文词语语义相似度计算——基于《知网》2000[J].中文信息学报,2007,21(3):99-105. 被引量：106
4刘群李素建.基于《知网》的词汇语义相似度计算.中文计算语言学,2002,7(2):59-76.
5Lee W N, Shah N, Sundlass K, et al. Comparison of ontology- based semantic similarity measures [ C ]//AMIA Annual Sym- posium Proceedings. USA: [ s. n.] ,2008:384-388.
6Resnik P. Using Information Content to Evaluate Semantic Similarity [ C ]//Proceedings of the 14th IJCAI. Montereal, Canada : [ s. n. ] , 1995:448-453.
7Chodorow M, Leacock C. Combining local context and Word- Net similarity for word sense identification [ M ]. Cambridge, Massachusetts : MIT Press, 1997:265-283.
8Lin D. An information-theoretic definition of similarity[ C ]// Proceedings of 15th Int. Cord'. on Machine Learning. [ s. 1. ] : [s.n.] ,1998.
9Couto F, Silva M, Coutinho P. Semantic similarity over the gene ontology:Family correlation and selecting disjunctive an- cestors [ C ]//Proc. of the ACM Conference in Information and Knowledge Management (CIKM). [ s. 1. ]: [ s. n. ] ,2005.
10Couto F,Silva M. Disjunctive Shared Information between On- tology Concepts : Application to Gene Ontology [ J ]. Journal of Biomedical Semantics,2011,2 : 2-5.

引证文献4

1杨方颖,蒋正翔,张姗姗.基于本体结构的语义相似度计算[J].计算机技术与发展,2013,23(7):52-56. 被引量：8
2刘小敏,王昊,李心蕾,邓三鸿.不同特征粒度在微博短文本分类中作用的比较研究[J].情报科学,2018,36(12):126-133. 被引量：10
3黄贤英,刘英涛,饶勤菲.一种基于公共词块的英文短文本相似度算法[J].重庆理工大学学报（自然科学）,2015,29(8):88-93. 被引量：7
4翟东升,蔡文浩,张杰,李振飞.改进的中文商标语义相似度计算方法研究[J].数据分析与知识发现,2017,1(11):19-28.

二级引证文献25

1王昊,虞为,孟镇,张卫.民生话题下政务微博评论Emotion-Cause Pair抽取方法研究[J].情报科学,2023,41(12):136-146.
2裴培,丁雪晶.基于本体的语义相似度计算综述[J].合肥学院学报（综合版）,2020(5):68-74. 被引量：3
3高国强,黄吕威,陈丰钰.使用网络搜索引擎计算汉语词汇的语义相似度[J].计算机技术与发展,2014,24(7):84-87. 被引量：4
4杨娜娜,张青年,牛继强.基于本体结构的空间实体语义相似度计算模型[J].测绘科学,2015,40(3):107-111. 被引量：13
5张沪寅,温春艳,刘道波,叶刚.改进的基于本体的语义相似度计算[J].计算机工程与设计,2015,36(8):2206-2210. 被引量：10
6韩学仁,王青山,郭勇,赵莹.基于Solr和本体的地方志数据语义检索研究[J].信息工程大学学报,2016,17(1):48-52. 被引量：1
7魏霖静,练智超,王联国,侯振兴.基于词条与语意差异度量的文档聚类算法[J].计算机科学,2016,43(12):229-233. 被引量：1
8张贤坤,张倩.基于本体的综合加权案例相似度算法研究[J].计算机应用研究,2017,34(2):422-425. 被引量：1
9黄贤英,谢晋,龙姝言.基于公共词块及N-gram模型的问句相似度算法[J].重庆理工大学学报（自然科学）,2017,31(10):175-179. 被引量：7
10翟东升,蔡文浩,张杰,李振飞.改进的中文商标语义相似度计算方法研究[J].数据分析与知识发现,2017,1(11):19-28.

1卢子明.用PASCAL语言计算数据库文件各字段的内存地址[J].福建分析测试,1998,7(4):966-968.
2赵铁军.将语言计算的理论方法和最新成果呈现给读者-《统计自然语言处理(第2版)》评述[J].自动化学报,2014,40(5):1024-1024.
3许鑫,曹昉,袁翀.利用移动Agent技术改进基于概念的信息检索[J].图书情报工作,2003,47(1):86-90. 被引量：3
4江红,吴立德,沙新时.机器翻译系统中概念词典的设计与实现[J].计算机研究与发展,1995,32(3):13-18. 被引量：4
5孙茂松,刘挺,姬东鸿,穗志方,赵军,张钹,吾守尔.斯拉木,俞士汶,朱军,李建民,刘洋,王厚峰,吐尔根.依布拉音,刘群,刘知远.语言计算的重要国际前沿[J].中文信息学报,2014,28(1):1-8. 被引量：23
6廖荣福,李彦,李文强.面向产品创新设计的知识库研究[J].机械设计,2008,25(7):5-10. 被引量：8
7郑瑞娟,张仰森.基于概念的Web文本分类方法及实现[J].北京信息科技大学学报（自然科学版）,2013,28(2):77-81.
8张云涛,龚玲,王永成.基于概念扩展的关键词检索技术[J].广西师范大学学报（自然科学版）,2003,21(1):94-100. 被引量：4
9李振东,费翔林.基于概念的信息检索模型研究[J].南京大学学报（自然科学版）,2002,38(1):99-109. 被引量：33
10朱振方,刘培玉,王金龙.一种基于语义特征的逻辑段落划分方法及应用[J].计算机科学,2009,36(12):227-230. 被引量：4

计算机技术与发展

2012年第6期

浏览历史

内容加载中请稍等...

概念树在短文本语义相似度上的应用被引量：4

参考文献12

二级参考文献68

共引文献156

同被引文献54

引证文献4

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

概念树在短文本语义相似度上的应用 被引量：4

参考文献12

二级参考文献68

共引文献156

同被引文献54

引证文献4

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

概念树在短文本语义相似度上的应用被引量：4