一种基于语料的词汇语义相似度认知算法被引量：5

A Cognition Measurement of Word Similarity Based on a Specific Subject Corpus

下载PDF

导出

摘要词汇的语义相似度计算是信息检索、自然语言处理、推荐系统等技术的基础。事实上,词汇可能因其语境或语料的不同,语义的相似度千差万别。论文通过提取词汇的上下文语境特征,构建了一种基于特定语料的词汇的语义相似度计算模型。实验结果表明,该算法有较好的准确率和较强的领域敏感性,取得了令人满意的结果。 Word similarity measurement is the basis for techniques of information retrieval,natural language processing,rec. ommender systems,and so on. Actually,word similarity may be entirely different because of its context or subject. The paper intro. duces a cognition measurement of word similarity based on a specific subject corpus through word's context feature. An experimental result indicates that the measurement method can achieve good precision rate and field sensitivity.

作者吴华罗顺孙伟晋 WU Hua;LUO Shun;SUN Weijin(Shanghai General Recognition Technology Institute,Shanghai 201112)

机构地区上海通用识别技术研究所

出处《计算机与数字工程》 2019年第2期300-303,共4页 Computer & Digital Engineering

关键词文本分析自然语言处理领域预料语义相似度 text analyze natural language processing field corpus word similarity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1葛斌,李芳芳,郭丝路,汤大权.基于知网的词汇语义相似度计算方法研究[J].计算机应用研究,2010,27(9):3329-3333. 被引量：66
2于江生,俞士汶.中文概念词典的结构[J].中文信息学报,2002,16(4):12-20. 被引量：67
3田久乐,赵蔚.基于同义词词林的词语相似度计算方法[J].吉林大学学报（信息科学版）,2010,28(6):602-608. 被引量：179
4刘剑,许洪波,唐慧丰,贾岩涛,程学旗.面向中文网络百科的语义知识库构建[J].系统仿真学报,2016,28(3):542-548. 被引量：5
5邱百爽,赵蔚,刘秀琴.基于语义网的自适应学习系统中用户模型的研究[J].开放教育研究,2008,14(4):106-111. 被引量：22
6余刚,裴仰军,朱征宇,陈华月.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244. 被引量：25

二级参考文献47

1鲁川,缑瑞隆,刘钦荣.交易类四价动词及汉语谓词配价的分类系统[J].汉语学习,2000(6):7-17. 被引量：24
2李善平,尹奇韡,胡玉杰,郭鸣,付相君.本体论研究综述[J].计算机研究与发展,2004,41(7):1041-1052. 被引量：275
3梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量：28
4余刚,裴仰军,朱征宇,陈华月.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244. 被引量：25
5庄致.自适应远程教学系统中学生认知水平估算方法[J].计算机工程与应用,2007,43(3):220-222. 被引量：6
6程涛,施水才,王霞,吕学强.基于同义词词林的中文文本主题词提取[J].广西师范大学学报（自然科学版）,2007,25(2):145-148. 被引量：11
7李佳,祝铭,刘辰,杨正球.中文本体映射研究与实现[J].中文信息学报,2007,21(4):27-33. 被引量：10
8夏天.汉语词语语义相似度计算研究[J].计算机工程,2007,33(6):191-194. 被引量：63
9陆汝钤.知识科学与计算科学[M].北京：清华大学出版社,2002..
10董振东董强.知网简介[M].1999[EB/OL].http://www.keenage.com.,.

共引文献343

1龚丽娟,王昊,张紫玄,朱立平.Word2Vec对海关报关商品文本特征降维效果分析[J].数据分析与知识发现,2020,4(2):89-100. 被引量：8
2熊回香,陈子薇,叶佳鑫.基于共现关系的关键词层次结构构建研究[J].知识管理论坛,2022(4):443-451. 被引量：1
3臧国全,张凯亮,肖洋,贾瑞莹.数据隐私风险的识别与消减——以医疗数据为例[J].情报学进展,2024(1):205-246.
4卢雪晖,徐会丹,李斌,陈思瑜.先秦词网构建及梵汉对比研究[J].中文信息学报,2023,37(3):36-45. 被引量：1
5马林兵,张宇菲,谭婷,杨宗和.基于本体论空间搜索引擎研究——以地震灾害为例[J].计算机应用研究,2020,37(S02):202-204. 被引量：1
6伍洋,钟鸣,姜艳,李石君.面向审计领域的短文本分类技术研究[J].微电子学与计算机,2015,32(1):5-10. 被引量：7
7吴云芳.V+V形成的并列结构[J].语言研究,2004,24(3):45-51. 被引量：4
8祁坤钰.《机器翻译用现代藏语语义词典》的设计研究[J].西北民族大学学报（自然科学版）,2004,25(3):33-37. 被引量：8
9孙斌.一种义项矩阵模型SMM[J].中文信息学报,2005,19(2):28-35. 被引量：3
10熊静娴,李生红.基于概念网络的文本信息监控技术[J].信息安全与通信保密,2005,27(10):57-59. 被引量：2

同被引文献60

1胡雨晴,纪明宇,王晨龙.基于依存句法的句子相似度计算方法[J].智能计算机与应用,2020(4):113-118. 被引量：2
2赵园丁.浅谈人工智能时代背景下自然语言处理技术的发展应用[J].办公自动化,2019,24(10):63-64. 被引量：6
3梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量：28
4蒋东兴,郭大勇,罗念龙,刘启新.清华大学新一代数字校园建设规划与实践[J].厦门大学学报（自然科学版）,2007,46(A02):173-178. 被引量：79
5侯永芳.乌普萨拉监测中心在Vigibase数据库中应用MedDRA术语集[J].中国药物警戒,2008,5(4):242-243. 被引量：12
6石晶,范猛,李万龙.基于LDA模型的主题分析[J].自动化学报,2009,35(12):1586-1592. 被引量：34
7吴桂芝,田春华,王丹,冯红云,陈易新.WHOART和MedDRA在药品不良反应监测中的应用[J].中国药物警戒,2010,7(2):81-85. 被引量：34
8洪智勇,刘华,邓维斌,秦克云.基于粗糙集与相关向量机的文本分类新方法[J].计算机仿真,2010,27(7):183-186. 被引量：3
9葛斌,李芳芳,郭丝路,汤大权.基于知网的词汇语义相似度计算方法研究[J].计算机应用研究,2010,27(9):3329-3333. 被引量：66
10张亮,尹存燕,陈家骏.基于语义树的中文词语相似度计算与分析[J].中文信息学报,2010,24(6):23-30. 被引量：36

引证文献5

1党鹏飞.网络多媒体数据库相似信息检索方法研究[J].新一代信息技术,2019,2(23):84-88.
2黄子阳,王诗远,刘癸壬,刘沛.基于SAS软件开发的MedDRA自动编码系统[J].中国卫生统计,2021,38(2):315-318. 被引量：1
3董星彤,陈士宏,陈淑鑫.自然语言处理文本查重优化算法设计[J].科学技术与工程,2022,22(3):1091-1097. 被引量：9
4王辉,Mariu.sPetrescu,潘俊辉,王浩畅,张强.基于知网的词语语义相似度改进算法研究[J].计算机与数字工程,2022,50(2):225-228.
5申震,王逊,黄树成,周尓昊.基于依存句法与词语语义的汉语句子相似度计算[J].江苏科技大学学报（自然科学版）,2022,36(2):65-72. 被引量：1

二级引证文献11

1汪亚东.一种基于字符对比的文本相似度计算方法[J].计算机时代,2023(6):87-91. 被引量：1
2陈啸,陈建译,张浩骞.基于知识图谱的CTC系统故障诊断方法研究[J].铁道通信信号,2023,59(6):26-31. 被引量：2
3韩兵,杨桂秀,磨筱垚.基于文本分类算法梳理MedDRA中文术语集[J].中国新药与临床杂志,2023,42(5):331-336. 被引量：1
4杨宇,闫钰,申芳,谷宇恒.基于机器和深度学习的入侵检测综述[J].科学技术与工程,2023,23(18):7607-7621. 被引量：4
5曾攀,袁黎晖.基于蜜蜂知识图谱智能问答系统[J].信息技术与信息化,2023(7):108-111. 被引量：1
6赵文彬,王佳琦,吴峰,任雁,安寅生.基于图神经网络文档相似度的实体与关系层次匹配方法[J].郑州大学学报（理学版）,2023,55(6):8-14.
7程兆亮,沈雅婷,唐俊杰,王泽铭.改进过滤模型解决音变问题研究[J].电脑与电信,2023(9):5-10.
8刘文亮,吴飞,何德明,赵维伟,潘建宏.基于相异度矩阵的碎片化回复文本聚类方法[J].计算机与现代化,2024(9):56-60.
9戴研平,高晓勤,秦海霞.微课-慕课-翻转课堂立体教学模式及课程思政融入在病原生物与免疫学教学中的应用效果[J].中国当代医药,2024,31(25):150-154.
10刘旭,张艳,邓少阁,李满,张明.基于K-means算法的民航事故结构化分析[J].科学技术与工程,2024,24(30):13210-13217.

1完么扎西,尼玛扎西.基于语料的藏语动词短语结构与语法功能研究[J].西藏大学学报（藏文版）,2018(4):181-193.
2王少兵,吴升.基于景点在线评论文本的游客关注度和情感分析[J].贵州大学学报（自然科学版）,2017,34(6):69-73. 被引量：11
3谷重阳,徐浩煜,周晗,张俊杰.基于词汇语义信息的文本相似度计算[J].计算机应用研究,2018,35(2):391-395. 被引量：30
4黄登娴.英语翻译软件翻译准确性矫正算法设计[J].现代电子技术,2018,41(14):170-172. 被引量：12
5张春英,李春虎,付其峰.基于WV-CNN的中文文本语义相似度计算方法[J].华北理工大学学报（自然科学版）,2019,41(1):123-132. 被引量：7
6万莹,张光兰,谭武坤.基于Word2Vec的缺陷定位方法研究[J].现代计算机,2019,25(3):16-20. 被引量：1
7高虹.中国当代少女成长小说中的文化语境映射——以彭学军、陈雪、笛安的作品为例[J].大连民族大学学报,2018,20(6):543-546.
8魏晨,龚龑,鲁啸,马燃.基于语义Web的多功能情报信息自适应检索技术[J].科学技术与工程,2019,19(5):211-216. 被引量：8
9何云,李彤,王炜,李响,兰微.一种面向软件特征定位问题的语义相似度集成方法[J].计算机研究与发展,2019,56(2):394-409. 被引量：5

计算机与数字工程

2019年第2期

浏览历史

内容加载中请稍等...

一种基于语料的词汇语义相似度认知算法被引量：5

参考文献6

二级参考文献47

共引文献343

同被引文献60

引证文献5

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种基于语料的词汇语义相似度认知算法 被引量：5

参考文献6

二级参考文献47

共引文献343

同被引文献60

引证文献5

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

一种基于语料的词汇语义相似度认知算法被引量：5