基于分布式计算框架Spark的语义相关度计算方法被引量：1

下载PDF

导出

摘要该文利用了分布式方法构建分布式语义相关度计算框架,提出了分布式语义分析的新方法,构建巨大的语义空间。该方法通过构建一系列的概念向量以及与其相关的维基百科中的词构成概念向量的维数,从而构建概念-词语矩阵。然后,通过提取概念-词语矩阵的两个词语向量,根据它们的余弦测度计算两个词语的语义相关度。该方法建立在开源分布式计算框架Spark上。对比已有的显式语义分析(Explicit Semantic Analysis Method)方法,该文提出的方法在构建概念-词语向量空间时,明显地减少了计算时间。同时,实验结果表明,数据量足够大时,本方法的Spearman相关系数达到0.797。

作者殷晓春

机构地区南京信息职业技术学院人工智能学院

出处《电脑知识与技术》 2023年第33期72-75,共4页 Computer Knowledge and Technology

关键词分布式计算语义相关度维基百科权重

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1吴勇,刘钰峰.基于相关度的局部潜在语义分析算法研究[J].控制工程,2017,24(8):1701-1706. 被引量：9
2王文,王树锋,李洪华.基于文本语义和表情倾向的微博情感分析方法[J].南京理工大学学报,2014,38(6):733-738. 被引量：23
3黄承宁,李双梅,景波.基于深度学习表示的医学主题语义相似度计算研究[J].计算机与数字工程,2022,50(6):1149-1152. 被引量：5

二级参考文献19

1张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
2郭岩,白硕,于满泉.Web使用信息挖掘综述[J].计算机科学,2005,32(1):1-7. 被引量：50
3朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
4徐军,丁宇新,王晓龙.使用机器学习方法进行新闻的情感自动分类[J].中文信息学报,2007,21(6):95-100. 被引量：107
5王永智,滕至阳,王鹏,聂江涛.基于LSA和SVM的文本分类模型的研究[J].计算机工程与设计,2009,30(3):729-731. 被引量：10
6张玉峰,何超.基于潜在语义分析和HS-SVM的文本分类模型研究[J].情报理论与实践,2010,33(7):104-107. 被引量：9
7李寿山,黄居仁.基于Stacking组合分类方法的中文情感分类研究[J].中文信息学报,2010,24(5):56-61. 被引量：43
8宋淑彩,庞慧,丁学钧.GA-SVM算法在文本分类中的应用研究[J].计算机仿真,2011,28(1):222-225. 被引量：12
9刘志明,刘鲁.基于机器学习的中文微博情感分类实证研究[J].计算机工程与应用,2012,48(1):1-4. 被引量：124
10谢丽星,周明,孙茂松.基于层次结构的多策略中文微博情感分析和特征抽取[J].中文信息学报,2012,26(1):73-83. 被引量：199

共引文献34

1王琳.主体参与扎实训练──第八册《基础训练7》教学设计[J].小学语文教学,2000(6):56-56.
2寇凯.基于舆论数据的中文情感分析研究[J].无线互联科技,2016,13(1):118-119. 被引量：1
3闪四清,林萧,张瞳.基于UGC的城市灾害损失动态评估模型[J].武汉理工大学学报（信息与管理工程版）,2016,38(1):1-7. 被引量：1
4杨启悦,余正涛,洪旭东,高盛祥,汤智文.基于维基百科的汉越词语相似度计算[J].南京理工大学学报,2016,40(4):461-466. 被引量：1
5吴超,温金萍,徐朝军.基于语义规则的基础教育网站用语情感分析[J].情报探索,2017(2):1-5.
6张仰森,孙旷怡,杜翠兰,王建,佟玲玲.一种级联式微博情感分类器的构建方法[J].中文信息学报,2017,31(5):178-184. 被引量：6
7李燕,卫志华,徐凯.基于Lasso算法的中文情感混合特征选择方法研究[J].计算机科学,2018,45(1):39-46. 被引量：8
8李继东,王移芝.基于扩展词典与语义规则的中文微博情感分析[J].计算机与现代化,2018(2):89-95. 被引量：13
9魏勇.关联语义结合卷积神经网络的文本分类方法[J].控制工程,2018,25(2):367-370. 被引量：11
10张强,陶皖,王海燕.微博情感分析综述[J].安庆师范大学学报（自然科学版）,2017,23(4):68-74. 被引量：2

同被引文献4

1王传,吴霄汉,吴岚.基于可控聚类边缘计算算法的实时大数据流研究与分析[J].长江信息通信,2023,36(2):51-54. 被引量：2
2贾淑滟.基于Spark技术的大数据智能分析平台构建[J].滨州学院学报,2023,39(6):86-91. 被引量：1
3阎红灿,王小雨,刘盈.基于Spark平台的异常流量实时检测[J].电脑知识与技术,2023,19(36):62-65. 被引量：1
4牛庆丽,朱耀琴.基于Spark计算的大数据终端潜在异常识别仿真[J].计算机仿真,2024,41(1):518-521. 被引量：2

引证文献1

1吴彩旭,张晶.基于Spark计算的大数据终端潜在异常识别仿真[J].软件,2024,45(6):31-33.

1安文涛,陈珊珊.一种基于RippleNet模型的推荐精度提高方法[J].计算技术与自动化,2023,42(4):125-130.
2Li Yujie,Zhang Jingjing,Jiang Wei,Wang Chunxiao.Research on emotional space for movie and TV drama videos[J].The Journal of China Universities of Posts and Telecommunications,2022,29(5):73-82.
3李连梅,张莉敏,张慧.大概念统领下的概念教学——以“植物细胞”为例[J].中学生物学,2023,39(8):36-38.
4田杰,余亚男.复习中构建概念体系关联中把握度量本质--“面积的复习与关联”教学探索与实践[J].小学数学教师,2023(S01):38-44.
5陈佳琪.粤西滨海城市旅游竞争力评价[J].合作经济与科技,2023(23):22-25.
6张霞.基于图式表达的小学数学概念教学策略探究[J].数学学习与研究,2023(22):62-64. 被引量：1
7黄佳铭.多尺度特征跨层融合遥感目标检测方法[J].现代信息科技,2023,7(21):99-101.
8Joshua Gordon.Implementing explicit pronunciation instruction:The case of a nonnative English-speaking teacher(Ⅱ)[J].基础教育外语教学研究,2023(10):33-38.
9Dorian Goldfeld,Eric Stade,Michael Woodbury.The functional equations of Langlands Eisenstein series for SL(n,Z)[J].Science China Mathematics,2023,66(12):2731-2748. 被引量：1
10Siyu Sun,Kehan Wang,Zhanglian Hong,Mingjia Zhi,Kai Zhang,Jijian Xu.Electrolyte Design for Low‑Temperature Li‑Metal Batteries:Challenges and Prospects[J].Nano-Micro Letters,2024,16(2):365-382. 被引量：1

电脑知识与技术

2023年第33期

浏览历史

内容加载中请稍等...

基于分布式计算框架Spark的语义相关度计算方法被引量：1

参考文献3

二级参考文献19

共引文献34

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于分布式计算框架Spark的语义相关度计算方法 被引量：1

参考文献3

二级参考文献19

共引文献34

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于分布式计算框架Spark的语义相关度计算方法被引量：1