基于犹豫模糊权重的数学表达式检索被引量：1

Retrieving Mathematical Expressions Based on Hesitant Fuzzy Weight

导出

摘要【目的】从大量数学表达式中检索出与查询表达式相似的表达式,并对检索结果排序。【方法】提取单个数学表达式的特征子式,利用犹豫模糊集理论计算每个特征子式的权重值;将属于同一表达式的子式权重值进行累加,计算表达式间的相似度得分,按照分数从高到低的顺序排列检索结果。【结果】从时间和相似度的角度进行分析,本文方法检索效率较高,检索结果较准确,本文排序方法的NDCG值最高为0.88,表明该排序方法较合理。【局限】本文排序方法并非完全面向数学表达式语义检索。【结论】引入犹豫模糊集计算子式权重能够更准确地检索出具有相同结构特征的数学表达式。 [Objective] This paper proposes a retrieval method for mathematical expressions, aiming to find items matching the queries from a large collection of math expressions. [Methods] Firstly, we extracted characteristic subformulas of each single mathematical expression and introduced the theory of hesitant fuzzy sets(HFSs) to compute their weights. Secondly, we added the weight values of all subformulas belonging to the same expression as the similarity scores between the index and query. Finally, we ranked retrieved results with the similarity scores. [Results] The proposed method had higher retrieval efficiency and better results than traditional methods,with the highest NDCG value reached 0. 88. [Limitations] Our method did not fully address the semantics of mathematical expressions. [Conclusions] The proposed method could retrieve the needed mathematical expressions more accurately.

作者徐以聪田学东李新福杨芳史青宣 Xu Yicong;Tian Xuedong;Li Xinfu;Yang Fang;Shi Qingxuan(School of Cyber Security and Computer,Hebei University,Baoding 071002,China)

机构地区河北大学网络空间安全与计算机学院

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第7期118-126,共9页 Data Analysis and Knowledge Discovery

基金国家自然科学基金项目“数学表达式资源获取与检索模型研究”(项目编号:61375075) 河北省自然科学基金项目“引入犹豫模糊逻辑的数学检索结果文档排序”(项目编号:F2019201329) 河北省教育厅河北省高等学校科学技术研究重点项目“基于犹豫模糊集的古籍汉字图像检索”(项目编号:ZD2017208)的研究成果之一。

关键词数学表达式检索犹豫模糊集理论子式权重相似度得分 Mathematical Expressions Retrieval HFSs Weight of Subformula Similarity Score

分类号 TP393 [自动化与计算机技术—计算机应用技术] G250 [文化科学—图书馆学]

引文网络
相关文献

参考文献3

1李夏梦,潘广贞.基于消息摘要算法第五版和IDEA的混合加密算法[J].科学技术与工程,2017,17(9):233-238. 被引量：7
2周南,田学东.LaTeX数学表达式解析与索引方法[J].计算机应用,2016,36(3):833-836. 被引量：5
3徐建民,许彩云.基于文本和公式的科技文档相似度计算[J].数据分析与知识发现,2018,2(10):103-109. 被引量：8

二级参考文献25

1刘毅.关于Treap数据结构问题的研究[J].计算机应用与软件,2005,22(8):36-38. 被引量：2
2王津涛,覃尚毅,王冬梅.基于MD5的迭代冗余加密算法[J].计算机工程与设计,2007,28(1):41-42. 被引量：16
3MINER R, MUNAVALLI R. An approach to mathematical search through query formulation and data normalization [ M]// KAUERS M, KERBER M, MINER R, et al. Towards Mechanized Mathematical Assistants, LNCS4573. Berlin: Springer, 2007:342-355.
4LIBBRECHT P, MELIS E. Semantic search in leactivemath [ EB/ OL]. [ 2015- 03- 12]. http://www, hoplahup, net/copyleft/Lib- brecht-etal-Semantic-Search-WebALT-06, pdf.
5GUO W, SU W, LI L, et al. MQL: a mathematical formula query language for mathematical search [ C]// CSE 2011 : Proceedings of the 2011 14th International Conference on Computational Science and Engineering. Piscataway, NJ: IEEE, 2011: 245 - 250.
6LIN X, GAO L, HU X, et al. A mathematics retrieval system for formulae in layout presentations [ C]//SIGIR '14: Proceedings of the 37th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2014:697 -706.
7HU X, GAO L, LIN X, et al. WikiMirs: a mathematical informa- tion retrieval system for Wikipedia [ C]//JCDL '13: Proceedings of the 13th ACM/IEEE-CS Joint Conference on Digital libraries. New York: ACM, 2013:11 -20.
8TIAN X, YANG S, LI X, et al. An indexing method of mathematical expression retrieval [ C]//Proceedings of the 2013 3rd International Conference on Computer Science and Network Technology. Piscataway, NJ: IEEE, 2013:574 -578.
9ZANIBBI R. Recognition of mathematics notation via computer using baseline structure [ EB/OL]. [ 2015- 04- 02]. http://research, cs. queensu, ca/TechReports/Reports/2000-439, pdf.
10郭庆琳,李艳梅,唐琦.基于VSM的文本相似度计算的研究[J].计算机应用研究,2008,25(11):3256-3258. 被引量：101

共引文献17

1宰新宇,田学东.基于公式描述结构和词嵌入的科技文档检索方法[J].数据分析与知识发现,2020,4(1):131-138. 被引量：4
2李春霞,许键,彭艳兵.基于语义关联融合的案件识别[J].数字技术与应用,2024,42(3):155-160.
3许金.煤矿安全监控系统数据防篡改研究[J].煤矿安全,2020,0(2):116-119. 被引量：13
4刘菲.基于加权层次子树模型的XML文档相似度的计算[J].中国科技纵横,2019,0(14):39-40.
5田学东,崔晓娟.基于数学表达式特征的科技文档检索模型[J].河北大学学报（自然科学版）,2017,37(6):652-661. 被引量：1
6李高鹏,艾山·吾买尔,郑炅,王路路.文本信息检索系统的设计与实现[J].现代电子技术,2019,42(16):62-66. 被引量：1
7郭聪,马强,张子剑.基于隐写技术的气象数据安全保护研究[J].计算机技术与发展,2019,29(8):119-124. 被引量：1
8扈玮,王立华.基于加盐BCrypt算法的电商安全模块设计及实现[J].计算机系统应用,2019,28(10):80-85. 被引量：1
9徐建民,何丹丹,吴树芳.基于文档关系的扩展信念网络检索模型[J].情报学报,2019,38(11):1160-1165. 被引量：3
10何丹丹,吴树芳,徐建民.基于文档关系改进的向量空间模型[J].河北大学学报（自然科学版）,2020,40(3):322-327. 被引量：6

同被引文献11

1胡雨晴,纪明宇,王晨龙.基于依存句法的句子相似度计算方法[J].智能计算机与应用,2020(4):113-118. 被引量：2
2余旭,刘继红,何苗.基于领域本体的复杂产品设计知识检索技术[J].计算机集成制造系统,2011,17(2):225-231. 被引量：33
3尹超,夏卿,黎振武.基于OWL-S的云制造服务语义匹配方法[J].计算机集成制造系统,2012,18(7):1494-1502. 被引量：38
4涂建伟,李彦,李文强,熊艳.一种面向产品创新设计的知识检索模型与实现[J].计算机集成制造系统,2013,19(2):300-308. 被引量：21
5刘小弟,朱建军,张世涛,刘国栋.考虑属性权重优化的犹豫模糊多属性决策方法[J].控制与决策,2016,31(2):297-302. 被引量：26
6张田会,张发平,阎艳,钱翰博.基于本体和知识组件的夹具结构智能设计[J].计算机集成制造系统,2016,22(5):1165-1178. 被引量：18
7方伟光,郭宇,廖文和,王发麟.基于本体的复杂产品设计知识表示和标注方法[J].计算机集成制造系统,2016,22(9):2063-2071. 被引量：21
8翟社平,李兆兆,段宏宇,李婧,董迪迪.多特征融合的句子语义相似度计算方法[J].计算机工程与设计,2019,40(10):2867-2873. 被引量：14
9吴浩,艾山·吾买尔,卡哈尔江·阿比的热西提,王路路,吐尔根·依布拉音.融合词性特征的中文句子相似度计算方法[J].计算机工程与设计,2020,41(1):150-155. 被引量：6
10刘继明,于敏敏,袁野.基于句向量的文本相似度计算方法[J].科学技术与工程,2020,20(17):6950-6955. 被引量：10

引证文献1

1张宇飞,王宏伟,翟翔,牛东晓,曹孟媛.基于知识图谱和犹豫模糊理论的复杂产品设计知识检索系统[J].高技术通讯,2023,33(2):208-220.

1徐以聪,田学东,左丽娜.基于运算符信息的数学表达式检索方法[J].计算机工程,2020,46(4):77-84. 被引量：2
2于晓明,史胜楠,甘克勤.基于Solr的标准信息检索技术及其优化[J].科学技术与工程,2020,20(4):1504-1508. 被引量：13
3宰新宇,田学东.基于公式描述结构和词嵌入的科技文档检索方法[J].数据分析与知识发现,2020,4(1):131-138. 被引量：4

数据分析与知识发现

2020年第7期

浏览历史

内容加载中请稍等...

基于犹豫模糊权重的数学表达式检索被引量：1

参考文献3

二级参考文献25

共引文献17

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于犹豫模糊权重的数学表达式检索 被引量：1

参考文献3

二级参考文献25

共引文献17

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于犹豫模糊权重的数学表达式检索被引量：1