基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展被引量：11

Vietnamese-English Cross Language Query Post-Translation Expansion Based on All-Weighted Positive and Negative Association Patterns Mining

下载PDF

导出

摘要主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确性. Topic drift and word mismatch are a difficult problem in natural language processing.The combination of text mining and information retrieval can help to solve the problem.In view of this,this paper proposes an algorithm of Vietnamese-English cross language(VECL)query post-translation expansion based on all-weighted positive and negative association pattern mining.The algorithm utilized a computing method of support and correlation degree of all-weighted positive and negative itemset,and mined the all-weighted positive and negative association pattern related to the original query by the pattern evaluation framework in the user relevance feedback document set from the VECL first retrieval results.The expansion terms were extracted from the patterns in order to carry out VECL query post-translation expansion.A comparison between the proposed algorithm and the existing cross language query expansion algorithms based on pseudo relevance feedback and weighted association pattern mining is made,which shows that the former can effectively reduce the problems of query topic drift and word mismatch,and improve the performance of cross language information retrieval.And moreover,the method of pattern mining in this paper can be used in recommender systems and improve its accuracy.

作者黄名选蒋曹清 HUANG Ming-xuan;JIANG Cao-qing(Guangxi Key Laboratory Cultivation Base of Cross-border E-commerce Intelligent Information Processing,Guangxi University of Finance and Economics,Nanning,Guangxi 530003,China;School of Information and Statistics,Guangxi University of Financeand Economics,Nanning,Guangxi 530003,China)

机构地区广西跨境电商智能信息处理重点实验室培育基地(广西财经学院) 广西财经学院信息与统计学院

出处《电子学报》 EI CAS CSCD 北大核心 2018年第12期3029-3036,共8页 Acta Electronica Sinica

基金国家自然科学基金(No.61762006 No.61662003 No.61262028)

关键词自然语言处理信息检索文本挖掘模式挖掘查询扩展推荐系统 natural language processing information retrieval text mining pattern mining query expansion recommender system

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1魏露,李书琴,李伟男,李新乐.跨语言查询扩展优化[J].计算机工程与设计,2014,35(8):2785-2788. 被引量：9
2黄名选.基于加权关联模式挖掘的越英跨语言查询扩展[J].情报学报,2017,36(3):307-318. 被引量：12
3黄名选.完全加权模式挖掘与相关反馈融合的印尼汉跨语言查询扩展[J].小型微型计算机系统,2017,38(8):1783-1791. 被引量：12
4吴丹,何大庆,王惠临.基于伪相关反馈的跨语言查询扩展[J].情报学报,2010,29(2):232-239. 被引量：19
5周秀梅,黄名选.基于项权值变化的完全加权正负关联规则挖掘[J].电子学报,2015,43(8):1545-1554. 被引量：14
6周秀梅,黄名选.基于项权值变化的矩阵加权关联规则挖掘[J].计算机应用研究,2015,32(10):2918-2923. 被引量：9

二级参考文献68

1刘远超,王晓龙,徐志明,刘秉权.基于粗集理论的中文关键词短语构成规则挖掘[J].电子学报,2007,35(2):371-374. 被引量：17
2Ruthven I,Lalmas M.A survey on the use of relevance feedback for information access systems[J].The Knowledge Engineering Review,2003,18(2):95-145.
3Harman D.Relevance feedback revisited[C]// Proceedings of the 15th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,1992:1-10.
4Xu J,Croft W B.Query expansion using local and global document analysis[C]//Proceedings of the 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,1996:4-11.
5Orengo V M,Huyck C.Relevance feedback and cross-language information retrieval[J].Information Processing & Management,2006,42(5):1203-1217.
6Ballestors L A,Croft W B.Phrasal translation and query expansion techniques for cross-language information retrieval[C]// Proceedings of the 20th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,1997:84-91.
7McNamee P,Mayfield J.Comparing cross-language query expansion techniques by degrading translation resources[C]// Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2002:159-166.
8Gao J F,et al.TREC-9 CLIR Experiments at MSRCN[C]// Proceedings of the 9th Text Retrieval Conference,2001:343-353.
9Lavrenko V,Croft W B.Relevance-based language models[C]// Proceedings of the 24th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2001:120-127.
10Wu Dan,He Daqing.ICE-TEA:an Interactive Cross-language Search Engine with Translation Enhancement[C]// Proceedings of 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2008:882.

共引文献37

1仲兆满,朱平,李存华,管燕,刘宗田.一种基于局部分析面向事件的查询扩展方法[J].情报学报,2012,31(2):151-159. 被引量：10
2吴丹,何大庆,王惠临.一种基于相关反馈的跨语言信息检索查询翻译优化技术研究[J].情报学报,2012,31(4):398-406. 被引量：8
3王君泽,张祥,徐晓林.基于大规模问答对数据的查询扩展技术研究[J].情报学报,2012,31(4):407-415. 被引量：2
4吴丹.交互式跨语言信息检索中用户行为研究[J].中国图书馆学报,2012,38(3):78-90. 被引量：12
5胡积宝,周佳骏,黄名选,汪婷婷.基于U-P2P元组空间知识协作模式的中越跨语言查询扩展[J].计算机应用研究,2013,30(6):1742-1746.
6唐晓波,房小可.一种面向微博的查询扩展方法[J].图书情报工作,2014,58(1):130-135. 被引量：6
7白如江,杨振瑜,王效岳.基于KeyGraph关键词抽取的长句查询扩展技术研究[J].情报理论与实践,2014,37(6):123-127. 被引量：1
8曾雷.基于项权值变化的矩阵加权关联规则挖掘和扩展查询技术信息检索模型研究[J].软件导刊,2015,14(7):159-160. 被引量：2
9司莉,贾欢.2004—2014年我国多语言信息组织与检索研究进展与启示[J].情报学报,2015,34(6):662-672. 被引量：10
10程丹丹,何利力.基于遗传算法关联规则的零售户行为特征挖掘[J].工业控制计算机,2016,29(8):116-117. 被引量：2

同被引文献51

1肖勇,郑楷洪,余忠忠,周密,李森,马千里.基于三次指数平滑模型与DBSCAN聚类的电量数据异常检测[J].电网技术,2020,44(3):1099-1104. 被引量：61
2于再富,袁满.融合BabelNet的多语言智能信息检索模型[J].吉林大学学报（信息科学版）,2020,38(1):99-106. 被引量：7
3彭鑫,赵文耘,钱乐秋.基于领域特征本体的构件语义描述和组装[J].电子学报,2006,34(B12):2473-2477. 被引量：5
4王旭阳.基于本体和用户相关反馈的扩展查询研究[J].计算机应用,2008,28(11):2958-2960. 被引量：3
5郝嘉树,王惠临,刘耀.基于本体的跨语言信息检索模型和关键技术研究[J].情报科学,2009,27(2):271-275. 被引量：10
6闭剑婷,苏一丹.基于潜在语义分析的跨语言查询扩展方法[J].计算机工程,2009,35(10):49-50. 被引量：13
7黄名选,严小卫,张师超.基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J].软件学报,2009,20(7):1854-1865. 被引量：70
8黄名选,严小卫,张师超.基于完全加权关联规则挖掘和查询扩展的信息检索[J].计算机应用与软件,2009,26(8):26-28. 被引量：8
9吴丹,何大庆,王惠临.基于伪相关反馈的跨语言查询扩展[J].情报学报,2010,29(2):232-239. 被引量：19
10宁健,林鸿飞.基于改进潜在语义分析的跨语言检索[J].中文信息学报,2010,24(3):105-111. 被引量：14

引证文献11

1黄名选,夏国恩,高荣,蒋曹清.融合加权模式挖掘与规则混合扩展的跨语言检索[J].小型微型计算机系统,2019,40(9):2013-2020. 被引量：11
2黄名选,蒋曹清.基于项权值排序挖掘的跨语言查询扩展[J].电子学报,2020,48(3):568-576. 被引量：11
3李青,钟将,李立力,李琪,张淑芳,张剑.一种依需聚合的语义解析图查询模型[J].电子学报,2020,48(4):763-771. 被引量：3
4黄名选,胡小春.融合Copulas理论和关联规则挖掘的查询扩展[J].模式识别与人工智能,2021,34(2):176-187.
5王培培,孟芸.多段支持度数据频繁模式关联规则挖掘仿真[J].计算机仿真,2021,38(5):282-286. 被引量：4
6黄名选,蒋曹清,卢守东.基于词嵌入与扩展词交集的查询扩展[J].数据分析与知识发现,2021,5(6):115-125. 被引量：3
7黄名选.关联模式挖掘与词向量学习融合的伪相关反馈查询扩展[J].电子学报,2021,49(7):1305-1313. 被引量：4
8张秀云.基于用户日志双向聚类的跨语言信息检索系统设计[J].现代电子技术,2021,44(24):158-162. 被引量：2
9黄名选,胡小春.深度学习与关联模式挖掘融合的查询扩展[J].小型微型计算机系统,2022,43(6):1293-1302.
10李成严,李鑫宇,张磊,王广泽.独立概率完全加权关联规则的并行挖掘算法[J].哈尔滨理工大学学报,2023,28(6):111-120.

二级引证文献41

1刘高军,方晓,段建勇.基于深度语义信息的查询扩展[J].计算机应用,2020,40(11):3192-3197. 被引量：4
2张胜祥,石超,姜欣,张迎.基于大数据技术的信息频繁项集挖掘研究[J].自动化与仪器仪表,2020(11):42-45. 被引量：5
3陈志奎,刘振娇,原旭,罗方,赵亮.基于深度多模态与核密度估计的法律文书推荐模型[J].西北师范大学学报（自然科学版）,2021,57(1):31-37. 被引量：1
4黄名选,胡小春.融合Copulas理论和关联规则挖掘的查询扩展[J].模式识别与人工智能,2021,34(2):176-187.
5黄名选,蒋曹清,卢守东.基于词嵌入与扩展词交集的查询扩展[J].数据分析与知识发现,2021,5(6):115-125. 被引量：3
6邓斌,陈会平,李凯勇.基于元数据关联特征的交互式数据快速查询[J].计算机仿真,2021,38(7):371-375. 被引量：4
7黄名选.关联模式挖掘与词向量学习融合的伪相关反馈查询扩展[J].电子学报,2021,49(7):1305-1313. 被引量：4
8欧安清.基于关联规则挖掘的网络信息检索方法[J].信息与电脑,2021,33(13):174-176. 被引量：3
9赵宏伟.基于智能数据分析的电子档案转递查询方法[J].信息技术,2021,45(9):39-44. 被引量：3
10李英,汤庸.基于关联规则与相似度的数据挖掘算法研究[J].华南师范大学学报（自然科学版）,2021,53(5):121-127. 被引量：37

1兰慧红.跨语言查询扩展技术研究进展[J].电子技术与软件工程,2017(23):142-143.
2黄名选,蒋曹清,何冬蕾.基于矩阵加权关联规则的跨语言查询译后扩展[J].模式识别与人工智能,2018,31(10):887-898. 被引量：10
3黄新川.多维关联模式下多丽丝·莱辛小说的叙事艺术研究[J].哈尔滨学院学报,2018,39(11):79-82.
4杨志明.基于词向量的图书馆图书推荐模式研究[J].现代商贸工业,2019,40(4):189-190. 被引量：1
5朱爱军,陈端勇,许川佩,胡聪,李智.光片上网络MRR故障检测方法研究[J].电子测量与仪器学报,2017,31(8):1200-1206. 被引量：5
6赵明,闫寒,曹高峰,刘昕鸿.融合用户信任度和相似度的基于核心用户抽取的鲁棒性推荐算法[J].电子与信息学报,2019,41(1):180-186. 被引量：13
7张慧姝.3D打印的个性化创意设计及民主制造应用研究[J].包装工程,2018,39(20):201-206. 被引量：4
8谢京晶,洪丽娟.浅谈药物领域专利申请快速检索技巧[J].中国发明与专利,2018,15(12):125-128. 被引量：1
9杨久婷.一种数据挖掘算法在课程中的研究[J].科技通报,2018,0(11):221-226. 被引量：1
10张晓光,王尚法.介词OVER多义性的认知分析研究[J].山西大同大学学报（社会科学版）,2018,32(6):67-70. 被引量：2

电子学报

2018年第12期

浏览历史

内容加载中请稍等...

基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展被引量：11

参考文献6

二级参考文献68

共引文献37

同被引文献51

引证文献11

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展 被引量：11

参考文献6

二级参考文献68

共引文献37

同被引文献51

引证文献11

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展被引量：11