信息熵在粗糙集信息检索模型中的应用被引量：2

Information Retrieval Models Based on Information Entropy Rough Sets and Its Applications

下载PDF

导出

摘要在信息检索过程中,由于文档中存在大量的多义和近义现象,导致不确定性出现,这将影响检索的性能。为此我们采用信息熵和粗糙集理论来处理这类不确定性问题。首先计算训练文档集中的词之间的信息熵,对信息熵做模糊聚类来构造词之间的等价关系,然后借助于该等价关系提出并实现了一个以粗糙集上下近似为基础的信息检索模型,通过实验的测试,该模型能够提高信息检索的效率。 In the processing of information retrieval, the existence of polysemy and synonymy would lead to uncertainty, which reduce the effective of information retrieval. In this paper, a model based on information entropy is proposed, in which the uncertainty is captured by rough sets. At first, we count the information entropy between the words of the training corpus, and then the mutual information is employed to build an equivalent relation through fuzzy clustering. We propose and implement an information retrieval model based on upper and lower approximations of rough sets, which resort to equivalent relation. Experiments show that the model can get improvement of information retrieval.

作者刘有珠付雪峰刘邱云

机构地区南昌工程学院计算机科学与技术系江西师范大学数学与信息科学学院

出处《模糊系统与数学》 CSCD 北大核心 2010年第3期149-153,共5页 Fuzzy Systems and Mathematics

基金江西省科技支撑项目(200720015)

关键词信息熵模糊聚类粗糙集信息检索 Information Entropy Fuzzy Clustering Rough Sets Information Retrieval

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献12

1左家莉,王明文,王希.基于Markov网络的信息检索扩展模型[J].清华大学学报（自然科学版）,2005,45(S1):1847-1852. 被引量：9
2Wang M W, Nie J Y. A Dempster-Shafer model for query expansion[J]. Journal of Jiangxi Normal University (Nature Science), 2004,29 (3) : 210- 216.
3曾雪强,王明文,陈素芬.一种基于潜在语义结构的文本分类模型[J].华南理工大学学报（自然科学版）,2004,32(z1):99-102. 被引量：27
4刘清.Rough集及Rough推理[M].北京:科学出版社,2003..
5Pawlak Z. Rough sets theoretical aspects of reasoning about data[M]. Dordrecht :Kluwer Academic Publishers, 1991 : 15-16.
6Yang Y M, Pederen Jan O. A comparative study on feature semection in text categorization[C]//Proceeding of the fourteenth international conference on machine learning(CML' 97), 1997 : 121-129.
7史忠值.知识发现[M].北京：清华大学出版社,2002.21-56.
8付雪峰,王明文.基于模糊-粗糙集的文本分类方法[J].华南理工大学学报（自然科学版）,2004,32(z1):73-76. 被引量：8
9刘邱云,付雪峰,吴根秀.可传递信度模型上的Rough算子及其应用[J].江西师范大学学报（自然科学版）,2008,32(2):246-248. 被引量：2
10李勃,王艳兵,姚青.基于粗糙集分类算法研究与实现[J].计算机工程与应用,2008,44(15):142-144. 被引量：5

二级参考文献31

1刘邱云,吴根秀,付雪峰.基于可传递信度模型的k-NN分类规则[J].江西师范大学学报（自然科学版）,2004,28(3):221-223. 被引量：2
2付雪峰,刘邱云,王明文.基于互信息的粗糙集信息检索模型[J].山东大学学报（理学版）,2006,41(3):17-19. 被引量：2
3曾黄麟.粗集理论及其应用－－关于数据推理的新方法[M].重庆:重庆大学出版社,1998..
4Quinlan J R.Induction of decision tree[J].Machine Learning, 1986, 1:81-106.
5Pawlak Z.Rough sets theoretical aspects of reasoning aleut data[M].Dordrect:Kluwer Academic Publishers, 1991.
6Ziarko W.Variable precision rough set model[J].Journal of Computer and System Sciences, 1993,46:39-59.
7[1]Dubois D,Prade H. Putting rough sets and fuzzy sets together [A]. Intelligent Decision Support: Handbook of Applications and Advanced of the Rough Set Theory [C].Boston: Slowinski R ED, Kluwer Academic Publishers, 1992. 203 - 222.
8[2]Yao Y Y. A comparative study of fuzzy sets and rough sets [J]. Information Sciences, 1998,109 (1-4): 227 -242.
9[4]Keller J M, Gray M R, Givens J A. A fuzzy k-nearest neighbor algorithm [J]. IEEE Transactions on System Man and Cybernetics, 1985,15 (4) :580 - 585.
10[5]Yang Y,Pederen J P. A comparative study on feature selection in text categorization [A]. Proceeding of the Fourteenth International Conference on Machine Learning (ICML97) [C]. Nashville Tennessee USA :Morgan Kaufmann, 1997.412 - 420.

共引文献101

1罗远胜,王明文,曾雪强.基于核方法的潜在语义文本分类模型[J].清华大学学报（自然科学版）,2005,45(S1):1853-1856. 被引量：4
2廖海波,万中英,王明文.基于投影寻踪回归文本自动分类的模型[J].清华大学学报（自然科学版）,2005,45(S1):1823-1827. 被引量：5
3叶浩,王明文,曾雪强.基于潜在语义的多类文本分类模型研究[J].清华大学学报（自然科学版）,2005,45(S1):1818-1822. 被引量：18
4陈思,钱铭宇,刘昌明.文本分类技术研究进展[J].电脑编程技巧与维护,2009(S1):22-24.
5孙士保,秦克云,王育辉.基于区分矩阵和区分函数进行属性约简的数据分类[J].河南科技大学学报（自然科学版）,2005,26(4):37-40. 被引量：3
6肖秦琨.基于贝叶斯网络的海上目标识别[J].微机发展,2005,15(10):152-154. 被引量：8
7王明文,付雪峰,左家莉.网页与文本自动分类综述[J].南昌工程学院学报,2005,24(3):20-25. 被引量：4
8肖水晶,曾苹,白似雪.属性约简及其在干部考核系统中的应用[J].计算机与现代化,2005(12):7-9.
9胡圣武,王新洲,谢玉波,陶本藻.基于粗集的GIS产品质量评价[J].武汉大学学报（信息科学版）,2006,31(1):74-77. 被引量：14
10吴新玲,毋国庆.基于数据变换的维数消减方法[J].武汉大学学报（理学版）,2006,52(1):73-76. 被引量：4

同被引文献13

1王治国,李永德.多准则评估方法在油料保障力量配置方案中的应用[J].训练与科技,2004,25(6):15-16. 被引量：2
2张敏,刘沃野.熵理论在装备采购组织结构优化中的应用[J].火力与指挥控制,2009,34(5):153-156. 被引量：3
3田丰,邢清华,廖玉忠.基于熵权TOPSIS的场站飞行后勤保障计划优选[J].火力与指挥控制,2010,35(12):11-13. 被引量：3
4王先甲,张熠.基于AHP和DEA的非均一化灰色关联方法[J].系统工程理论与实践,2011,31(7):1222-1229. 被引量：91
5周辅疆,朱小冬,顾宏余.信息熵与TOPSIS装备保障力量部署方案优化[J].火力与指挥控制,2011,36(9):73-76. 被引量：7
6林云,谢敏,黄波,郑朝清.TOPSIS定权的FCE法在物流供应商选择中的应用[J].计算机应用研究,2012,29(5):1806-1808. 被引量：14
7伍文,孟相如,马志强,梁霄.基于组合赋权的网络可生存性模糊综合评估[J].系统工程与电子技术,2013,35(4):786-790. 被引量：18
8弓建华,雷丽萍,武敏霞,李存斌.基于TOPSIS法和灰色关联度的电网企业运营风险综合评价[J].广东电力,2014,27(2):7-10. 被引量：14
9张芳兰,杨明朗,刘卫东.基于模糊TOPSIS方法的汽车形态设计方案评价[J].计算机集成制造系统,2014,20(2):276-283. 被引量：49
10阎西康,张博策,陈培.基于AHP-熵权TOPSIS法的天津市建筑业竞争力评价研究[J].工程管理学报,2015,29(6):6-10. 被引量：8

引证文献2

1ZHANG Zhicai,CHEN Li.Analysis on decision-making model of plan evaluation based on grey relation projection and combination weight algorithm[J].Journal of Systems Engineering and Electronics,2018,29(4):789-796. 被引量：10
2张志才,陈力.基于AHP-熵权TOPSIS的区域油料保障力量部署方案优化[J].火力与指挥控制,2018,43(9):50-54. 被引量：8

二级引证文献18

1林木,李小波,王彦锋,朱一凡.基于QFD和组合赋权TOPSIS的体系贡献率能效评估[J].系统工程与电子技术,2019,41(8):1802-1809. 被引量：17
2张航,潘宏侠,许昕,赵雄鹏.基于MRSVD与灰色理论的供输弹系统故障诊断研究[J].中国测试,2019,45(7):147-151. 被引量：3
3唐玉祥,陈新文.防空旅作战油料需求精准预测模型仿真分析[J].计算机仿真,2019,36(10):6-9. 被引量：1
4王珊珊.基于AHP-熵权TOPSIS法的津期店二泵站水泵优化选型[J].水利水电技术,2019,50(7):92-98. 被引量：8
5姜媛媛,张泓磊,张振振,杨斌,薛生,郑晓亮.基于博弈论综合法的城市供电系统安全评价[J].现代电子技术,2020,43(9):141-145. 被引量：6
6魏振堃,孔令兰,郭湛,赵素丽.基于直觉模糊投影的油料保障力量部署方案优选[J].信息工程大学学报,2019,20(6):733-738.
7范洁,杨世海,武文广,曹晓冬,陈浩.基于组合赋权的非介入式终端辨识能力灰色TOPSIS评价[J].电力工程技术,2020,39(6):110-116. 被引量：10
8赵素丽,易良廷,魏振堃.军队工程协同设计主体识别模型优化研究[J].火力与指挥控制,2021,46(3):143-149.
9谢尊贤,徐宝,骆信慧,姚聪.基于优化AHP与物元可拓模型的高层建筑施工安全风险评价[J].土木工程与管理学报,2021,38(2):98-104. 被引量：23
10张东,于洪敏,牛刚,吕艳梅.基于仿真的技术保障装备体系效能评估方法[J].火力与指挥控制,2021,46(9):78-82. 被引量：2

1付雪峰,刘邱云,王明文.基于互信息的粗糙集信息检索模型[J].山东大学学报（理学版）,2006,41(3):17-19. 被引量：2
2台德艺,谢飞,胡学钢.新的基于簇划分文本分类方法[J].计算机工程与设计,2009,30(6):1461-1463. 被引量：2
3周咏梅,陈旭日.基于支持向量机的文本分类研究[J].中国包装工业,2002(5):119-120. 被引量：1
4张冰波.改进类中心分类算法在文本分类中的应用[J].大众科技,2010,12(10):43-45.
5张昕.「おいしい」的新用法——与「うまい」比较[J].科技视界,2014(4):204-204.
6李斌.人机对话的信息系统:信息的检索和存取[J].管理观察,1997,0(11):49-49.
7汪小珍,李龙澍.基于模糊集的信息检索方法[J].计算机技术与发展,2010,20(2):37-39. 被引量：3
8吴进.基于FPGA的信息检索技术实现研究[J].微计算机信息,2008,24(14):190-191.
9赵正文,康耀红.统计语言模型在信息检索中的应用[J].计算机工程与应用,2006,42(36):158-161. 被引量：1
10刘俊熙.搜索引擎的搜索、索引和检索技术的关联分析[J].图书馆学研究,2005(9):84-86. 被引量：2

模糊系统与数学

2010年第3期

浏览历史

内容加载中请稍等...

信息熵在粗糙集信息检索模型中的应用被引量：2

参考文献12

二级参考文献31

共引文献101

同被引文献13

引证文献2

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

信息熵在粗糙集信息检索模型中的应用 被引量：2

参考文献12

二级参考文献31

共引文献101

同被引文献13

引证文献2

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

信息熵在粗糙集信息检索模型中的应用被引量：2