海量数据下的文本信息检索算法仿真分析被引量：16

Text Information Retrieval Algorithm Simulation Analysis under Massive Data

下载PDF

导出

摘要在海量数据下对文本信息进行准确检索,能够帮助人们获取新知识,提高工作效率。传统的检索方法不能对海量数据下文本信息特征的变化造成的影响做出反应,从而降低了文本信息检索的准确性。提出一种基于特征聚类的文本信息检索方法。对文本信息进行降维处理,保留主要的文本信息特征,消除冗余数据带来的影响;在文本信息检索的过程中,按照特征相似度对文本信息的特征进行聚类,确定文本信息检索的目标函数,并利用约束条件进行约束,在检索的过程中自适应调整文本信息特征的聚类中心和特征的权值,最终实现了文本信息的准确检索。仿真结果表明,改进算法能够提高海量数据下文本信息检索的准确率和效率。 The paper put forward a text information retrieval method based on the characteristics of clustering. Dimensionality reduction was carried out for text information processing, the main characteristics of text information was retained, and the effects of redundant data were eliminated. In the process of text information retrieval, and according to the characteristic similarity clustering characteristics of text information, the objective function of the text information retrieval was determined, and the constraint conditions of constraints were used in the process of retrieving the adaptive adjustment of text information features of clustering centers and weights. Finally the accurate retrieval of text information was realized. Simulation experimental results show that the improved algorithm can improve the mass data of text information retrieval accuracy and efficiency.

作者王莉军

机构地区中国科学技术信息研究所

出处《计算机仿真》 CSCD 北大核心 2016年第4期429-432,共4页 Computer Simulation

基金中国博士后科学基金项目资助(2013M541005)

关键词海量数据文本信息检索 Huge amounts of data Text information Retrieval

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1冉婕,漆丽娟.一种基于本体的语义检索设计与实现[J].电子设计工程,2015,23(5):12-14. 被引量：4
2杨海天,王健,林鸿飞.一种基于主题类别信息问句检索的新方法[J].计算机应用与软件,2015,32(2):24-27. 被引量：4
3张伟男,张宇,刘挺.一种面向社区型问句检索的主题翻译模型[J].计算机学报,2015,38(2):313-321. 被引量：7
4余一骄,刘芹.大规模中文语料库检索技术研究[J].计算机科学,2015,42(2):217-223. 被引量：4
5张永库,李云峰,孙劲光.基于改进颜色聚合向量与贡献度聚类的图像检索算法[J].计算机科学,2015,42(2):311-315. 被引量：8
6王新玲,徐健霞,郑清友,张宏.循证医学中文证据检索策略构建的方法[J].中国循证心血管医学杂志,2015,7(1):118-120. 被引量：3
7夏雪雁.类比思维在医学文献检索教学中的应用[J].中华医学图书情报杂志,2015,24(2):71-74. 被引量：6
8王蕊,胡德华.我国检索模型研究的文献计量分析[J].情报探索,2015(2):1-4. 被引量：1
9杨建永,户丽萍.浅析网络信息过载知识在文献检索课中的融合——以宿迁学院为例[J].图书馆界,2015(1):18-21. 被引量：2
10祝钢.数据库中密文检索优化模型仿真与研究[J].计算机仿真,2014,31(11):336-339. 被引量：4

二级参考文献156

1任海波.现代汉语AABB重叠式词构成基础的统计分析[J].中国语文,2001(4):302-308. 被引量：26
2曾宪涛,邝心颖,孙燕,冷卫东.什么是循证医学?[J].湖北医药学院学报,2013,32(1):1-5. 被引量：39
3谭晓阳,孙正兴,张福炎.交互式图像检索中的相关反馈技术研究进展[J].南京大学学报（自然科学版）,2004,40(5):639-648. 被引量：14
4沈晓静,尉天骄.大学生网上行为价值的传播学分析[J].南京工业大学学报（社会科学版）,2004,3(4):85-88. 被引量：4
5张谊生.“N”+“们”的选择限制与“N们”的表义功用[J].中国语文,2001(3):201-211. 被引量：37
6郭志法.信息过载与媒介素养教育[J].中国社会科学院研究生院学报,2006(1):129-133. 被引量：13
7李颖,尹玉珊,赖敏贞.文献检索在循证护理临床实践中应用现状调查分析及对策[J].国际医药卫生导报,2006,12(5):125-127. 被引量：15
8徐科,崔志明.基于搜索历史的用户兴趣模型的研究[J].计算机技术与发展,2006,16(5):18-20. 被引量：11
9何晓阳.关于文献检索教学的若干思考[J].中华医学图书情报杂志,2006,15(3):56-56. 被引量：2
10赵金海.近年来《文检课》教材编写新走向分析[J].图书馆建设,2006(3):93-96. 被引量：14

共引文献30

1王飞跃,王晓,袁勇,王涛,林懿伦.社会计算与计算社会：智慧社会的基础与必然[J].科学通报,2015,60(5):460-469. 被引量：78
2姚芹.形成性评价在医学高校文献检索课程评价中的应用[J].中华医学图书情报杂志,2015,24(5):73-76. 被引量：7
3管凤贞.基于学生需求的医学文献检索课教学改革[J].中华医学图书情报杂志,2015,24(7):78-80. 被引量：4
4林凌.关于语义网的学习资源推荐算法研究[J].信息通信,2015,28(9):33-33.
5王新玲,林静,陈彬.循证医学外文检索与构建检索策略的方法[J].中国循证心血管医学杂志,2016,8(2):142-143. 被引量：1
6王泽江,李敏,吴斌.组合参考框架下场景空间关系的自然语言描述[J].电子设计工程,2016,24(8):127-130. 被引量：2
7黄保华,王添晶,贾丰玮.数据库中数值型数据的加密存储与查询方法[J].计算机工程,2016,42(7):123-128. 被引量：24
8贾润亮.基于自然语言处理的知识检索算法研究[J].微电子学与计算机,2016,33(10):130-133. 被引量：2
9王晓英.海量冗余数据干扰下数据库中数据优化检索方法[J].华侨大学学报（自然科学版）,2016,37(6):758-761. 被引量：7
10粟千.弱化语法规则下英文机器翻译的优化仿真[J].计算机仿真,2016,33(11):414-417. 被引量：12

同被引文献111

1谌志群,张国煊.基于浅层文本分析的中文Web信息检索[J].杭州电子科技大学学报（自然科学版）,2008,28(1):48-51. 被引量：1
2王哲,徐燕文.基于差异化融合的语义信息检索模型仿真[J].微电子学与计算机,2015,32(1):146-149. 被引量：2
3张振跃,查宏远.Principal Manifolds and Nonlinear Dimensionality Reduction via Tangent Space Alignment[J].Journal of Shanghai University(English Edition),2004,8(4):406-424. 被引量：73
4骆正清,陈增武,胡上序.一种改进的MM分词方法的算法设计[J].中文信息学报,1996,10(3):30-36. 被引量：28
5李杰,曹谢东,余飞.基于语义相似度计算的词汇语义自动分类系统[J].计算机仿真,2008,25(8):295-299. 被引量：7
6杨晓兰,钟义信.基于文本理解的自动文摘系统研究与实现[J].电子学报,1998,26(7):155-158. 被引量：17
7韩毅,张克菊,金碧辉.集成概念空间与潜在语义索引的文本聚类检索研究[J].情报理论与实践,2009,32(6):102-105. 被引量：2
8康文宁,杨志强.相似度计算在智能答疑系统中的研究及应用[J].计算机技术与发展,2010,20(2):71-74. 被引量：11
9田久乐,赵蔚.基于同义词词林的词语相似度计算方法[J].吉林大学学报（信息科学版）,2010,28(6):602-608. 被引量：178
10马小霞,郑会云.基于领域本体的文本信息检索探讨[J].软件导刊,2012,11(4):110-111. 被引量：2

引证文献16

1孙海蒂,阎静辉,陈冉.高校图书馆智能化信息检索系统建设探析[J].绥化学院学报,2023,43(2):139-141. 被引量：1
2陈皇宇.云计算环境下的海量医用信息检索系统设计[J].微型电脑应用,2016,32(12):37-40.
3叶蓉,刘书玲.高效文本信息检索在信息平台中的应用与探究[J].科技广场,2017(5):156-158. 被引量：1
4张俊飞.改进TF-IDF结合余弦定理计算中文语句相似度[J].现代计算机（中旬刊）,2017(11):20-23. 被引量：8
5於馨彦,孙瑞玲.医院特定患者信息资源快速检索仿真研究[J].计算机仿真,2017,34(12):389-392. 被引量：3
6邓广彪,李春青.关于大数据中需求服务信息快速检索仿真[J].计算机仿真,2018,35(3):263-266. 被引量：1
7邬培.电子商务平台用户资源信息快速查询仿真[J].计算机仿真,2018,35(8):397-400.
8张祥合.分布式文献数据库需求信息自适应检索仿真[J].计算机仿真,2018,35(9):409-412. 被引量：2
9谷钰,张丽杰,吕翘楚.电子商务交易中多用户相似货源信息检索仿真[J].计算机仿真,2018,35(10):472-476. 被引量：2
10石鑫.基于BIM的低成本工程项目进度控制系统设计[J].计算机测量与控制,2018,26(3):167-170. 被引量：2

二级引证文献45

1任学军.医院特定患者实时财务结算信息智能管理系统设计[J].自动化与仪器仪表,2019(1):106-109. 被引量：2
2尤传雨,王镇生,周秋洁,燕守美.住宅类项目低成本运营探讨[J].山西建筑,2019,45(6):246-248. 被引量：1
3段蔓,李智峰.研谈数据挖掘技术在Web信息检索中的应用[J].信息技术与信息化,2019(5):167-168. 被引量：1
4齐长义.浅析网络通讯分布式数据库信息检索技术[J].数字技术与应用,2019,37(4):27-27.
5周艳平,李金鹏,蔡素.基于同义词词林的句子语义相似度方法及其在问答系统中的应用[J].计算机应用与软件,2019,36(8):65-68. 被引量：12
6陈蕾.基于云计算模式的机器辅助翻译系统优化设计[J].现代电子技术,2019,42(17):147-151. 被引量：2
7刘海静,杜意权.一套个人情绪日记管理系统的设计与实现[J].电子技术与软件工程,2019(19):55-56.
8孙磊,刘华辰,赵月奋.云计算下均衡传输链路数据包快速检索方法[J].内蒙古民族大学学报（自然科学版）,2019,34(5):402-406.
9谢梦怡.基于机器视觉的医院档案信息智能搜索[J].西安工程大学学报,2019,33(5):575-580. 被引量：9
10周秋红.基于人工智能的医院档案信息库资源多层次检索机器设计[J].自动化与仪器仪表,2019,0(10):187-190. 被引量：1

1汉江边上.修改注册表,增加新右键菜单命令[J].网友世界,2011(3):51-51.
2如何对文本文件加密[J].电脑爱好者（普及版）,2010(2):93-93.
3数据为王[J].信息化建设,2014(6):8-9.
4饶倩,文红,喻文,毛祺琦,苏伟伟.超像素及其应用综述[J].电脑与信息技术,2013,21(5):1-3. 被引量：8
5张金会,何政军,田希.基于支持向量机和神经网络对分类问题的比较研究[J].机械工程师,2012(8):31-32. 被引量：2
6御风.大数据时代下的商机[J].UPS应用,2014(9):81-82.
7肖辉强.探讨计算机数据库在信息管理中的应用[J].计算机光盘软件与应用,2014,17(8):146-146. 被引量：5
8吴艳萍,耿也.中小企业文件系统的安全架构[J].科技信息,2010(36).
9猫狸小五狼.让XP的搜索结果更快更准[J].电脑爱好者,2005(5):72-72.
10韩蕊.企业大数据已进入应用摸索阶段[J].互联网周刊,2013(19):14-15. 被引量：16

计算机仿真

2016年第4期

浏览历史

内容加载中请稍等...

海量数据下的文本信息检索算法仿真分析被引量：16

参考文献10

二级参考文献156

共引文献30

同被引文献111

引证文献16

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

海量数据下的文本信息检索算法仿真分析 被引量：16

参考文献10

二级参考文献156

共引文献30

同被引文献111

引证文献16

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

海量数据下的文本信息检索算法仿真分析被引量：16