企业文档服务器中英文搜索引擎的设计与实现被引量：1

The Design and Implementation of Chinese and English in Enterprise Document

下载PDF

导出

摘要介绍了一个基于文档服务器的全文搜索引擎的设计及其实现,提出了一种用于企业文档服务器搜索引擎的基本框架,并对该搜索引擎主要功能模块的实现作了详细介绍,给出了相应的试验结果。系统采用文件实时动态监控和中文分词识别技术,使系统具有实时性和文档搜索有效性及准确性等优点。 This paper designs and implements a document full - text search engine. First, it proposes the framework of server - based searching engine, then the several major functional modules are implemented in detail, including file monitor, Chinese word segmentation, and so on. Through monitoring document status real -time and dynamically and segmenting Chinese words, the engine has greater efficiency and retrieval accuracy.

作者陈海波张新家

机构地区西北工业大学自动化学院控制与网络研究所

出处《微处理机》 2009年第2期122-125,128,共5页 Microprocessors

关键词搜索引擎全文检索中文分词 Search engine Full - text retrieval Chinese word segmentation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Sullivan. Major Search Engines and Directories [ EB/ OL ]. http ://searchenginewatch. com,2005.
2丁承,邵志清.基于字表的中文搜索引擎分词系统的设计与实现[J].计算机工程,2001,27(2):191-192. 被引量：15
3印鉴,陈忆群,张钢.搜索引擎技术研究与发展[J].计算机工程,2005,31(14):54-56. 被引量：53
4G Salton, A Wong, C S Yang. A Vector Space Model for Automated Indexing [ J ]. Communications of ACM, 1975, 18(11) :613 -620.
5曹勇刚,曹羽中,金茂忠,刘超.面向信息检索的自适应中文分词系统[J].软件学报,2006,17(3):356-363. 被引量：48

二级参考文献17

1苏新宁.汉语词切分标引算法的改进[J].情报学报,1996,15(6):426-430. 被引量：9
2Shkapenyuk V, Suel T. Design and Implementation of a High- performance Distributed Web Crawler. In Proceedings of the 18th International Conference on Data Engineering (ICDE'02), San Jose, CA, 2002:357-368
3Cho J, Garcia-Molina H, Page L. Efficient Crawling Through Url Ordering. In 7^th Int. World Wide Web Conference, 1998
4Chakrabarti S, van den Berg M, Dom B. Focused Crawling: A New Approach to Topic-specific Web Resource Discovery. In Proc. of the 8^th Int. World Wide Web Conference (WWW8), 1999
5Rennie J, McCallum A. Using Reinforcement Learning to Spider the Web Efficiently. In Proc. of the Int. Conf. on Machine Learning (ICML),1999
6Spertus E. Parasite: Mining Structural Information on the Web. In : Proc. of the Sixth Int'l World Wide Web Conf. , 1997
7Cho J, Garcia-Molina H. The Evolution of the Web and Implications for an Incremental Crawler. In Proc. of 26th Int. Conf. on Very Large Data Bases, 2000:117-128
8Henzinger M R, Heydon A, Mitzenmacher M, et al. on Near-uniform URL Sampling. In Proc. of the 9^th Int. World Wide Web Conference, 2000
9Raghavan S, Garcia-Molina H. Crawling the Hidden Web. In Proc. of 27^th Int. Conf. on Very Large Data Bases, 2001
10丁蔚.单汉字检索系统后控词表的改进研究[J].现代图书情报技术,1998(5):25-28. 被引量：15

共引文献113

1孟庆国,王友奎,田红红.政务服务中的智能化搜索:特征、应用场景和运行机理[J].电子政务,2020,0(2):21-33. 被引量：22
2郝卫,魏赟.基于知识图谱表示学习的推荐算法优化[J].智能计算机与应用,2020,10(4):22-26. 被引量：3
3马志强,刘利民,苏依拉,马瑞明.基于Lucene的站内搜索引擎研究[J].内蒙古工业大学学报（自然科学版）,2009,28(1):52-57. 被引量：7
4隋丽萍,徐承韬,李瑞芳.一个中文全文检索系统的设计与实现[J].科技资讯,2007,5(18):244-245. 被引量：1
5彭轲,廖闻剑.基于浏览器服务的网络爬虫[J].硅谷,2009,2(4). 被引量：7
6柳婷.网络蜘蛛的简单设计与研究[J].大众商务,2010(16):189-189.
7费洪晓,康松林,朱小娟,谢文彪.基于词频统计的中文分词的研究[J].计算机工程与应用,2005,41(7):67-68. 被引量：68
8曹建.考核指标切莫事与愿违[J].出版参考,2006(07S):6-7.
9夏霙,刘功申,李翔.基于标引信息的网络新概念发现算法[J].微型电脑应用,2007,23(1):8-10.
10徐远超,刘江华,刘丽珍,关永.基于Web的网络爬虫的设计与实现[J].微计算机信息,2007,23(21):119-121. 被引量：36

同被引文献9

1Tisseghem P,Fastrup L.深入索引和搜索引擎[M].北京:清华大学出版社,2009.
2李晓明,闫宏飞,王继民.搜索引擎:原理、技术与系统[M].北京:科学出版社,2005.
3Witten L H.Moffat A.深入搜索引擎--海量信息的压缩、索引和查询[M].北京:电子工业出版社,2009.
4格拉夫,库辛.搜索引擎优化[M].杨明军译.北京:清华大学出版社,2007.
5四衍思维,曹衍龙,赵斯思.PHP网络编程技术与实例[M].北京:人民邮电出版社,2006.
6三扬科技.大道PHP:LAMP+Zend+开源框架整合开发与实战[M].北京:电子工业出版社,2009.
7杨安生.基于倒排表的中文全文检索研究[J].情报探索,2009(7):77-80. 被引量：6
8肖丽.哈希查找中散列函数的运用[J].技术与市场,2009,16(8):18-19. 被引量：3
9郑榕增,林世平.基于Lucene的中文倒排索引技术的研究[J].计算机技术与发展,2010,20(3):80-83. 被引量：50

引证文献1

1方跃胜,姚宏亮.法律搜索引擎索引系统同步模块的设计与实现[J].计算机技术与发展,2011,21(3):137-141.

1欧道顺.浅谈勘察设计企业文档泄密的防范措施[J].大科技,2013(6):1-2.
2微软将推出一款免费企业文档搜索软件[J].中国传媒科技,2008(3):7-7.
3刘鑫.企业文档管理系统设计与功能实现[J].职业,2016,0(27):155-156. 被引量：1
4郑长江,蓝士斌,毕胜.办公文档集中管理系统研究与设计[J].软件导刊,2012,11(12):98-99. 被引量：1
5李洋.用MAC管理网络服务[J].网络运维与管理,2014(11):55-59.
6万峻,蒋莹,李晓琼.企业文档云化管理必要性[J].中国新通信,2016,18(19):52-52.
7杨堂华,白彪,罗庆兵,丁东,太泉.虚拟磁盘机制在企业文档管理系统中的应用[J].电子技术与软件工程,2016(19):190-191. 被引量：1
8李小玲.使用WORD制作企业文档模板的研究[J].硅谷,2011,4(17):101-102. 被引量：1
9HP Exstream全面助力银行提升客户满意度[J].中国金融电脑,2010(1):94-94.
10冯小燕.Windows文档搜索全攻略[J].微电脑世界,2001(19):119-120.

微处理机

2009年第2期

浏览历史

内容加载中请稍等...

企业文档服务器中英文搜索引擎的设计与实现被引量：1

参考文献5

二级参考文献17

共引文献113

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

企业文档服务器中英文搜索引擎的设计与实现 被引量：1

参考文献5

二级参考文献17

共引文献113

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

企业文档服务器中英文搜索引擎的设计与实现被引量：1