一种基于网页特征提取的网站全文搜索系统的设计与实现被引量：1

Design and Realization of a Kind of Full-text Searching System for Website Based on the Feature Extraction of Web Pages

下载PDF

导出

摘要给出了一种针对目标网站的全文搜索系统的程序框架图,介绍了其工作原理及实现过程.在全文信息数据库的建立过程中,针对HTML文档的特点,提出了网页特征信息提取技术,有效地减少了信息存储量.最后,给出了应用结果. The programming framework of a kind of full-text searching system for the target website is presented. Then, its process principle and implementation are also introduced. During the establishment of full-text information database, the technique of the feature extraction of web pages is proposed based on the characteristic of HTML documents, which may decrease storage efficiently. At last, some results are given.

作者杨如祥曾献辉

机构地区宁波振东光电有限公司东华大学信息科学与技术学院

出处《东华大学学报（自然科学版）》 CAS CSCD 北大核心 2007年第5期639-643,共5页 Journal of Donghua University(Natural Science)

关键词特征提取网站全文搜索系统全文信息库搜索代理 feature extraction website full-text searching system full-text information database searching agent

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1吴果.Web搜索引擎的现状分析[J].河南纺织高等专科学校学报,2001,13(2):16-18. 被引量：4
2张利,邵世煌,吴晓琼,曾献辉,范晓文.Current Application of Search Engines and Their Developing Trend[J].Journal of Donghua University(English Edition),2002,19(2):126-130. 被引量：2
3张利,邵世煌,曾献辉,尹美华.A Case Study of Search Engine on World Wide Web for Chemical Fiber Engineering[J].Journal of Donghua University(English Edition),2001,18(3):113-116. 被引量：1
4BEVERIDGE J,WIENER R.Win32多线程程序设计[M].侯捷,译.武汉:华中科技大学出版社,2002:51.
5SCEPPA D.ADO编程技术[M].石钧,译.北京:清华大学出版社,2001:46.

二级参考文献10

1Fan SL;Ota I;Tamura H.查看详情,2000.
2Jiang S;Luo T;Hwang B C.查看详情,2000.
3Atzeni P;Mecca G.查看详情[J],1997(04).
4Ruihong L;Dongqi C.查看详情,1999(01).
5Bharat K;Broder A.A technique for measuring the relative size and overlap of public Web search engines in:Proc of the 7 th world-wide Web conference,online a,1998.
6Weiyuan Wen Hua.Practice Sutra of dynamical Web page of ASP3.0,2000.
7Elizabeth D.ACM Trans , on Inf[].Sys.1994
8Venkat,N. IEEE Internet Computing . 1997
9Michael N. IEEE Internet Computing . 1997
10Yang YiMing,ACM Trans,on Inf. Sys . 1994

共引文献11

1曾献辉,邵世煌,刘泽莲.基于搜索代理的纺织企业信息的自动获取系统研究[J].东华大学学报（自然科学版）,2004,30(5):34-38.
2马福晶.网络环境下的信息检索[J].电脑与电信,2007(12):52-53.
3宋志刚,封莉.证券行情库实时传送系统的研究[J].电脑学习,2008(1):31-32.
4陈志诚,曹新建,魏军.基于多通道采样数据的高速存储系统设计[J].海军工程大学学报,2008,20(1):89-92.
5杨军杰,张志,荆青青,王少军.采矿权登记信息矢量化的设计与实现[J].地理与地理信息科学,2008,24(6):57-59. 被引量：4
6李鹏.基于活动文档技术无缝集成Excel的通用报表软件开发技术方案[J].电力自动化设备,2009,29(3):138-142. 被引量：1
7吴星,陈明锐.恶意网页防护系统的设计与实现[J].计算机技术与发展,2009,19(5):154-157. 被引量：2
8吴星,张燕.恶意网页从原理到防御[J].电脑与信息技术,2009,17(4):47-51. 被引量：1
9刘红梅,刘然,陈永涛,邓鑫.天气预报电视会商系统运维管理软件设计实现[J].电视技术,2013,37(10):93-96. 被引量：1
10王春艳,李玉福.垂直搜索引擎中信息过滤技术的研究[J].情报科学,2014,32(3):93-97. 被引量：3

同被引文献5

1徐甜,田有贵.数据挖掘在Web中的应用研究[J].福建电脑,2006,22(9):162-163. 被引量：3
2阎磊,马宏琳.BLOB数据存储技术在文件搜索引擎中的应用[J].福建电脑,2007,23(1):9-9. 被引量：1
3孙静,赵恒永.搜索引擎网页快照的安全性研究[J].福建电脑,2007,23(11):47-48. 被引量：1
4孟祥增.多媒体网络教学资源的内容特征提取与搜索研究[J].电化教育研究,2007,28(12):33-37. 被引量：14
5刘杰.谈个人数字图书馆[J].甘肃科技,2004,20(4):61-63. 被引量：15

引证文献1

1王承君.Web搜索引擎的关键技术分析[J].潍坊学院学报,2009,9(4):27-30. 被引量：1

二级引证文献1

1袁健美,李旭,朱宁斌,黄晓凯.基于Lucene的网络创作及学习资料共享平台设计[J].中国教育信息化（高教职教）,2013(8):24-26.

1潘文富.基于lucene的人才网全文搜索系统设计及应用[J].电子技术与软件工程,2014(9):86-87.
2翁敏峰.P2P网络搜索系统研究[J].福建电脑,2014,30(7):104-104.
3李振龙.Web信息检索的技术分析与发展策略研究[J].计算机科学,2006,33(4):181-184. 被引量：11
4赵仲孟,张选平.分布式检索中索引数据分布模型与求解方法[J].计算机工程与设计,2005,26(8):2164-2167. 被引量：2
5石焱,周元.基于XML的软件代理在电子商务中的应用研究[J].国外建材科技,2002,23(1):136-139.
6孟晓明,李绍华.P2P在网格资源检索中的应用[J].情报杂志,2006,25(8):99-102. 被引量：2
7曹利培,张志亮.语义Web服务及其在搜索引擎上的应用[J].计算机与信息技术,2008(9):5-7. 被引量：1
8江征风,陶表达,丁毓峰.构建不同分类编码系统的通用搜索代理[J].组合机床与自动化加工技术,2007(2):96-98.
9郭晔,李建廷,王浩鸣.一种元搜索引擎框架模型的设计[J].西安科技大学学报,2007,27(3):448-451. 被引量：1
10黄素珍.多元搜索引擎中搜索代理的实现[J].温州师范学院学报,2005,26(5):63-68. 被引量：1

东华大学学报（自然科学版）

2007年第5期

浏览历史

内容加载中请稍等...

一种基于网页特征提取的网站全文搜索系统的设计与实现被引量：1

参考文献5

二级参考文献10

共引文献11

同被引文献5

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于网页特征提取的网站全文搜索系统的设计与实现 被引量：1

参考文献5

二级参考文献10

共引文献11

同被引文献5

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于网页特征提取的网站全文搜索系统的设计与实现被引量：1