期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
利用IDC技术制作图书馆书目数据检索页面
1
作者 林昌意 《福建电脑》 1999年第5期44-46,共3页
本文简述了WindowsNT下的ⅡS的管理,分析了如何利用IDC技术实现在WWW上进行数据库检索,并举例说明图书馆书目数据库检索页面的制作过程。
关键词 书目 数据检索页面 图书馆 IDC INTERNET网
下载PDF
SpringerLink全文电子期刊检索方法与技巧 被引量:2
2
作者 涂湘波 《高校图书馆工作》 2003年第2期38-38,47,共2页
文章介绍了SpringerLink中国镜像站全文期刊检索系统 ,结合工作实践 ,讨论了该系统的特点、检索页面基本要求、检索方法和文献输出格式等。
关键词 SPRINGERLINK 中国镜像站 全文期刊检索系统 检索页面 检索方法 文献输出格式
下载PDF
一种改进的页面相似性度量方法 被引量:4
3
作者 张霞 王建东 顾海花 《计算机工程与应用》 CSCD 北大核心 2010年第19期141-144,147,共5页
Web信息检索是指从大量Web文档集合中找到与给定的查询请求相关的、恰当数目的文档子集。为了更准确地找到相似文档,借助于两个页面的单词覆盖程度,提出一种改进的Web页面检索度量方法,并在KNN分类实验中得到验证。
关键词 Web页面检索 相似性 文本分类
下载PDF
Web智能检索中动态相关反馈技术研究 被引量:6
4
作者 李勇 桑艳艳 《情报理论与实践》 CSSCI 北大核心 2003年第2期178-181,共4页
The paper mainly discusses the application of dynamic relevance feedback technique in Web intelligent retrieval and stresses the dynamic similarity in the course of feedback.It discusses the application of dynamic rel... The paper mainly discusses the application of dynamic relevance feedback technique in Web intelligent retrieval and stresses the dynamic similarity in the course of feedback.It discusses the application of dynamic relevance feedback technique from the Web page text and image aspects,and proposes to use the user interest model and the neural network to raise the precision and feasibility of the search result in relevant feedback. 展开更多
关键词 Web智能检索 动态相关反馈技术 Web页面文本检索 WEB图像检索 算法
下载PDF
基于URL类型优先级的入口页面查询算法 被引量:1
5
作者 胡俊刚 董守斌 +1 位作者 陈晓志 张元丰 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期63-67,共5页
入口页面(主页)查询结果只有一个,并且用户的查询词常常是简短的页面名称,由于它要求更高的精准度,一般认为是较为困难的.依据语言模型分析,挖掘出对中文入口页面(entry page)检索有意义的查询域作为基准检索的内容域,同时考虑到非内容... 入口页面(主页)查询结果只有一个,并且用户的查询词常常是简短的页面名称,由于它要求更高的精准度,一般认为是较为困难的.依据语言模型分析,挖掘出对中文入口页面(entry page)检索有意义的查询域作为基准检索的内容域,同时考虑到非内容网页优先级(URL-type等)特征的重要性,建立综合内容域和非内容网页特征的检索模型.通过URL类型优先级(URL-type prior)的概率统计,发现入口页面和其相关的子页面之间存在比较大的联系.据此提出基于相关子页面的入口页面提取算法PERS(page extracted from relevant sub-page).对比实验数据表明,PERS算法对检索的性能有较大提高. 展开更多
关键词 入口页面检索 URL类型优先级 信息检索
下载PDF
基于卷积神经网络的图书页面检索方法 被引量:2
6
作者 刘乐元 赵毅 陈靓影 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第11期22-28,67,共8页
针对现有图书页面检索方法检索精度低的问题,利用任务无关数据集训练卷积神经网络,提出了一种基于卷积神经网络的图书页面检索方法.首先将待检图书页面图像进行图像分割和畸变校正,降低背景的干扰和几何畸变的影响;然后将校正后的图像... 针对现有图书页面检索方法检索精度低的问题,利用任务无关数据集训练卷积神经网络,提出了一种基于卷积神经网络的图书页面检索方法.首先将待检图书页面图像进行图像分割和畸变校正,降低背景的干扰和几何畸变的影响;然后将校正后的图像输入卷积神经网络提取图像特征;最后使用夹角余弦距离来度量待检图像和候选图像的相似度.实验结果表明:本方法在测试数据集上的Top-5命中率为97.31%,而直接使用任务无关数据集训练的卷积神经网络的Top-5命中率仅为58.47%.本方法避免了耗费大量的时间和精力去收集大规模图书页面图像数据库,而且利用卷积神经网络强大的图像特征描述能力,取得了优异的图书页面检索精度. 展开更多
关键词 图书页面检索 卷积神经网络 图像分割 图像校正 图像检索
原文传递
Relevance-based content extraction of HTML documents
7
作者 吴麒 陈兴蜀 +1 位作者 朱锴 王春晖 《Journal of Central South University》 SCIE EI CAS 2012年第7期1921-1926,共6页
Content extraction of HTML pages is the basis of the web page clustering and information retrieval,so it is necessary to eliminate cluttered information and very important to extract content of pages accurately.A nove... Content extraction of HTML pages is the basis of the web page clustering and information retrieval,so it is necessary to eliminate cluttered information and very important to extract content of pages accurately.A novel and accurate solution for extracting content of HTML pages was proposed.First of all,the HTML page is parsed into DOM object and the IDs of all leaf nodes are generated.Secondly,the score of each leaf node is calculated and the score is adjusted according to the relationship with neighbors.Finally,the information blocks are found according to the definition,and a universal classification algorithm is used to identify the content blocks.The experimental results show that the algorithm can extract content effectively and accurately,and the recall rate and precision are 96.5% and 93.8%,respectively. 展开更多
关键词 content extraction DOM NODE RELEVANCE information block
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部