期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于术语本体的网页标引方法 被引量:9
1
作者 贺娇 《情报杂志》 CSSCI 北大核心 2004年第3期28-29,共2页
语义信息检索已经成为信息检索的发展方向 ,从本体论构建语义信息的视角出发 ,在澄清本体概念的基础上引入术语本体 ,提出了一种半自动化的结构化网页标引建立的方法。
关键词 语义信息检索 本体论 术语本体 网页标引 半自动化
下载PDF
基于知识库的网页自动标引和自动分类系统的设计 被引量:37
2
作者 侯汉清 薛鹏军 《大学图书馆学报》 CSSCI 北大核心 2004年第1期50-55,64,共7页
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库... 针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 展开更多
关键词 知识库 网页标引 自动标引 自动分类系统 概念语义网络
下载PDF
搜索引擎的文档预处理技术研究 被引量:2
3
作者 陶跃华 赵波 杨秀国 《计算机科学》 CSCD 北大核心 2002年第7期111-112,100,共3页
搜索引擎的R0bots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形成规范的页面索引,存入索引数据库,供用户查询.设计搜索引擎的第一步就是对输入的各项进行规格化处理,使... 搜索引擎的R0bots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形成规范的页面索引,存入索引数据库,供用户查询.设计搜索引擎的第一步就是对输入的各项进行规格化处理,使之标准化. 展开更多
关键词 搜索引擎 文档预处理 数据结构 网页标引 计算机网络 信息检索
下载PDF
搜索引擎的原理与利用研究 被引量:2
4
作者 杨丽杰 《现代情报》 2004年第2期82-83,220,共3页
文章分析了搜索引擎的原理 ,探讨了搜索引擎的使用方法与技巧。
关键词 搜索引擎 网络信息检索 数据采集 网页标引 HTML 数据组织
下载PDF
学科门户智能搜索引擎的设计与构建——农业史门户搜索引擎的实验 被引量:2
5
作者 刘竟 侯汉清 《情报学报》 CSSCI 北大核心 2009年第1期114-120,共7页
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议——在经过学科专家筛选的、学科信息门户目录中的高质量网站中自... 面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议——在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找。文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论。 展开更多
关键词 智能学科门户搜索引擎 网页自动标引 网页自动分类 类别词知识库
下载PDF
Web信息自动标引方法研究 被引量:6
6
作者 陈桂菊 郭春侠 《图书馆学研究》 CSSCI 北大核心 2010年第10期55-58,共4页
文章对自动标引的原理和几种方法进行了简单介绍,对现今的三种网页自动标引方法,即基于知识库的网页自动标引、基于UCL的网页自动标引和基于遗传算法的网页自动标引,进行了阐释,并对三者进行了分析和比较。
关键词 自动标引 知识库 UCL 遗传算法 网页自动标引
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部