期刊文献+

基于UCL的网页自动标引技术 被引量:6

An Automatic Indexing Method for Web Pages Based on UCL
下载PDF
导出
摘要 UCL(UniformContentLocator)是作者、编者和读者进行语义沟通的工具,是进行信息快速选择、智能代理和信息主动服务的基础。该文针对网络信息检索中的自动标引问题,提出了一种基于UCL的网页自动标引技术。研究了从HTML编写的网页映射到XML文档的过程,并从中提取符合用户兴趣模型的UCL字段,从而达到网页自动标引的目的。实验验证了理论方案的正确性和有效性。 UCL(Uniform Content Locator)builds a bridge between author,editer and reader for better understanding,which is a key technique for data processing such as receiving quickly,information filtering,service intelligently and actively in many domains.Aiming at the problem of automatic indexing in the information searches,an indexing method for web pages based on UCL is put forward in this paper.In order to achieve the computer automatic indexing,we study the mapping process from HTML to XML ,and extract the UCL information of fitting for the interesting profile of client users.The experiment result shows that the creative technology and the new designs are correctness and efficiency.
作者 邢玲 史杏荣
出处 《计算机工程与应用》 CSCD 北大核心 2004年第17期148-151,共4页 Computer Engineering and Applications
基金 国家自然科学基金资助项目(编号:60272014) 国家863高技术研究发展计划项目(编号:2002AA121063)资助
关键词 自动标引 UCL XML网页 用户兴趣模型 automatic indexing,UCL,XML ,web pages,interesting profile
  • 相关文献

参考文献5

二级参考文献13

  • 1李瑞勤,朱慧.对Internet上专题型搜索引擎的探讨[J].情报学报,1999,18(S2):158-160. 被引量:6
  • 2翁惠玉,马范援,朱义军,杨传厚.网络搜索引擎的现状分析[J].情报学报,1999,18(S1):105-107. 被引量:25
  • 3孙玉.国家信息基础设施的基本技术问题.中国科学技术前沿(1999/2000中国工程院版)[M].北京:高等教育出版社,2000.41-64.
  • 4(美)Albert Azzam 赵慧玲等(译).高速电缆调制解调器[M].北京:电子工业出版社,1999..
  • 5汪成为.中国为21世纪初计算机技术发展所做的准备.中国科学技术前沿(1999/2000中国工程院版)[M].北京:高等教育出版社,2000.68-100.
  • 6高杨.互补结构的信息共享系统:博士论文[M].北京:京理工大学,2000..
  • 7(美)Microsoft公司 汉扬天地科技发展有限公司(译).微软英汉双解计算机百科辞典[M].北京:希望电子出版社,1999..
  • 8(美)Han J.数据挖掘:概念和技术[M].高等教育出版社,2001..
  • 9李名智.中文搜索引擎发展的现状、问题及对策[J].中国信息导报,1999(2):30-32. 被引量:18
  • 10邹涛,王继成,朱华宇,金翔宇,张福炎.WWW上的信息挖掘技术及实现[J].计算机研究与发展,1999,36(8):1019-1024. 被引量:120

共引文献37

同被引文献54

引证文献6

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部