基于UCL的网页自动标引技术被引量：6

An Automatic Indexing Method for Web Pages Based on UCL

下载PDF

导出

摘要 UCL(UniformContentLocator)是作者、编者和读者进行语义沟通的工具,是进行信息快速选择、智能代理和信息主动服务的基础。该文针对网络信息检索中的自动标引问题,提出了一种基于UCL的网页自动标引技术。研究了从HTML编写的网页映射到XML文档的过程,并从中提取符合用户兴趣模型的UCL字段,从而达到网页自动标引的目的。实验验证了理论方案的正确性和有效性。 UCL(Uniform Content Locator)builds a bridge between author,editer and reader for better understanding,which is a key technique for data processing such as receiving quickly,information filtering,service intelligently and actively in many domains.Aiming at the problem of automatic indexing in the information searches,an indexing method for web pages based on UCL is put forward in this paper.In order to achieve the computer automatic indexing,we study the mapping process from HTML to XML ,and extract the UCL information of fitting for the interesting profile of client users.The experiment result shows that the creative technology and the new designs are correctness and efficiency.

作者邢玲史杏荣

机构地区中国科技大学电子工程与信息科学系

出处《计算机工程与应用》 CSCD 北大核心 2004年第17期148-151,共4页 Computer Engineering and Applications

基金国家自然科学基金资助项目(编号:60272014) 国家863高技术研究发展计划项目(编号:2002AA121063)资助

关键词自动标引 UCL XML网页用户兴趣模型 automatic indexing,UCL,XML ,web pages,interesting profile

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1高杨,李幼平.UCL理念及其系统设计[J].电视技术,2001,25(2):38-41. 被引量：23
2田萱,刘希玉,孟强.实现Web页面的智能个性化检索[J].计算机工程与应用,2003,39(1):195-197. 被引量：9
3赵仲孟,张蓓,沈均毅.对搜索引擎未来发展的探讨[J].计算机科学,2001,28(3):60-61. 被引量：8
4Gokcay D,Gokcay E.Generating titles for paragraphs using statistically extracted keywords and phrases[c].In:Intelligent Systems for the 21st Century, 1995: 3174～3179
5Szymanski B K,Ming-Shu Chung. A method for indexing Web pages using Web bots[C].In:Proceedings on Info-tech and Info-net,Beijing,2001:1～6

二级参考文献13

1李瑞勤,朱慧.对Internet上专题型搜索引擎的探讨[J].情报学报,1999,18(S2):158-160. 被引量：6
2翁惠玉,马范援,朱义军,杨传厚.网络搜索引擎的现状分析[J].情报学报,1999,18(S1):105-107. 被引量：25
3孙玉.国家信息基础设施的基本技术问题.中国科学技术前沿（1999／2000中国工程院版）[M].北京:高等教育出版社,2000.41-64.
4（美）Albert Azzam 赵慧玲等（译）.高速电缆调制解调器[M].北京:电子工业出版社,1999..
5汪成为.中国为21世纪初计算机技术发展所做的准备.中国科学技术前沿（1999／2000中国工程院版）[M].北京:高等教育出版社,2000.68-100.
6高杨.互补结构的信息共享系统：博士论文[M].北京:京理工大学,2000..
7（美）Microsoft公司汉扬天地科技发展有限公司（译）.微软英汉双解计算机百科辞典[M].北京:希望电子出版社,1999..
8(美)Han J.数据挖掘:概念和技术[M].高等教育出版社,2001..
9李名智.中文搜索引擎发展的现状、问题及对策[J].中国信息导报,1999(2):30-32. 被引量：18
10邹涛,王继成,朱华宇,金翔宇,张福炎.WWW上的信息挖掘技术及实现[J].计算机研究与发展,1999,36(8):1019-1024. 被引量：120

共引文献37

1张培荣.元搜索引擎与独立搜索引擎比较研究[J].现代图书情报技术,2004(S1):50-51. 被引量：2
2胡敏,马建国.基于互补结构网络的传输系统设计[J].电视技术,2008,32(z1):98-99.
3文丽,马建国,姚远程.基于播存网格的智能Agent研究与设计[J].计算机工程与应用,2004,40(25):124-125. 被引量：3
4李杰,朱维乐,马建国.基于UCL的流媒体广播系统设计[J].电视技术,2004,28(6):30-32. 被引量：2
5王佳薇,姚远程,马建国.基于PCI接口的DVB发送卡设计[J].信息技术,2004,28(7):11-13. 被引量：2
6彭保,马建国,吴坚,于春梅.DVB-C并行数据广播接收卡的研究与设计[J].电视技术,2004,28(7):51-53.
7马建国,李在铭.广播型网格[J].计算机科学,2004,31(8):5-7. 被引量：2
8卜胜贤,罗可.基于Web的ICAI系统分析与设计[J].长沙理工大学学报（自然科学版）,2004,1(3):63-68. 被引量：1
9李幼平,高杨,马卫东.广播将因存储而振兴[J].现代电视技术,2001(9):17-20. 被引量：1
10王小玲,胡平.基于个人兴趣和反馈技术的Page Rank算法研究[J].合肥工业大学学报（自然科学版）,2006,29(3):313-315. 被引量：1

同被引文献54

1叶继元.引文数据库精选来源期刊对学术评价作用的分析[J].云梦学刊,2004,25(4):17-19. 被引量：12
2马建国,邢玲,李幼平,李在铭.数据广播中的UCL标引与传输机制[J].电子学报,2004,32(10):1621-1624. 被引量：24
3马建国,邢玲,李幼平,文丽.广播型网格的用户兴趣图谱[J].电子学报,2005,33(1):142-146. 被引量：5
4侯汉清 ,章成志 ,郑红 .Web概念挖掘中标引源加权方案初探[J].情报学报,2005,24(1):87-92. 被引量：32
5张敏,林川,马少平.使用遗传算法的信息检索动态参数学习方法[J].计算机研究与发展,2005,42(3):486-492. 被引量：4
6许建潮,胡明.中文Web文本的特征获取与分类[J].计算机工程,2005,31(8):24-25. 被引量：24
7胡健,陆一鸣,马范援.基于HTML文档结构的向量空间模型的改进[J].情报学报,2005,24(4):433-437. 被引量：10
8张玉峰,艾丹祥,金燕.基于Semantic Web的个性化网络导航机制[J].情报学报,2005,24(4):438-444. 被引量：12
9郭岩,白硕,杨志峰,张凯.网络日志规模分析和用户兴趣挖掘[J].计算机学报,2005,28(9):1483-1496. 被引量：62
10张冉,卡米力.毛依丁.基于XML和N层VSM的Web信息检索[J].计算机技术与发展,2006,16(5):56-58. 被引量：4

引证文献6

1乔冬梅.基于《开放文库计划》(OAI)的引文数据库开发研究[J].现代图书情报技术,2005(12):39-43. 被引量：1
2田苗苗,许建潮,汪津,丁桂英.基于遗传算法的Web信息自动标引研究[J].吉林大学学报（信息科学版）,2006,24(5):542-547. 被引量：6
3邢玲,马建国,李幼平,刘志文.一种基于UCL的中文网页信息过滤方法[J].电子学报,2006,34(10):1752-1757. 被引量：9
4陈桂鸿.普通文件和HTML文件及XML文件信息检索过程探析[J].科技情报开发与经济,2009,19(11):90-92.
5陈桂菊,郭春侠.Web信息自动标引方法研究[J].图书馆学研究,2010(10):55-58. 被引量：6
6徐志华,周金治,李莲春.基于UCL的网络音视频自动标引[J].电视技术,2011,35(12):87-89. 被引量：2

二级引证文献22

1赵衍,张永娟,陈成材,陈恒.一种提高计算机自动赋词标引准确性的综合方法——基于创新型CBA数据库的实证分析[J].情报杂志,2012,31(5):185-191. 被引量：5
2周屹,李海龙,王锐.遗传算法求解物流配送中带时间窗的VRP问题[J].吉林大学学报（理学版）,2008,46(2):300-303. 被引量：12
3邢玲,马建国,刘志文,李幼平.移动通信中的信息共享结构[J].北京理工大学学报,2008,28(8):737-740. 被引量：3
4邢超,王珂.互补网络中多级混合过滤系统的研究[J].电脑知识与技术,2008,3(9):1423-1425.
5孙英娟,蒲东兵,孙英慧,李春宜,周春光.邮件过滤Agent的设计[J].吉林大学学报（信息科学版）,2008,26(6):576-579. 被引量：1
6邢玲,马建国,李幼平,刘志文.Research and Application of Broad-Storage Architecture in Digital Television System[J].Journal of Beijing Institute of Technology,2009,18(2):215-219.
7陈桂菊,郭春侠.Web信息自动标引方法研究[J].图书馆学研究,2010(10):55-58. 被引量：6
8闫瑞瑞,马建国.在单向CATV网络实现IP报文传输的一种方法[J].信息通信,2010,23(5):51-53. 被引量：1
9闫瑞瑞,马建国.基于UCL的个性化主动信息服务实验研究[J].电视技术,2011,35(9):69-71. 被引量：2
10余丰民.2000-2009年国内自动标引研究综述[J].情报探索,2011(5):28-31. 被引量：4

1卢壮.新一代面向XML网页搜索引擎的模型[J].计算机系统应用,2001,10(7):39-41. 被引量：9
2李忠明,孔玉飞.用HTML编写软件帮助的优点及实现方法[J].计算机时代,2000(2):4-4.
3张红琴,白林如.基于CSS和JavaScript的网页选项卡的设计和实现[J].洛阳理工学院学报（自然科学版）,2012,22(1):40-44. 被引量：4
4聂培尧,安世虎.XML及语义Web技术[J].计算机科学,2001,28(5):34-36. 被引量：12
5徐新爱.无人机海量飞行数据快速检索方法研究[J].计算机测量与控制,2014,22(12):4181-4183. 被引量：8
6钱云,夏祖明.VC++与Matlab混合编程方法讨论[J].电脑编程技巧与维护,2001(2):61-62. 被引量：4
7罗清磊,李卫华.利用Java实现基于XML的Web上的数据库挖掘Agent[J].现代计算机,2002,8(1):13-16. 被引量：1
8徐志华,周金治,李莲春.基于UCL的网络音视频自动标引[J].电视技术,2011,35(12):87-89. 被引量：2
9王芳,张晓林.网络环境下的信息检索:搜索引擎技术分析[J].情报杂志,1999,18(5):32-33. 被引量：7
10杜义华,焦文彬.互联网中XML网页的链接解析与信息采集[J].计算机系统应用,2005,14(7):24-26. 被引量：2

计算机工程与应用

2004年第17期

浏览历史

内容加载中请稍等...

基于UCL的网页自动标引技术被引量：6

参考文献5

二级参考文献13

共引文献37

同被引文献54

引证文献6

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于UCL的网页自动标引技术 被引量：6

参考文献5

二级参考文献13

共引文献37

同被引文献54

引证文献6

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于UCL的网页自动标引技术被引量：6