期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
改进多分类器集成AdaBoost算法的Web主题分类 被引量:2
1
作者 伍杰华 倪振声 《计算机应用与软件》 CSCD 北大核心 2013年第11期64-67,共4页
现有的Web主题分类算法一般基于单一模型构建或者仅仅把多个单一模型简单叠加进行决策。针对该问题,提出一种基于多分类器集成的改进AdaBoost算法的Web主题分类方法。算法先采用VIPS算法获取页面分块并获取其视觉特征和文本特征,根据每... 现有的Web主题分类算法一般基于单一模型构建或者仅仅把多个单一模型简单叠加进行决策。针对该问题,提出一种基于多分类器集成的改进AdaBoost算法的Web主题分类方法。算法先采用VIPS算法获取页面分块并获取其视觉特征和文本特征,根据每一类特征的维度分别训练弱分类器,然后计算其对应的错误率,修改错误判别的拒绝策略,从而针对不同特征产生相应的最优分类器,最后对两类最优分类器级联决策。实验结果表明,该方法能提高AdaBoost算法对复杂Web主题信息的分类准确率,同时也为Web主题分类领域的研究提供一种新的方案。 展开更多
关键词 web主题 ADABOOST 分类器 分类集成 特征分类 主题切分
下载PDF
Web主题资源建设现状分析 被引量:2
2
作者 陈定权 《图书馆杂志》 CSSCI 北大核心 2004年第5期25-28,共4页
本论文首先将数字图书馆中 Web 主题资源模式分成两种建设模式:手工建设模式和自动建设模式,并分析了它们各自的优缺点。然后,分析了国内外的发展情况和存在的问题,最后结合国内的情况,指出了中国建设主题资源应该注意的问题。
关键词 数字图书馆 web主题资源 网络信息资源 手工编目 自动编目
下载PDF
Web主题资源建设现状分析 被引量:1
3
作者 陈定权 《情报科学》 CSSCI 北大核心 2005年第1期86-89,共4页
本文首先将数字图书馆中Web主题资源模式分成两种建设模式 :手工建设模式和自动建设模式 ,并分析了它们各自的优缺点。然后 ,分析了国内外的发展情况和存在的问题。最后结合国内的情况 。
关键词 web主题资源 建设模式 数字图书馆
下载PDF
一种结合Web内容主题的会话识别及切分方法 被引量:2
4
作者 李超 谢坤武 +1 位作者 文黎明 向军 《计算机应用与软件》 CSCD 2011年第6期167-169,共3页
通过Web日志文件,识别用户及用户会话序列,然后提取会话序列所对应的Web页面内容,得到Web页面内容的核心概念,用核心概念描述会话主题,基于会话主题实现会话的切分。最后结合一个消费平台消费者的会话记录及Web内容,验证了该方法的准确性。
关键词 web日志 web主题 会话识别 会话切分
下载PDF
主题Web挖掘研究 被引量:3
5
作者 杜光芹 张化祥 赵瑞东 《计算机技术与发展》 2008年第2期94-97,共4页
网络已经成为人们获取知识的一个重要途径。然而面对巨大的Web资源库,用户若想获得所需要信息已不再是一件简单的事情。通用搜索引擎返回大量的无关信息,不能满足用户的特定信息检索需求。针对这个问题,Web信息检索领域出现了一个新的... 网络已经成为人们获取知识的一个重要途径。然而面对巨大的Web资源库,用户若想获得所需要信息已不再是一件简单的事情。通用搜索引擎返回大量的无关信息,不能满足用户的特定信息检索需求。针对这个问题,Web信息检索领域出现了一个新的研究方向——主题驱动的Web资源发现。介绍了通用搜索引擎的基本结构、工作原理及现状。阐述了主题Web挖掘的研究背景、任务及目前研究技术的进展,并对其未来的发展方向进行了探讨。对通用搜索引擎和主题Web挖掘的关系进行了分析。 展开更多
关键词 搜索引擎 信息检索 web主题挖掘 聚焦爬虫 本体论
下载PDF
智能Web中文主题信息收集系统IRobot的设计 被引量:7
6
作者 马亮 陈群秀 +1 位作者 王俊 徐国伟 《中文信息学报》 CSCD 北大核心 2002年第5期23-29,共7页
本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法。针对Web主题信息收集所具有的许多新特性,系统采用了对待收集URL进行相关度预测为主,对已收集页面进行相关度评价结合的收集机制。尤其在URL的相关度预测中,深入考虑了We... 本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法。针对Web主题信息收集所具有的许多新特性,系统采用了对待收集URL进行相关度预测为主,对已收集页面进行相关度评价结合的收集机制。尤其在URL的相关度预测中,深入考虑了Web主题信息结构和组织特性的多种因素,综合提高了系统的性能。相比已有的研究,系统的精度和收集效率更高,且更为稳定,并能够自动获得主题领域内重要资源的列表。 展开更多
关键词 智能web中文主题信息收集系统 IROBOT 信息检索 相关度预测 相关度评价 中文信息处理 系统设计
下载PDF
Web文本主题挖掘技术研究 被引量:2
7
作者 李智辉 卢苇 《计算机教育》 2005年第11期34-36,共3页
目前,如何快速、准确、全面、及时地检索到自己感兴趣的信息已成为人们关注的焦点.本文针对目前搜索引擎精度不高的问题,讨论了Web文本主题挖掘涉及到的相关核心技术,重点讨论自动分词技术和Web文本的特征表示.
关键词 web文本主题挖掘 自动分词技术 特征抽取 向量空间模型 文本分类文本聚类 web文本 挖掘技术 主题 搜索引擎 特征表示
下载PDF
基于Topic Maps的语义Web服务组合引擎研究 被引量:4
8
作者 周相兵 马洪江 常桂娟 《计算机应用》 CSCD 北大核心 2010年第1期162-166,174,共6页
针对Web服务组合流程控制、服务组合吞吐率等问题,提出一种基于主题图的语义Web服务组合引擎方法,通过基于本体的语义Web服务描述,并将Web服务与主题图进行抽象,用一种服务主题去表示语义Web服务,以便使用主题图的特征,而主题图可方便... 针对Web服务组合流程控制、服务组合吞吐率等问题,提出一种基于主题图的语义Web服务组合引擎方法,通过基于本体的语义Web服务描述,并将Web服务与主题图进行抽象,用一种服务主题去表示语义Web服务,以便使用主题图的特征,而主题图可方便地实现语义服务导航定位,使得Web服务所处状态可定,目标明确。因此该语义Web服务组合引擎是从UDDI注册(UDDIr)和查询能力(UDDIs),语法检测(GD)和语义识别(SI)能力,服务主题图的相似度(STS)、匹配度(STM)和适应度(STF),服务主题特征刻面分类能力(SFC),服务主题权限访问程度(STP),刻面深度判定(FDD),服务主题协同能力(STC)角度去建立;并通过数学方法进行定义。最后通过用Java编程实现实验模型表明,该方法可行且有效。 展开更多
关键词 语义web服务 主题 web服务主题 服务组合引擎 本体
下载PDF
利用构建语义词典的查询自动分类方法 被引量:3
9
作者 岳峰 孙亮 +2 位作者 王宽全 王永吉 左旺孟 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第7期1094-1098,共5页
为解决传统的文档分类方法和手工分类方法都不适宜于处理查询分类的问题,提出了一种基于Web的自动构建特定主题的语义词典的方法来分类搜索查询,通过基于主题的Web信息采集和bootstrap-ping,由某个主题的少量关键词逐步扩充,最终得到该... 为解决传统的文档分类方法和手工分类方法都不适宜于处理查询分类的问题,提出了一种基于Web的自动构建特定主题的语义词典的方法来分类搜索查询,通过基于主题的Web信息采集和bootstrap-ping,由某个主题的少量关键词逐步扩充,最终得到该主题的语义词典及词典中每个单词的相对词频.Web中信息的冗余和各主题语义上的差别使各主题的语义词典中单词的种类和数量存在很大差异,这种差异可以用来对用户的搜索查询进行分类.实验结果表明,利用语义词典可以较准确地将用户的查询分类,同时该分类方法基本上不需要人工介入,且可适应搜索查询覆盖面广和实时性强的特点,较好地解决了搜索查询分类的问题. 展开更多
关键词 搜索引擎 查询分类 语义词典 基于主题web信息采集
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部