期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
面向主题网页的公共图书馆知识服务——基于参与网络主题信息推送实践的思考 被引量:3
1
作者 陈天伦 李萍 《图书馆工作与研究》 CSSCI 北大核心 2017年第4期65-68,共4页
公共图书馆参与主题网页的信息整合工作,推送某一领域或主题的相关信息,是一种针对特定群体的知识服务。文章基于参与网络主题信息推送工作的实践,探讨这种知识服务的活动模式、寻找发现相关文献的方法、思考编辑高质量文摘的策略、审... 公共图书馆参与主题网页的信息整合工作,推送某一领域或主题的相关信息,是一种针对特定群体的知识服务。文章基于参与网络主题信息推送工作的实践,探讨这种知识服务的活动模式、寻找发现相关文献的方法、思考编辑高质量文摘的策略、审视构建特色知识库的思路。 展开更多
关键词 主题网页 WEB资源 知识服务 嵌入式服务 公共图书馆
下载PDF
基于改进朴素贝叶斯算法的主题网页识别的研究
2
作者 马进 朱艳辉 +1 位作者 刘璟 田海龙 《信息通信》 2018年第3期13-14,共2页
主题网页识别是面向主题爬虫的重要组成部分,因此网页主题识别的准确率对后续的研究工作至关重要。首先,提取出能体现网页主题的文本,然后利用改进朴素贝叶斯算法对提取的文本的主题进行识别,结果表明该方法能取得较好的识别效果。
关键词 主题网页 主题爬虫 朴素贝叶斯算法
下载PDF
汉维主题网页自动获取技术的研究 被引量:2
3
作者 梁建飞 吐尔根.依布拉音 +1 位作者 田生伟 赛依旦.阿不力米提 《计算机应用与软件》 CSCD 北大核心 2012年第1期42-45,共4页
为了获得大量用于机器翻译研究的汉维(维吾尔)文语料,提出一种从网页中自动获取主题信息的方法。考虑到有主题网页中主题信息分布相对集中、文本密度较高,并且这类网页中大量的噪音信息是由链接引入的,提出的算法首先将链接分为噪音链... 为了获得大量用于机器翻译研究的汉维(维吾尔)文语料,提出一种从网页中自动获取主题信息的方法。考虑到有主题网页中主题信息分布相对集中、文本密度较高,并且这类网页中大量的噪音信息是由链接引入的,提出的算法首先将链接分为噪音链接和非噪音链接,并在源码中删除噪音链接的锚文本和非噪音链接的HTML标签,然后利用容器标签将源码划分为若干部分并删除文本长度和文本密度均小于各自阈值的源码块。针对汉维网页做了实验,实验结果表明,算法在设置合适的阈值的情况下良好率达到90%以上。 展开更多
关键词 主题网页 主题信息 噪音信息
下载PDF
如何做好网站设计的主题网页布局 被引量:1
4
作者 陈兆 《首都信息化》 2004年第3期38-39,共2页
网页可以说是网站构成的基本元素,当我们轻点鼠标,在网海中遨游,一幅幅精彩的网页会呈现在我们面前,那么,网页的精彩与否的因素是什么呢?色彩的搭配、文字的变化、图片的处理等。这些当然是不可忽略的因素,除了这些,还有一个非... 网页可以说是网站构成的基本元素,当我们轻点鼠标,在网海中遨游,一幅幅精彩的网页会呈现在我们面前,那么,网页的精彩与否的因素是什么呢?色彩的搭配、文字的变化、图片的处理等。这些当然是不可忽略的因素,除了这些,还有一个非常重要的因素——网页的布局,下面,我们就有关网页布局谈论一下。 展开更多
关键词 网站设计 主题网页 网页布局 导航栏 第一屏
下载PDF
基于改进的Page Rank算法的网页主题相关度分析研究
5
作者 普措才仁 齐爱琴 《电子技术与软件工程》 2018年第9期254-255,共2页
基于链接分析的经典算法Page Rank,其页面转移概率被平均分配到链出页面,新页面链接较少,所以PR值较低,出现在最后反馈结果中的排序靠后,影响用户信息获取效率和准确度,而冗余信息对用户的干扰使用是信息检索领域探究的焦点。文章分析... 基于链接分析的经典算法Page Rank,其页面转移概率被平均分配到链出页面,新页面链接较少,所以PR值较低,出现在最后反馈结果中的排序靠后,影响用户信息获取效率和准确度,而冗余信息对用户的干扰使用是信息检索领域探究的焦点。文章分析经典算法Page Rank的优缺点,并提出基于主题相关性的Page Rank算法改进策略,实施重新排序,结果证明改进后的算法提高查询效率和质量,具有良好的稳定性,具备可拓展性。 展开更多
关键词 改进PageRank算法 网页主题相关度 主题漂移
下载PDF
基于最小二乘支持向量机的网页主题语义分类的研究 被引量:2
6
作者 樊中华 侯占斌 +1 位作者 张晨星 马骁 《计算机应用与软件》 CSCD 2009年第12期53-55,59,共4页
提出了对网页主题进行语义扩展的方法,利用最小二乘支持向量机LSSVM(least squares support vector machines)来代替传统的支持向量机SVM(support vector machine)的分类技术。在建立LSSVM模型的多类别分类算法基础上,将其应用到网页主... 提出了对网页主题进行语义扩展的方法,利用最小二乘支持向量机LSSVM(least squares support vector machines)来代替传统的支持向量机SVM(support vector machine)的分类技术。在建立LSSVM模型的多类别分类算法基础上,将其应用到网页主题语义分类。实验表明,最小二乘支持向量机学习速度快,在小样本情况下具有良好的非线性建模和泛化能力,对网页主题语义分类具有很好的效果。 展开更多
关键词 最小二乘支持向量机 语义建模 网页主题语义分类
下载PDF
一种改进的基于网页主题链接的PageRank算法研究 被引量:1
7
作者 杨泳丹 《科技通报》 2019年第7期178-181,185,共5页
针对PageRank算法存在的不足,本文对网络链接的结构进行分析,并以此为基础对PageRank的算法进行了改进,提出了主题链接相似度的PageRank算法。本文算法的核心是将当前网页与入链网页的主题相关度作为传递权值,替换PageRank算法中以平均... 针对PageRank算法存在的不足,本文对网络链接的结构进行分析,并以此为基础对PageRank的算法进行了改进,提出了主题链接相似度的PageRank算法。本文算法的核心是将当前网页与入链网页的主题相关度作为传递权值,替换PageRank算法中以平均值作为权值。本文的PageRank-I算法将网页之间的链接作为链接的向量,以这种链接的关系来对向量的余弦相似度进行主题相关性的描述,而不用对额外的文本信息进行处理,减少了系统负担。实验结果证实本文的PageRank-I算法在没有增加系统的额外负担的同时,也没有增加时间上的复杂度,解决了PageRank算法中主题漂移的问题。 展开更多
关键词 网页主题链接 相似度 PAGERANK算法 传递权值
下载PDF
基于Bi-LSTM和分布式表示的网页主题相关度计算
8
作者 王锋 白宇 +1 位作者 蔡东风 王铁铮 《计算机应用与软件》 北大核心 2018年第7期57-62,共6页
针对向量空间模型忽略了查询关键词和网页的语义相关问题,提出一种基于双向LSTM(bidirectional long short-term memory)、词的分布式表示和文档的分布式表示的网页主题相关度计算方法。该方法通过双向LSTM和词的分布式表示对查询关键... 针对向量空间模型忽略了查询关键词和网页的语义相关问题,提出一种基于双向LSTM(bidirectional long short-term memory)、词的分布式表示和文档的分布式表示的网页主题相关度计算方法。该方法通过双向LSTM和词的分布式表示对查询关键词进行扩展,并得到查询扩展的主题关键词集合的词向量;将搜索到的网页通过分布式表示方法得到网页向量;对主题关键词集合和网页进行相关度计算,得到主题相关网页。实验采用搜狗实验室公开的搜狗全网新闻数据作为词向量训练语料,搜狗评测数据作为测试语料。实验结果表明采用该方法可以提高主题相关网页计算的准确率,性能明显高于向量空间模型。 展开更多
关键词 双向LSTM 分布式表示 查询扩展 网页主题 相关度计算
下载PDF
基于最大熵模型的网页主题判定研究
9
作者 李欣昱 《计算机光盘软件与应用》 2011年第11期91-91,共1页
随着网络规模的不断扩大,通用的检索模型无法达到准确性的需求。网页主题判定可以提高系统对数据的管理能力和检索结果的精度。结合前人的研究成果,本文拟采用最大熵模型实现对网页主题的判定。
关键词 信息检索 网页主题 最大熵
下载PDF
基于内容与链接分析的主题爬虫研究与设计 被引量:2
10
作者 舒奔 尹珂 《计算机与现代化》 2014年第4期77-80,共4页
现存主题爬虫算法在抓取主题网页方面,其准确性不是很高。本文提出一种基于文本内容评价与网页链接评价的主题网页抓取方法。首先计算当前网页与主题的相关度,然后将相关度值与给定阈值进行比较决定当前网页是丢弃还是存储,同时相关度... 现存主题爬虫算法在抓取主题网页方面,其准确性不是很高。本文提出一种基于文本内容评价与网页链接评价的主题网页抓取方法。首先计算当前网页与主题的相关度,然后将相关度值与给定阈值进行比较决定当前网页是丢弃还是存储,同时相关度值的大小也决定了待爬链接队列中URL的优先权,此模型考虑了主题网页的准确率与覆盖率之间的平衡。新设计的主题爬虫算法在抓取主题网页方面,其准确性有一定程度的提高。 展开更多
关键词 主题爬虫 主题相关度 主题网页
下载PDF
提高学生网页设计能力的探究与实践
11
作者 王惠兰 《山西广播电视大学学报》 2011年第3期18-20,共3页
网页制作课程涵盖艺术和技术的内容,学生往往重视技术,忽略艺术设计。追求技术忽视设计的做法只会产生匠气十足的网页制作者,不会培养出优秀的网页设计师。课堂教学中,要设计教学环节、教学情境,适时推出网页设计内容;明确设计步骤,细... 网页制作课程涵盖艺术和技术的内容,学生往往重视技术,忽略艺术设计。追求技术忽视设计的做法只会产生匠气十足的网页制作者,不会培养出优秀的网页设计师。课堂教学中,要设计教学环节、教学情境,适时推出网页设计内容;明确设计步骤,细化设计任务,将设计大活个个落实;公开汇报设计内容,逐个检查设计理念掌握情况,督促设计内容完成;量化设计指标,丈量设计完成程度。通过不断探索,不断努力,学生的网页设计能力逐渐提高。 展开更多
关键词 网页制作 网页设计 设计理念 网页主题
下载PDF
基于新型主题信息量化方法的Web主题信息提取研究 被引量:1
12
作者 吕聚旺 都云程 +1 位作者 王弘蔚 施水才 《现代图书情报技术》 CSSCI 北大核心 2008年第12期48-53,共6页
针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采... 针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息。实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾。 展开更多
关键词 网页主题信息信息抽取信息块语义信息IB—DOM树
下载PDF
企业社会媒体主题信息提取算法研究 被引量:1
13
作者 孙宝华 《煤》 2014年第1期72-76,共5页
鉴于已有信息提取方法的可改进之处,结合对HTML网页性质的统计和分析,针对社会媒体中的用户生成数据,提出一种网页主题信息提取算法。算法依据DOM的树型结构特点,充分考虑节点中非链接文字总数和超链接总数这些语义信息,对其进行基于HTM... 鉴于已有信息提取方法的可改进之处,结合对HTML网页性质的统计和分析,针对社会媒体中的用户生成数据,提出一种网页主题信息提取算法。算法依据DOM的树型结构特点,充分考虑节点中非链接文字总数和超链接总数这些语义信息,对其进行基于HTML标签的过滤和基于语义的剪枝,能够准确地提取出网页HTML文档的主题信息。实验证明,提取到的主题信息具有较高的准确性和完整性。 展开更多
关键词 社会媒体 网页主题信息 DOM树
下载PDF
网站建设中如何设计网页页脚
14
作者 郑百惠 《计算机与网络》 2017年第10期48-49,共2页
网站首页包括网页头部、网页主题部分和网页页脚,这三块一起组成网页整体。由此可见,网站页脚也是网站重要一部分。但是,最近在看别人网站的时候,发现很多问题,就是页脚设计的特别粗心,甚至很多都是草草了事,应付网站页脚。因此,建议在... 网站首页包括网页头部、网页主题部分和网页页脚,这三块一起组成网页整体。由此可见,网站页脚也是网站重要一部分。但是,最近在看别人网站的时候,发现很多问题,就是页脚设计的特别粗心,甚至很多都是草草了事,应付网站页脚。因此,建议在设计网站页脚就需要细心,这不仅给网站优化带来好处,还可在网站整体美感上获得加分。 展开更多
关键词 网站建设 网页主题 页脚 设计 网站优化 部分和
下载PDF
让你的网页更吸引人
15
作者 李伟 《科教文汇》 2008年第18期201-201,共1页
本文通过确定网页主题,规划框架结构,设计页面布局,进行内容筛选来阐述网页设计的要点,来探讨如何让你的网页更吸引人。
关键词 网页制作主题 规划 布局
下载PDF
一种搜索引擎性能的简便评价方法和实例 被引量:2
16
作者 赵华 《图书馆理论与实践》 CSSCI 北大核心 2005年第6期114-115,共2页
通过对比搜索引擎的各种评价方法,提出了一种“主题网页检索”的简便评价方法。并使用NIST给出的超文本信息库,采用平均排序倒数方式,对几种典型的英文搜索引擎做了评价。
关键词 主题网页检索 性能评价 搜索引擎
下载PDF
基于文本特征值的正文抽取方法 被引量:2
17
作者 孟川 武小年 《桂林电子科技大学学报》 2017年第2期106-110,共5页
针对现有Web正文抽取方法适用性差、准确率低的问题,提出了一种基于文本特征值的正文抽取方法。该方法通过对Web页面的代码进行预处理,再解析转换成DOM树;通过遍历DOM树,以节点的文本长度和标点符号权重计算DOM树各节点的文本特征值,并... 针对现有Web正文抽取方法适用性差、准确率低的问题,提出了一种基于文本特征值的正文抽取方法。该方法通过对Web页面的代码进行预处理,再解析转换成DOM树;通过遍历DOM树,以节点的文本长度和标点符号权重计算DOM树各节点的文本特征值,并通过标准差消除噪声;通过高斯函数为节点的文本特征值进行平滑处理,缓解节点文本特征值的突变,降低短文本节点丢失的可能。实验测试结果表明,该方法不依赖标签,也无需训练数据,具有较好的通用性和较高的正文抽取准确率。 展开更多
关键词 正文抽取 主题网页 文本特征值 高斯平滑
下载PDF
一个RSS级别的网页主题内容抽取方法与系统
18
作者 张艳 《图书情报工作》 CSSCI 北大核心 2010年第14期107-110,130,共5页
提出一个RSS级别的网页主题内容抽取方法与系统,利用RSSfeed中的少量entry信息训练得到主题内容模板,通过模板可以对RSSfeed下的所有网页进行主题内容抽取。该方法支持分别抽取网页的标题、正文、类别等信息;另外,该方法有自适应机制,... 提出一个RSS级别的网页主题内容抽取方法与系统,利用RSSfeed中的少量entry信息训练得到主题内容模板,通过模板可以对RSSfeed下的所有网页进行主题内容抽取。该方法支持分别抽取网页的标题、正文、类别等信息;另外,该方法有自适应机制,能实时侦测模板的变化。从实验结果来看,该方法和系统有很高的召回率和准确率。 展开更多
关键词 网页主题内容抽取 RSS 模板 自适应机制
原文传递
用Dreamweaver制作博士招生网站
19
作者 马向玲 马向阳 李伟 《管理信息系统》 CSSCI 2001年第8期14-15,共2页
介绍了博士招生网站的设计,该网站采用Dreamweaver先进的思想和方法并结合其他设计工具,使博士招生网站既庄重大方又引人入胜。
关键词 博士招生网站 网页设计 站点 DREAMWEAVER 网页制作工具 网页主题设计 页面元素 框架结构
下载PDF
HITS算法探究 被引量:1
20
作者 高琴 《信息安全与技术》 2012年第2期24-25,共2页
随着互联网的快速发展,搜索引擎的应用已经变得非常广泛,但是却很少有人能够对搜索引擎的算法设计知道多少。通过对搜索引擎的算法设计思想及原理的了解,将更加有助于提供高我们的信息检索能力。文章主要就搜索引擎算法中的HITS算法进... 随着互联网的快速发展,搜索引擎的应用已经变得非常广泛,但是却很少有人能够对搜索引擎的算法设计知道多少。通过对搜索引擎的算法设计思想及原理的了解,将更加有助于提供高我们的信息检索能力。文章主要就搜索引擎算法中的HITS算法进行简要的分析。 展开更多
关键词 HITS算法 搜索引擎 网页主题
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部