期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
网页标题分析对主题爬虫的改进 被引量:11
1
作者 袁浩 黄烟波 《计算机技术与发展》 2009年第6期22-24,28,共4页
随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确的主题爬虫显得十分迫切。然而目前的主题爬虫所采用的两种基本抓取网页的方式效率比较低下。提出了一种通过网页标题... 随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确的主题爬虫显得十分迫切。然而目前的主题爬虫所采用的两种基本抓取网页的方式效率比较低下。提出了一种通过网页标题分析对主题爬虫的改进方案,比较了引入标题分析前后的结果,论证了设计的可行性与可操作性,优化了主题爬虫对同类型特定信息的抓取。 展开更多
关键词 网页标题分析 WEB结构挖掘 主题爬虫 主题相关度 语义分析
下载PDF
基于网页标题的主题相关度算法的研究
2
作者 赵德平 蔡立静 +1 位作者 李鹏 刘阳 《计算机光盘软件与应用》 2010年第16期36-38,共3页
首先,给出了主题爬虫的概念;然后介绍了主题相关度计算的两种模型:布尔模型和空间向量模型;通过对两种模型进行分析,提出了一种基于网页标题的空间向量模型主题相关度计算方法Relative。经过试验分析,该算法具有很好的实用性,基... 首先,给出了主题爬虫的概念;然后介绍了主题相关度计算的两种模型:布尔模型和空间向量模型;通过对两种模型进行分析,提出了一种基于网页标题的空间向量模型主题相关度计算方法Relative。经过试验分析,该算法具有很好的实用性,基于该算法的主题爬虫系统能够在Web上爬取高度主题相关的网页,极大的提高了网络爬虫的效率。 展开更多
关键词 空间向量模型 网页标题 主题相关度 布尔模型 主题爬虫
下载PDF
“竟然”网页标题的语用预设分析
3
作者 陈丽婉 《福建师大福清分校学报》 2011年第6期92-95,共4页
"竟然"是个使用频率很高的语气副词,也是常用的预设触发语,经常出现在网页标题中。文章从语用预设理论出发,分析了"竟然"网页标题的求异性、经济性、权威性和凸显性等语用功能。
关键词 “竟然” 语用预设 网页标题 语用功能
下载PDF
基于相似度的网页标题抽取方法 被引量:6
4
作者 李国华 昝红英 《中文信息学报》 CSCD 北大核心 2011年第2期32-37,共6页
目前网页标题的抽取方法大多结合HTML结构和标签特征进行抽取,但是这些方法并没有考虑标题与正文信息之间内容上的联系。该文提出一种基于相似度的网页标题抽取方法,该方法利用网页标题与正文信息之间的关系,通过计算语言"单位&qu... 目前网页标题的抽取方法大多结合HTML结构和标签特征进行抽取,但是这些方法并没有考虑标题与正文信息之间内容上的联系。该文提出一种基于相似度的网页标题抽取方法,该方法利用网页标题与正文信息之间的关系,通过计算语言"单位"之间的相似度和对应的权值,并引入HITS算法模型对权值进行调整,根据特定的选取方法抽取出真实标题。实验结果表明,该方法不仅对"非标准网页"的抽取达到满意的效果,而且对"标准网页"具有较高的泛化能力。 展开更多
关键词 网页标题抽取 相似度 WEB信息抽取
下载PDF
一种通过筛选和位置感知精准提取资讯类网页标题的方法
5
作者 邓子云 《信息化研究》 2021年第4期8-15,共8页
文章提出了一种通过筛选和位置感知精准提取资讯类网页标题的方法。这种方法包括获得备选标题列表,数据预处理,根据文本的位置筛选,根据文本中的标点筛选,根据位置感知来提取标题。采用从一个资讯类网页的备选标题列表中去除链接文本的e... 文章提出了一种通过筛选和位置感知精准提取资讯类网页标题的方法。这种方法包括获得备选标题列表,数据预处理,根据文本的位置筛选,根据文本中的标点筛选,根据位置感知来提取标题。采用从一个资讯类网页的备选标题列表中去除链接文本的exceptLinkText算法和用于感知备选标题列表中真正标题的下标的obPosition算法。实验结果表明,本文提出的精准提取资讯类网页标题的方法对实验数据样本的准确度为100%,比经典的相似度计算方法高出9%,比经典的TF-IDF方法的准确度高出17%。 展开更多
关键词 筛选 位置感知 网页标题 提取方法 准确度
下载PDF
基于超链接和DOM结构树的网页标题实时抽取方法 被引量:2
6
作者 张兵 汤进 罗斌 《计算机与现代化》 2015年第8期84-88,共5页
网页标题的正确抽取,在Web文本信息抽取领域有着重大意义。本文提出一种网页标题实时抽取方法。首先通过对目录型网页进行实时解析,接着采用基于超链接遍历的方法,并利用标题与发布时间的对应关系,最终获取对应目录型网页的URL及锚文本... 网页标题的正确抽取,在Web文本信息抽取领域有着重大意义。本文提出一种网页标题实时抽取方法。首先通过对目录型网页进行实时解析,接着采用基于超链接遍历的方法,并利用标题与发布时间的对应关系,最终获取对应目录型网页的URL及锚文本。若获得锚文本不是网页正文的标题,则获取主题型网页的HTML源码并构建网页DOM树。在此基础上,结合网页标题的视觉特点,深度优先遍历DOM树,正确提取网页正文标题。实验结果表明,本文提出的Web网页标题实时抽取方法,具有实现简单,准确率高等优点。 展开更多
关键词 超链接 网页标题 发布时间 实时 信息抽取
下载PDF
网页标题的最佳做法
7
作者 方方 《网络与信息》 2007年第11期41-41,共1页
由于网页的标题都会出现在搜索引擎的结果显示页面中.所以对每个网页的标题都请用心!
关键词 网页标题 搜索引擎 页面
下载PDF
Fireworks4制作网页标题动画
8
作者 奚兵 朱萍 《ComputerDIY.电脑DIY》 2002年第8期55-61,共7页
关键词 FIREWORKS4 网页标题动画 动画设计软件
下载PDF
基于分块的网页内容提取算法的研究
9
作者 杨丽萍 《数字技术与应用》 2012年第12期99-100,102,共3页
目前针对于网页分块的正文提取方法很多。一些学者提出,利用标签的数量来判断目标网页采用何种标签对网页进行结构布局,然后针对某一单一标签,对网页进行分块,这种方法针对与大多数利用标准化XHTML排版的网页是可行的,但是对于很多利用... 目前针对于网页分块的正文提取方法很多。一些学者提出,利用标签的数量来判断目标网页采用何种标签对网页进行结构布局,然后针对某一单一标签,对网页进行分块,这种方法针对与大多数利用标准化XHTML排版的网页是可行的,但是对于很多利用松散标准的HTML网页,其排版布局的标签分布不均,很难准确的提取正文内容;利用预先设置的搜索窗口,准确的分离正文段落和相邻的非正文段落。 展开更多
关键词 网页正文提取 分块 网页标题 网页
下载PDF
网页批量编辑之利器——“天新网页批量修改器”
10
作者 陈茂山 《电脑知识与技术(经验技巧)》 2003年第24期57-57,共1页
关键词 功能 修改器 网页标题 批量
下载PDF
循序渐进作网页——高级建站篇
11
作者 阿散 《少年电世界》 2002年第1期65-67,62,共4页
前一期里已经向大家介绍用“东方网页王Ⅲ”快速建站。但对于一些“老鸟”来说,“东方网页王Ⅲ”可能有点小儿科了,所以在这一期当中,我们再向大家介绍用优秀的网页制作工具“FrontPage2000”做出具有专业水准的网页。下面我们将利用建... 前一期里已经向大家介绍用“东方网页王Ⅲ”快速建站。但对于一些“老鸟”来说,“东方网页王Ⅲ”可能有点小儿科了,所以在这一期当中,我们再向大家介绍用优秀的网页制作工具“FrontPage2000”做出具有专业水准的网页。下面我们将利用建站向导,让你快速建立个人网站。 展开更多
关键词 网页制作工具 个人网站 网页标题 FRONTPAGE2000 网页
下载PDF
一种有效的专题信息集中和检索策略 被引量:4
12
作者 王宇新 刘海峰 +1 位作者 郭禾 陈鑫 《计算机应用研究》 CSCD 北大核心 2010年第6期2106-2108,共3页
Internet上专题资源网页汇聚和检索是垂直搜索引擎中的核心问题,HITS算法是早期解决这个问题的经典算法,很多文献对它进行了改进,但无论索引的主题相关率还是引擎的查准率都有提高的余地。提出一种基于锚文本和标题信息过滤并结合网页... Internet上专题资源网页汇聚和检索是垂直搜索引擎中的核心问题,HITS算法是早期解决这个问题的经典算法,很多文献对它进行了改进,但无论索引的主题相关率还是引擎的查准率都有提高的余地。提出一种基于锚文本和标题信息过滤并结合网页内容相关度判断的HITS专题检索策略,利用专题训练集判断主题相关度,很好地解决了只依靠查询字符串判断的弊端。实验表明,此策略能很好地提高专题信息汇聚精确度和检索的准确率,并且减少了非相关URL的下载量。 展开更多
关键词 HITS算法 锚文本 网页标题 专题相关度 向量模型 专题训练集
下载PDF
外媒视点
13
作者 程常现 《印刷工业》 2014年第12期23-23,共1页
通过互联网让更多的客户关注企业的服务,或可为当下信息快速传递时期的重要途径。然而,网络营销的建立并不容易,若想吸引客户的注意,必须以三个核心原则来制订基本策略——搜索引擎的优化,建立内容营销,建立社会媒体营销。其中通... 通过互联网让更多的客户关注企业的服务,或可为当下信息快速传递时期的重要途径。然而,网络营销的建立并不容易,若想吸引客户的注意,必须以三个核心原则来制订基本策略——搜索引擎的优化,建立内容营销,建立社会媒体营销。其中通过对一些细节进行改善可以达到提高网站排名的目的,如精确描述的、独一无二的网页标题,新颖方便的页面结构,在所有网页上含有丰富的、真正的、合适的关键词,在颇受关注的网站进行链接,不断更新相关内容,拥有丰富的图像和视频,等等。 展开更多
关键词 网络营销 客户 工具 网站排名 网页标题 搜索引擎 页面结构 互联网
下载PDF
基于链接路径搜索的URL属性集成方法
14
作者 马艳红 胡学钢 吴共庆 《计算机工程》 CAS CSCD 2013年第1期76-79,共4页
在W2DR算法实验中,部分网页因其锚文本提供的信息量不足,导致利用半结构化的网页信息填充结构化数据库内容效果不佳。为此,提出一种基于链接路径包的URL属性集成方法。采用将锚文本和网页标题相结合的机制,从被搜索网页集中,根据最佳匹... 在W2DR算法实验中,部分网页因其锚文本提供的信息量不足,导致利用半结构化的网页信息填充结构化数据库内容效果不佳。为此,提出一种基于链接路径包的URL属性集成方法。采用将锚文本和网页标题相结合的机制,从被搜索网页集中,根据最佳匹配策略求解得到URL属性值,并将其填充到目标数据库。实验结果表明,与W2DR算法相比,该方法在2个不同数据集中的F值分别提高13.91%和3.54%。 展开更多
关键词 链接路径 网页标题 半结构化数据 结构化数据库 锚文本 URL属性
下载PDF
网络摄像头的安全威胁技术分析 被引量:1
15
作者 郭佳琛 《中国信息安全》 2019年第4期39-42,共4页
近年来,随着网络摄像头(Webcam)在安防监控、智能交通、智慧城市、智能生活等领域的应用越来越广泛,其安全变得尤为重要。由于需要通过网络进行管理,所以网络摄像头设备通常直接暴露在互联网上,并且缺乏完善的安全防护措施,导致网络摄... 近年来,随着网络摄像头(Webcam)在安防监控、智能交通、智慧城市、智能生活等领域的应用越来越广泛,其安全变得尤为重要。由于需要通过网络进行管理,所以网络摄像头设备通常直接暴露在互联网上,并且缺乏完善的安全防护措施,导致网络摄像头设备极易受到攻击,致使个人隐私安全与互联网安全都面临着严峻的挑战。 展开更多
关键词 网络摄像头 网页标题 私有协议 漏洞检测 漏洞利用 海康威视 漏洞探测
下载PDF
基于主题型页面的正文信息抽取技术研究 被引量:1
16
作者 万文兵 《计算机光盘软件与应用》 2015年第1期15-16,共2页
Web页面信息通常包含大量无关结构和HTML标记,而页面主题信息通常淹没其中,如何快速获取Web页面主题信息。本文提出了一种抽取策略,首先判定是否为主题型页面,然后提取网页正文信息,最后利用正则表达式滤除内容块中HTML标记和无关文字... Web页面信息通常包含大量无关结构和HTML标记,而页面主题信息通常淹没其中,如何快速获取Web页面主题信息。本文提出了一种抽取策略,首先判定是否为主题型页面,然后提取网页正文信息,最后利用正则表达式滤除内容块中HTML标记和无关文字。实验结果表明:该方法能准确地完成主题型网页的正文抽取任务。 展开更多
关键词 主题型页面 网页标题 正文抽取
下载PDF
图片批量下载三招
17
作者 冷雪 《网友世界》 2004年第14期34-34,共1页
关键词 网站 IE 网络浏览器 图片保护 网页标题
下载PDF
Google排名靠前有四招
18
作者 翟翔 《开放系统世界》 2005年第7期89-89,共1页
当大家在Google中输入“Linux杂志”这个关键词时,Google搜索引擎会在零点几秒内遍历数据库,并显示所有有关“Linux杂志”的网页,但是有关信息会按照某种秩序进行排名。更有趣的是,这个排名是不固定的,会随着时间的推移而改变。
关键词 LINUX 操作系统 网页标题 WWW GOOGLE 搜索引擎
下载PDF
Google高级搜索三点谈
19
作者 小光 《计算机应用文摘》 2003年第12期49-49,共1页
Google除了支持普照通的搜索语法,在一些特定的场合下也有它的用武之地.本文将为你介绍Google的site link,intitle等高级搜索方法和技巧.下面我们来看看具体的应用。
关键词 网页标题搜索法 GOOGLE 链接检查搜索法 网站 计算机网络
下载PDF
Word文件标题轻松改
20
作者 眉飞色舞的鱼 《大众软件》 2004年第11期88-88,共1页
关键词 WORD 文件标题修改 HTML文档 网页标题重命名专家
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部