期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于Web页面结构的网页数据提取技术探究 被引量:1
1
作者 郭晓宇 彭浩 《产业与科技论坛》 2020年第18期66-67,共2页
随着网络技术的迅速发展,各种各样的数据信息呈现出爆炸性的增长,而网络上的数据主要来自于Web数据。然而受到多种因素的影响,人们往往不能在众多的数据当中提取到需要的或者感兴趣的内容,所以如何在众多的数据当中提取到有用的内容并... 随着网络技术的迅速发展,各种各样的数据信息呈现出爆炸性的增长,而网络上的数据主要来自于Web数据。然而受到多种因素的影响,人们往往不能在众多的数据当中提取到需要的或者感兴趣的内容,所以如何在众多的数据当中提取到有用的内容并且存储起来十分的重要。现阶段,对此方面的研究大多是以HTML标签解析为依据基于网页DOM树结构,再利用包装器的设计方式进行相应的提取技术。本文以DOM树结构为基础,主要对Web页面抽取和相关技术进行概述,研究了Web页面数据的区域定位算法,从而进行网页数据记录抽取工作。 展开更多
关键词 Web页面结构 网页数据 提取技术
下载PDF
基于标记树表示方法的页面结构分析 被引量:24
2
作者 常育红 姜哲 朱小燕 《计算机工程与应用》 CSCD 北大核心 2004年第16期129-132,共4页
页面内容结构分析在WEB信息检索、分类和抽取等方面有重要作用。文章从页面布局和内容之间关系出发,根据WEB文件中标记之间关系,用标记树表示页面文件,采用自底向上的算法,抽取出具有不同语义的页面内容,提出用树形层次结构表示它们之... 页面内容结构分析在WEB信息检索、分类和抽取等方面有重要作用。文章从页面布局和内容之间关系出发,根据WEB文件中标记之间关系,用标记树表示页面文件,采用自底向上的算法,抽取出具有不同语义的页面内容,提出用树形层次结构表示它们之间关系的方法。在此基础上,通过模仿人们浏览页面的习惯,成功地将其应用于页面的计算机屏读系统,实现自动朗读页面主题的功能。 展开更多
关键词 WEB页面布局 页面结构 信息抽取
下载PDF
PDF页面结构对数字拼大版作业效率的影响
3
作者 杨根福 《广东印刷》 2010年第1期22-24,共3页
在数字拼大版(简称拼大版)作业中,PDF页面的物理结构、出血方式及页面尺寸等结构属性是影响PDF页面在大版版面上布局及定位的关键因素。具有完整规范页面结构的PDF页面在拼大版时可以采用统一、高效的布局与定位方法,不规范的页面结构... 在数字拼大版(简称拼大版)作业中,PDF页面的物理结构、出血方式及页面尺寸等结构属性是影响PDF页面在大版版面上布局及定位的关键因素。具有完整规范页面结构的PDF页面在拼大版时可以采用统一、高效的布局与定位方法,不规范的页面结构则需要建立多种处理方案,工作强度大、效率低且容易出错。 展开更多
关键词 拼大版 PDF 页面结构 作业效率
下载PDF
Web页面主题信息抽取研究与实现 被引量:11
4
作者 刘艳敏 刘飚 +2 位作者 封化民 宋国森 方勇 《计算机工程与应用》 CSCD 北大核心 2006年第21期146-148,共3页
Web页面中的主要信息通常隐藏在大量无关的特征中,如无关紧要的图片和不相关的连接,使用户不能迅速获取主题信息,限制了Web的可用性。论文提出一种网页主题内容提取的方法及相应算法,并通过人工判定的方法对来自120个网站的5000个网页... Web页面中的主要信息通常隐藏在大量无关的特征中,如无关紧要的图片和不相关的连接,使用户不能迅速获取主题信息,限制了Web的可用性。论文提出一种网页主题内容提取的方法及相应算法,并通过人工判定的方法对来自120个网站的5000个网页进行了测试和评估。实验结果表明该方法切实可行,可达到91.35%的准确率。 展开更多
关键词 HTML 信息提取 页面结构分析 标记统计
下载PDF
浅谈网络课程的页面设计 被引量:17
5
作者 谢舒潇 叶长茂 《高等理科教育》 CSSCI 2004年第1期101-104,119,共5页
网络课程的页面设计应按照课程分析、创意策划、设计实施、试用测试、修改评价等几个阶段,按照主次分明,重点突出、功能齐全,操作方便、导航清楚,便于理解、均衡一致,适度灵活、简洁明快,构图精巧等要求来进行,其具体的设计内容包括页... 网络课程的页面设计应按照课程分析、创意策划、设计实施、试用测试、修改评价等几个阶段,按照主次分明,重点突出、功能齐全,操作方便、导航清楚,便于理解、均衡一致,适度灵活、简洁明快,构图精巧等要求来进行,其具体的设计内容包括页面结构和布局的设计,页面颜色的设计以及其它页面媒体元素等方面的设计. 展开更多
关键词 网络课程 页面设计 页面结构 布局设计 页面颜色 组成页面 多媒体技术 开放式实验教学
下载PDF
基于标记树的Web页面区域划分和搜索方法 被引量:7
6
作者 胡飞 《计算机科学》 CSCD 北大核心 2005年第8期182-185,共4页
Web页面的布局可以分为:主要内容、单位标识、导航信息、交互信息和版权申明。我们在处理这些页面时往往只关心主要内容,而且可以从语义上快速定位到主要内容,但是软件系统要做到这一点就非常困难。本文提出一种基于标记树的Web页面区... Web页面的布局可以分为:主要内容、单位标识、导航信息、交互信息和版权申明。我们在处理这些页面时往往只关心主要内容,而且可以从语义上快速定位到主要内容,但是软件系统要做到这一点就非常困难。本文提出一种基于标记树的Web页面区域划分和搜索方法,让软件系统可以忽略别的区域,快速定位到主要内容。对于大量Web页面处理而言,这种方法可以起到减少时间,缩小空间的作用,Web页面越多,效果就越显著。 展开更多
关键词 Web页面布局 页面结构 页面区域 标记树 标记树模式 WEB页面 搜索方法 区域划分 快速定位 软件系统
下载PDF
基于WebGIS的动态演播系统的设计与实现
7
作者 王俊强 陈锐 冯宸冬 《黄河水利职业技术学院学报》 2024年第3期41-47,共7页
针对商业化演播软件在处理与地理信息相关的演播时存在交互性有限、动态和多维展示能力不足等问题,设计了一种基于WebGIS的多源信息动态演播系统。探讨了该系统的总体框架、数据库设计和技术体系,分析了演播页面结构设计、演播编排设计... 针对商业化演播软件在处理与地理信息相关的演播时存在交互性有限、动态和多维展示能力不足等问题,设计了一种基于WebGIS的多源信息动态演播系统。探讨了该系统的总体框架、数据库设计和技术体系,分析了演播页面结构设计、演播编排设计、数据自动上图、地图服务构建等关键技术,并以成都到拉萨的驾驶路线演示为例,探讨了关联图层的编辑、演播工程的编辑及演播展示等技术环节。 展开更多
关键词 动态演播系统 WEBGIS 数据可视化 场景切换 标注牌 页面结构 编排控制
下载PDF
数字拼大版中页面定位问题的分析
8
作者 杨根福 戴俊萍 《印刷工业》 2009年第8期72-74,共3页
众所周知,拼大版作业是印刷流程的关键技术环节。数字化拼大版是印刷生产全数字化的难点。本文通过对拼大版中大版版面与单页文件定位关系的研究,解析了大版页面结构与单页文件的相关关系,并应用海德堡Prinect Signa Station软件进行了... 众所周知,拼大版作业是印刷流程的关键技术环节。数字化拼大版是印刷生产全数字化的难点。本文通过对拼大版中大版版面与单页文件定位关系的研究,解析了大版页面结构与单页文件的相关关系,并应用海德堡Prinect Signa Station软件进行了实际作业验证。 展开更多
关键词 定位问题 页面结构 拼大版 全数字化 印刷流程 印刷生产 海德堡 作业
下载PDF
数字拼大版页面定位探析
9
作者 杨根福 王强 《印刷技术》 2009年第23期48-49,共2页
拼大版作业是数字化工作流程的重要生产环节,做好拼大版工作能显著提高数字化工作流程的生产效率。拼大版本质上解决的是单页文件在大版版面上的定位问题,页面定位受单页文件尺寸、版面结构及大版版式页面结构等因素的影响,并由拼大... 拼大版作业是数字化工作流程的重要生产环节,做好拼大版工作能显著提高数字化工作流程的生产效率。拼大版本质上解决的是单页文件在大版版面上的定位问题,页面定位受单页文件尺寸、版面结构及大版版式页面结构等因素的影响,并由拼大版软件的页面定位原则及方法最终确定。 展开更多
关键词 拼大版软件 页面结构 定位问题 数字化工作流程 生产环节 生产效率 定位原则 文件
下载PDF
基于页面对比分析的数据提取 被引量:1
10
作者 张聚弘 山岚 《计算机与数字工程》 2006年第1期49-52,共4页
针对提供大规模数据查询的Web页面,提出了一种基于站点内页面对比分析的Web数据提取方法。在对页面建树和分块的基础上对比分析获得页面数据块,然后利用同结构多页面对比和格式判断提取出数据,最后将数据存入到数据库中。该方法成功运... 针对提供大规模数据查询的Web页面,提出了一种基于站点内页面对比分析的Web数据提取方法。在对页面建树和分块的基础上对比分析获得页面数据块,然后利用同结构多页面对比和格式判断提取出数据,最后将数据存入到数据库中。该方法成功运用到多个信息提取系统中,实现了高效、准确的数据提取。 展开更多
关键词 数据提取 页面结构 结构
下载PDF
基于页面链接挖掘的Web信息检索 被引量:6
11
作者 胡明 王小虎 刘钢 《情报杂志》 CSSCI 北大核心 2003年第9期21-22,25,共3页
对Web链接结构挖掘在信息检索方面上进行了研究 ,介绍了Web挖掘的概念、分类 ,以及HITS与Page -rank等算法 ,并提出了一种基于样本模式特征提取的信息检索方法 ,分析了Web链接挖掘面临的问题和未来研究的发展趋势。
关键词 WEB信息 网络信息 信息检索 网页 页面链接结构 网络数据挖掘 HITS算法 Page-rank算法
下载PDF
WEB到WAP的转换过程中页面去噪问题的研究
12
作者 刘文静 许志伟 何聪慧 《计算机应用与软件》 CSCD 北大核心 2012年第4期178-179,199,共3页
为了保证WEB到WAP转换结果的完备精练,主要针对转换过程中无用信息去除问题,提出一套页面去噪解决方案。首先根据节点大小位置通过算法判断节点是否为核心内容,在此基础上计算节点链接比,同阈值进行对比,进一步明确节点类型,为了避免误... 为了保证WEB到WAP转换结果的完备精练,主要针对转换过程中无用信息去除问题,提出一套页面去噪解决方案。首先根据节点大小位置通过算法判断节点是否为核心内容,在此基础上计算节点链接比,同阈值进行对比,进一步明确节点类型,为了避免误删,对于可能的噪音模块,采用正则表达式检测节点中链接的指向,如绝大多数指向其它网站,则断定该节点为噪音节点。最终通过构建项目实验平台,对该解决方案进行评估,证明该方案的有效性和可靠性。 展开更多
关键词 移动互联网 网页去噪 广告去除 页面结构 链接比 正则表达式
下载PDF
基于FFT的网页正文提取算法研究与实现 被引量:15
13
作者 李蕾 王劲林 +1 位作者 白鹤 胡晶晶 《计算机工程与应用》 CSCD 北大核心 2007年第30期148-151,共4页
主要研究"正文式"网页的有效信息提取算法。该种底层网页真正含有Web页面所表达的主题信息,通常包含一大段的正文信息,正文信息的前后是一些格式信息(例如导航信息、交互信息、JavaScript脚本等)。分析了此种网页的页面结构特... 主要研究"正文式"网页的有效信息提取算法。该种底层网页真正含有Web页面所表达的主题信息,通常包含一大段的正文信息,正文信息的前后是一些格式信息(例如导航信息、交互信息、JavaScript脚本等)。分析了此种网页的页面结构特征,将问题转化为——给定一个底层网页的HTML源文件,求解最佳的正文区间;从而提出了一种基于快速傅立叶变换的网页正文内容提取算法。采用窗口分段的方法,利用统计学原理和FFT,得出每个可能区间的权值,从而求解出最佳正文区间。实验结果表明,此种方法能比较准确的对"正文式"网页的有效信息进行提取。 展开更多
关键词 中文信息处理 WEB页面 信息提取 页面结构 FFT 区域分割
下载PDF
Web信息抽取技术在统一检索系统中的应用研究 被引量:7
14
作者 王权 施韶亭 《计算机应用与软件》 CSCD 2010年第10期120-122,137,共4页
结合统一检索系统的信息抽取特点,应用基于HTML结构的信息抽取方法,介绍人工找到切割关键信息块的标记和位置的方法,最后提出基于子树广度的Web信息抽取方法,并给出了抽取规则的实现方案及实例。实验证明,该方法在基于Web过程模拟的统... 结合统一检索系统的信息抽取特点,应用基于HTML结构的信息抽取方法,介绍人工找到切割关键信息块的标记和位置的方法,最后提出基于子树广度的Web信息抽取方法,并给出了抽取规则的实现方案及实例。实验证明,该方法在基于Web过程模拟的统一检索系统中能保证很高的数据抽取回召率和查准率,并且成功应用于四家省级科技文献共享平台。 展开更多
关键词 WEB信息抽取 统一检索 页面结构分析 关键信息块 子树广度
下载PDF
WEB日志挖掘在个性化网络教育中的应用 被引量:18
15
作者 黄茜 《现代教育技术》 2004年第5期52-55,共4页
本文介绍了Web日志挖掘的基本概念和过程,通过对学习者在网络教育中留下的日志信息进行挖掘,以实现个性化的网络教育,更好的满足不同类别学习者的需求。
关键词 WEB日志挖掘 网络教育 远程教育网站 个性化教学 页面结构 教育资源
下载PDF
就业信息网的设计与实现 被引量:2
16
作者 周鲜成 周国良 《益阳师专学报》 2001年第3期57-60,共4页
介绍了就业信息网的设计原则和整体结构 ,分析了网站的页面结构和网页设计技术 。
关键词 就业信息网 页面结构 网页设计 设计原则 人才交流网站 信息管理
下载PDF
校园门户网站的Web前端性能优化——以玉林师范学院官方网站首页为例 被引量:1
17
作者 唐微 杨椀萍 《电子商务》 2020年第5期70-72,共3页
校园门户网站是一所学校对外的窗口,门户网站加载效率对网站访问者用户体验起着至关重要的作用,同时也影响学校对外形象。本文通过分析玉林师范学院官网首页前端设计源码,发现其设计存在div标签的频繁使用使HTML文档结构复杂化,未遵循&q... 校园门户网站是一所学校对外的窗口,门户网站加载效率对网站访问者用户体验起着至关重要的作用,同时也影响学校对外形象。本文通过分析玉林师范学院官网首页前端设计源码,发现其设计存在div标签的频繁使用使HTML文档结构复杂化,未遵循"结构、表现、行为"分离原则,图片过多导致请求次数过多等问题,并针对存在问题提出采用HTML5语义化标签、CSS置于顶部/JS放在底部优化和使用精灵图方式的Web前端优化方案,并设计出优化源码,优化后经测试数据结果显示,优化后的网站效率明显提升,达到改善网站的用户体验和节省相当的资源利用的优化目的。 展开更多
关键词 Web前端 性能优化 页面结构优化 HTML
下载PDF
基于Web的CAI系统的开发与设计
18
作者 马慧彬 张忠武 张宗利 《佳木斯大学学报(自然科学版)》 CAS 2003年第3期337-339,共3页
以《面向对象程序设计网上 CAI系统》为例 ,说明了在 Internet上基于 Web的 CAI系统的开发与设计的目的、常用的开发工具与主要的设计技术 ;并对用 ASP设计网络应用程序的要点进行了讨论 .
关键词 Web CAI系统 计算机辅助教育 Internet 开发工具 页面结构 ASP 网络应用程序
下载PDF
交互式远程教学设计原则探究
19
作者 彭绪富 邹友宽 《湖北师范学院学报(自然科学版)》 2001年第1期42-45,共4页
交互式远程教学的设计是一个集网络、多媒体、数据库诸多方面的系统设计 ,其设计原则要求科学且严密。从教学内容的选用、页面结构的组织、系统的设计等三个方面进行了重要的探讨。
关键词 交互式 教学内容 页面结构 设计原则
下载PDF
省级图书馆WWW主页分析
20
作者 范晴 徐建华 《山东图书馆季刊》 2001年第2期53-56,共4页
借助互联网促进自身发展是当前图书馆界密切关注的话题。本文分析了我国网上省级公共图书馆主页页面结构与图书馆主页的作用、存在问题 ,探讨了公共图书馆主页的基本定位、个性化定位及主页建设对公共图书馆事业的意义 ,阐述了省级公共... 借助互联网促进自身发展是当前图书馆界密切关注的话题。本文分析了我国网上省级公共图书馆主页页面结构与图书馆主页的作用、存在问题 ,探讨了公共图书馆主页的基本定位、个性化定位及主页建设对公共图书馆事业的意义 ,阐述了省级公共图书馆如何进一步发展网络化、数字化服务 。 展开更多
关键词 省级公共图书馆 WWW 主页 数字图书馆 数居更新速度 页面结构 个性化定位 主页建设
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部