期刊文献+
共找到810篇文章
< 1 2 41 >
每页显示 20 50 100
Meaningful String Extraction Based on Clustering for Improving Webpage Classification
1
作者 Chen Jie Tan Jianlong +1 位作者 Liao Hao Zhou Yanquan 《China Communications》 SCIE CSCD 2012年第3期68-77,共10页
Since webpage classification is different from traditional text classification with its irregular words and phrases,massive and unlabeled features,which makes it harder for us to obtain effective feature.To cope with ... Since webpage classification is different from traditional text classification with its irregular words and phrases,massive and unlabeled features,which makes it harder for us to obtain effective feature.To cope with this problem,we propose two scenarios to extract meaningful strings based on document clustering and term clustering with multi-strategies to optimize a Vector Space Model(VSM) in order to improve webpage classification.The results show that document clustering work better than term clustering in coping with document content.However,a better overall performance is obtained by spectral clustering with document clustering.Moreover,owing to image existing in a same webpage with document content,the proposed method is also applied to extract image meaningful terms,and experiment results also show its effectiveness in improving webpage classification. 展开更多
关键词 webpage classification meaningfulstring extraction document clustering term cluste-ring K-MEANS spectral clustering
下载PDF
Technology Provides Better Document Search Results on Slovak Legislation Webpage as Result of a Simulation of Webpage Performance Parameters
2
作者 Peter Kvasnica 《Computers, Materials & Continua》 SCIE EI 2021年第4期159-170,共12页
This article acquaints the public with the insights gained from conducting document searches in the Slovak public administration information system,when supported by knowledge of its management.Additionally,it discuss... This article acquaints the public with the insights gained from conducting document searches in the Slovak public administration information system,when supported by knowledge of its management.Additionally,it discusses the advantages of simulating performance parameters and comparing the obtained results with the real parameters of the eZbierka(eCollection)legislation webpage.This comparison was based upon simulated results,obtained through the Gatling simulation tool,versus those obtained from measuring the properties of the public administration legislation webpage.Both sets of data(simulated and real),were generated via the the document search technologies in place on the eZbierka legislation webpage.The webpage provides users with binding laws and bylaws available in an electronically signed PDF file format.It is free open source.In order to simulate the accessing of documents on the webpage,the Gatling simulation tool was used.This tool simulated the activity,performed in the background of the information system,as a user attempted to read the data via the steps mentioned in the scenario.The settings of the simulated environment corresponded as much as possible to the hardware parameters and network infrastructure properties used for the operation of the respective information system.Based on this data,through load changing,we determined the number of users,the response time to queries,and their number;these parameters define the throughput of the server of the legislation webpage.The required parameter determination and performance of search technology operations are confirmed by a suitable hardware design and the webpage property parameter settings.We used the data from the eZbierka legislation webpage from its operational period of January 2016 to January 2019 for comparison,and analysed the relevant data to determine the parameter values of the legislation webpage of the slov-lex information system.The basic elements of the design solution include the technology used,the technology for searching the legislative documents with support of a searching tool,and a graphic database interface.By comparing the results,their dependencies,and proportionality,it is possible to ascertain the proper determination and appropriate applied search technology for selection of documents.Further,the graphic interface of the real web database was confirmed. 展开更多
关键词 Legislation webpage simulation tool search tool performance testing
下载PDF
An Efficient Webpage Classification Algorithm Based on LSH
3
作者 Junjun Liu Haichun Sun Zhijun Ding 《国际计算机前沿大会会议论文集》 2015年第1期73-75,共3页
With the explosive growth of Internet information, it is more and more important to fetch real-time and related information. And it puts forward higher requirement on the speed of webpage classification which is one o... With the explosive growth of Internet information, it is more and more important to fetch real-time and related information. And it puts forward higher requirement on the speed of webpage classification which is one of common methods to retrieve and manage information. To get a more efficient classifier, this paper proposes a webpage classification method based on locality sensitive hash function. In which, three innovative modules including building feature dictionary, mapping feature vectors to fingerprints using Localitysensitive hashing, and extending webpage features are contained. The compare results show that the proposed algorithm has better performance in lower time than the naive bayes one. 展开更多
关键词 EXPLOSIVE growth webpage classification Locality-sensitive HASHING FINGERPRINT EXTENDING webpage features
下载PDF
Study on Chinese Webpage Keyword Extraction based on Multiple Index Factors
4
《International English Education Research》 2013年第12期127-129,共3页
Webpage keyword extraction is very important for automatically extracting webpage summary, retrieval, automatic question answering, and character relation extraction, etc. In this paper, the environment vector of word... Webpage keyword extraction is very important for automatically extracting webpage summary, retrieval, automatic question answering, and character relation extraction, etc. In this paper, the environment vector of words is constructed with lexical chain, words context, word frequency, and webpage attribute weights according to the keywords characteristics. Thus, the multi-factor table of words is constructed, and then the keyword extraction issue is divided into two types according to the multi-factor table of words: keyword and non-keyword. Then, words are classified again with the support vector machine (SVM), and this method can extract the keywords of unregistered words and eliminate the semantic ambiguities. Experimental results show that this method is with higher precision ratio and recall ratio compared with the simple ff/idf algorithm. 展开更多
关键词 Lexical Chain CONTEXT Attribute Weights of webpage Support Vector Machine (SVM) Eliminate Semantic Ambiguities
下载PDF
新的尝试新的QQ——WebPager
5
作者 YY 《家庭电脑世界》 2002年第3期91-92,共2页
关键词 网络聊天软件 webpager QQ 计算机网络
下载PDF
基于Java Web技术的校园论坛网页的设计与实现
6
作者 庄丽君 汤海林 《现代信息科技》 2024年第15期74-77,共4页
随着网络技术的快速发展,校园论坛打破了传统人与人之间的交流方式,可为广大师生提供更为丰富、自由、便捷的交流与沟通渠道,用户可以在校园论坛上自由分享、交流互动等。文章设计并实现一个基于Java Web技术的校园论坛网页,以方便广大... 随着网络技术的快速发展,校园论坛打破了传统人与人之间的交流方式,可为广大师生提供更为丰富、自由、便捷的交流与沟通渠道,用户可以在校园论坛上自由分享、交流互动等。文章设计并实现一个基于Java Web技术的校园论坛网页,以方便广大师生进行学术交流和社交互动。该校园论坛基于Java Web技术而开发,采用B/S设计模式,使用JSP+CSS技术设计美化界面,运用JDBC连接关系型数据库MySQL。实现了登录注册模块、用户交流模块、帖子模块、用户管理模块、校园互助管理模块等。经过严格的测试和验证,该校园论坛在各项功能上均达到了预期目标,安全性和实用性俱佳,能够为广大师生提供一个良好的在线交流虚拟社交平台。 展开更多
关键词 Java Web 校园论坛 网页设计
下载PDF
多视角网页分类数据集构建及性能评估
7
作者 孙辰星 刘伟 +3 位作者 卢彬 梁诗宇 诸云强 甘小莺 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期406-415,共10页
网页分类是互联网数据挖掘中的一项重要任务,在信息搜索、推荐系统和知识发现等领域发挥着关键作用.然而,现有的公开网页数据集缺乏多视角信息,难以适用于蕴含复杂特征的网页分类任务.针对上述问题,基于“收集-处理-标注”构建流程,提... 网页分类是互联网数据挖掘中的一项重要任务,在信息搜索、推荐系统和知识发现等领域发挥着关键作用.然而,现有的公开网页数据集缺乏多视角信息,难以适用于蕴含复杂特征的网页分类任务.针对上述问题,基于“收集-处理-标注”构建流程,提出一个涵盖文本语义、网页结构等多视角特征的网页数据集Web-Minds,该数据集包含600余个门户网站下的21828条网页.首先,在开放互联网中通过关键词检索采集得到相关网页数据;其次,使用网页解析工具对收集的数据中的文本、DOM结构树、关键词等多视角信息进行提取与清洗;最后,采用大语言模型与“人在回路”的联合标注策略,形成网页类型与网页主题两种标签.在此基础上,针对Web-Minds数据集,测试评估了机器学习、文本分类和网页分类多种算法,结果表明,综合利用多视角特征能有效提升算法的准确率,和仅应用单视角特征相比,在网页类型和主题分类任务上,准确率分别提升了5.49%和5.61%. 展开更多
关键词 网页数据集 网页分类 文本分类 数据挖掘 深度学习
下载PDF
基于WAI-ARIA的网页导航栏地标属性的标识方法
8
作者 李玉聪 汪士钦 +1 位作者 张梦玺 刘华虓 《吉林大学学报(理学版)》 CAS 北大核心 2024年第3期697-703,共7页
针对多样化网页上视障用户导航的难题,提出一种自动标识导航栏地标的方法,以提高网页无障碍性.首先,通过设计启发式规则,根据导航栏内有序元素排列以及子元素内常含超链接和精炼文字等规则,自动提取导航栏内的元素;其次,采用决策树二分... 针对多样化网页上视障用户导航的难题,提出一种自动标识导航栏地标的方法,以提高网页无障碍性.首先,通过设计启发式规则,根据导航栏内有序元素排列以及子元素内常含超链接和精炼文字等规则,自动提取导航栏内的元素;其次,采用决策树二分类算法,用于分类导航栏中特征差异显著的元素;最后,对已识别的导航栏元素进行地标属性注入.在对100个网站的实验评估中,该方法成功识别了92.6%的导航栏元素,而注入的地标属性则显著提升了网站的无障碍性能,从而改善了视障用户的使用体验. 展开更多
关键词 网页无障碍 地标 导航栏识别 决策树算法
下载PDF
基于Web的城轨联锁维护机设计与实现
9
作者 刘龙 《铁路通信信号工程技术》 2024年第9期72-78,共7页
传统的基于C/S模式下的联锁维护机程序安装、操作复杂,对用户具有一定的要求。为提高产品的用户友好性,利用SpringBoot、Vue、数据库等框架技术设计与实现一种基于Web的联锁维护机,具有传统联锁维护机的站场图形显示、网络拓扑图形显示... 传统的基于C/S模式下的联锁维护机程序安装、操作复杂,对用户具有一定的要求。为提高产品的用户友好性,利用SpringBoot、Vue、数据库等框架技术设计与实现一种基于Web的联锁维护机,具有传统联锁维护机的站场图形显示、网络拓扑图形显示、历史数据查询等功能,维护机功能导航栏以列表形式展示在页面上,用户登录网页后点击导航栏可查看相应的页面。与传统的C/S模式联锁维护机相比,基于Web的联锁维护机的访问更简单,通过浏览器访问网页的方式更贴近用户的使用习惯。 展开更多
关键词 Web联锁维护机 浏览器访问 站场图形显示 网络拓扑图形显示 历史数据查询
下载PDF
基于网页源码结构理解的自适应爬虫代码生成方法 被引量:1
10
作者 刘耀 刘茹 翟雨 《计算机应用》 CSCD 北大核心 2023年第6期1779-1784,共6页
针对网页频繁改版带来的网页源码变动,尤其是文章日期、正文或来源机构等网页源码中目标实体的元素结构或属性标识变动所引起的爬虫代码失效、人力维护成本过高的问题,提出一种基于网页源码结构理解的自适应爬虫代码生成方法。首先,通... 针对网页频繁改版带来的网页源码变动,尤其是文章日期、正文或来源机构等网页源码中目标实体的元素结构或属性标识变动所引起的爬虫代码失效、人力维护成本过高的问题,提出一种基于网页源码结构理解的自适应爬虫代码生成方法。首先,通过分析网页结构特征变动规律提取相应爬虫代码;然后,利用Encoder-Decoder模型表征网页源码及代码的变动,通过融合网页源码自身结构语义特征、网页源码变动特征及网页代码变动特征,得到自适应代码生成模型;最后,完善自适应系统的感知、生成和激活机制,从而形成具有自适应处理能力的爬虫系统。经实验验证,所提自适应代码生成模型的最终准确率为78.5%,与TF-IDF+Seq2Seq和TriDNR+Seq2Seq两种生成模型相比,所提模型在网页源码变动的表示和代码生成的有效性上具有一定的优越性。因此,所提方法能够解决网页源码变动引起的爬虫代码运行问题,为网络资源获取即爬虫技术的自适应处理能力提供新思路。 展开更多
关键词 资源获取 网页改版 超文本标记语言 网页源码理解 自适应网络爬虫
下载PDF
融合DRAE与SVM的网页防篡改检测
11
作者 邢金阁 张鑫 周长建 《福州大学学报(自然科学版)》 CAS 北大核心 2023年第5期652-656,共5页
针对传统的网络安全研究,如入侵检测、流量分析和主动防御等方法需要较强网络安全相关知识、大量网络训练数据,以及较高研究门槛的问题,本研究提出一种基于深度残差自动编码器(deep residual auto-encoder,DRAE)与支持向量机(SVM)相结... 针对传统的网络安全研究,如入侵检测、流量分析和主动防御等方法需要较强网络安全相关知识、大量网络训练数据,以及较高研究门槛的问题,本研究提出一种基于深度残差自动编码器(deep residual auto-encoder,DRAE)与支持向量机(SVM)相结合的网页防篡改检测模型,运用DRAE提取网页图像特征,并输入SVM分类器以判别网页是否被篡改.在某大学范围内实验验证,结果表明,使用该模型进行网页检测的准确率高达95%,高于现有检测方法. 展开更多
关键词 网页防篡改 深度残差自动编码器 支持向量机 网络安全
下载PDF
基于卷积神经网络的暗网网页分类研究 被引量:1
12
作者 洪良怡 朱松林 +1 位作者 王轶骏 薛质 《计算机应用与软件》 北大核心 2023年第2期320-325,330,共7页
在海量暗网网页中筛选敏感主题内容对执法部门具有重要意义。通过对Freenet等暗网网页文本特点和类别进行深入分析,提出基于TextCNN的暗网网页主题分类模型。模型根据暗网网页非标准化的语言特点进行数据预处理;使用预训练的词向量获得... 在海量暗网网页中筛选敏感主题内容对执法部门具有重要意义。通过对Freenet等暗网网页文本特点和类别进行深入分析,提出基于TextCNN的暗网网页主题分类模型。模型根据暗网网页非标准化的语言特点进行数据预处理;使用预训练的词向量获得网页内容的表示,通过不同大小的卷积核进行卷积操作获得特征图像,使用最大池化函数获得最终的特征向量;对卷积网络进行正则化处理,使用softmax函数预测类别概率。实验结果表明,采用该方法精确率为86.01%,召回率为78.97%,Macro-F1值为82.33%,高于机器学习模型,能够有效解决暗网网页分类问题。 展开更多
关键词 暗网 网页分类 卷积神经网络 机器学习
下载PDF
Tri-BERT-SENet:融合多特征的恶意网页识别 被引量:2
13
作者 杨立圣 罗文华 《小型微型计算机系统》 CSCD 北大核心 2023年第4期875-880,共6页
传统恶意网页识别缺乏全局性、系统性考量,没有将网页作为有机整体,而是独立针对标签结构、URL地址、文本内容等特定层面特征开展研究,导致准确率较低.虽然已有学者提出融合特征思想,但依旧使用机器学习算法予以实现,特征工程工作量巨大... 传统恶意网页识别缺乏全局性、系统性考量,没有将网页作为有机整体,而是独立针对标签结构、URL地址、文本内容等特定层面特征开展研究,导致准确率较低.虽然已有学者提出融合特征思想,但依旧使用机器学习算法予以实现,特征工程工作量巨大,识别效率低下.针对上述问题,提出一种基于多特征融合的Tri-BERT-SENet模型,用于完成恶意网页的识别任务.利用获取得到的HTML特征、网页URL特征以及网页文本特征,结合BERT模型的上下文感知能力,将特征转化为3个BERT模型输出;之后将模型输出作为特征通道,使用SENet进行加权计算,最终输出识别结果.实验结果表明,与传统机器学习模型以及使用BERT对单一特征的识别方法相比,该检测方法在恶意网页识别的准确率上有较大提升. 展开更多
关键词 恶意网页识别 特征融合 BERT SENet
下载PDF
传播学视角下世界文化遗产网页翻译研究——以“数字敦煌”为例 被引量:2
14
作者 石红燕 李曼 《兰州文理学院学报(社会科学版)》 2023年第2期55-61,共7页
散布在华夏大地上的世界文化遗产敦煌莫高窟是中华文明的生动见证,而敦煌文化的国际传播是推动中华文化“走出去”战略的重要举措之一。本研究以传播学为理论框架,结合哈罗德·拉斯韦尔5W传播要素,研究世界文化遗产敦煌莫高窟网站... 散布在华夏大地上的世界文化遗产敦煌莫高窟是中华文明的生动见证,而敦煌文化的国际传播是推动中华文化“走出去”战略的重要举措之一。本研究以传播学为理论框架,结合哈罗德·拉斯韦尔5W传播要素,研究世界文化遗产敦煌莫高窟网站“数字敦煌”的网页翻译现状以及存在的问题。研究发现,“数字敦煌”有两点值得推广和借鉴之处,但是,网站也存在三个方面的问题。鉴于此,笔者提出四点改进措施,以期为世界文化遗产的网站设计提供借鉴思路。 展开更多
关键词 传播学 世界文化遗产 网页翻译 “数字敦煌”
下载PDF
受互联网思路启发的电力系统重要节点评估算法
15
作者 耿俊琪 孙贤明 +1 位作者 宋蕙慧 曲延滨 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第3期211-218,共8页
对电力系统中重要节点进行有效区分,有助于在资源有限的条件下对重要节点施加额外保护或改变拓扑结构,从而提高系统鲁棒性、降低事故发生的概率。受网页排序算法启发,提出电气链接结构分析的随机方法(electrical stochastic approach fo... 对电力系统中重要节点进行有效区分,有助于在资源有限的条件下对重要节点施加额外保护或改变拓扑结构,从而提高系统鲁棒性、降低事故发生的概率。受网页排序算法启发,提出电气链接结构分析的随机方法(electrical stochastic approach for link structure analysis,E-SALSA)用于电力系统重要节点评估。该算法综合考虑了电力系统拓扑结构、潮流等因素对节点的影响,能够有效反映电力系统的真实情况,并且其特点更符合电力系统背景。在IEEE300节点电力系统中,使用失负荷规模和最大子群规模两个指标对E-SALSA算法与电气介数算法、基于共同引用的超链接引导的主题搜索(model based on co-citation hypertext induced topic search,MBCC-HITS)算法进行了对比分析。结果证明E-SALSA算法相比电气介数算法在两个指标上都具有优势,相比MBCC-HITS算法能够更综合考虑各方面因素对节点的影响,进而证明了E-SALSA算法的合理性、有效性。 展开更多
关键词 复杂网络 电力系统 网页算法 重要节点
下载PDF
DIV+CSS布局技术在网页设计中的应用 被引量:5
16
作者 陈洪敏 《现代信息科技》 2023年第2期87-89,93,共4页
随着互联网技术的快速发展,人们对网页功能的需求更加多元化,网页设计的作用日益凸显,网页界面的功能布局、整洁程度、新颖程度等在网页设计中发挥着至关重要的作用。DIV+CSS技术在网页布局中具有代码剪辑程度高、内容表现突出、灵活性... 随着互联网技术的快速发展,人们对网页功能的需求更加多元化,网页设计的作用日益凸显,网页界面的功能布局、整洁程度、新颖程度等在网页设计中发挥着至关重要的作用。DIV+CSS技术在网页布局中具有代码剪辑程度高、内容表现突出、灵活性高以及设计效率高等优势,使其在网页设计与开发中的应用越来越广泛。基于此,文章阐述了DIV+CSS技术在网页设计中的优势及原理,并以大数据智能控制中心系统的网站为例进行了网页布局探究。 展开更多
关键词 DIV+CSS技术 布局 网页设计
下载PDF
校园二手资源共享平台的设计与实现 被引量:1
17
作者 张娅妮 陈永春 《现代信息科技》 2023年第13期6-12,共7页
针对学校学生二手资源共享再利用问题,采用网页前端设计、Java Web、MySQL、uni-APP、Layui等相关技术,开发一个较为完善的校园二手资源共享平台,能够让学生在平台上进行资源共享,节约学生的在校生活成本。针对网页端和手机端进行设计... 针对学校学生二手资源共享再利用问题,采用网页前端设计、Java Web、MySQL、uni-APP、Layui等相关技术,开发一个较为完善的校园二手资源共享平台,能够让学生在平台上进行资源共享,节约学生的在校生活成本。针对网页端和手机端进行设计和实现,二者风格统一,具有较好的客户交互性。在平台的加持下,学生可逐渐养成良好的资源共享习惯,提高闲置资源的利用率,具有一定的现实意义。 展开更多
关键词 Java MySQL 网页前端 资源共享 手机端
下载PDF
政府网站网页电子文件元数据标准体系研究
18
作者 陈其胜 朱彬 《中国标准化》 2023年第22期32-35,95,共5页
本文结合政府网站建设和管理的相关要求和发展现状,以网页电子文件元数据为对象,对现有相关标准进行了系统分析,基于符合我国政府网站特点、满足实际管理需求且便于资源综合利用的原则,从文件描述、过程管理和资源利用三个方面初步构建... 本文结合政府网站建设和管理的相关要求和发展现状,以网页电子文件元数据为对象,对现有相关标准进行了系统分析,基于符合我国政府网站特点、满足实际管理需求且便于资源综合利用的原则,从文件描述、过程管理和资源利用三个方面初步构建了政府网站网页电子文件元数据标准体系,以期为政府部门制定相关的元数据标准和元数据应用提供参考和借鉴。 展开更多
关键词 政府网站 网页电子文件 元数据 标准体系
下载PDF
面向网页篡改检测的混沌MD5算法的研究
19
作者 马佳芸 付婷婷 +1 位作者 沈嘉诚 徐佳立 《工业控制计算机》 2023年第2期107-109,137,共4页
随着网页篡改问题的日趋严峻,网页篡改检测技术成为近年来的研究热点。Hash函数校验是目前网页篡改检测任务中常用的一种方法,其中,MD5算法是应用最为广泛的Hash检验函数。然而,在使用MD5算法对网页内容进行校验时,网页内容篡改前后所... 随着网页篡改问题的日趋严峻,网页篡改检测技术成为近年来的研究热点。Hash函数校验是目前网页篡改检测任务中常用的一种方法,其中,MD5算法是应用最为广泛的Hash检验函数。然而,在使用MD5算法对网页内容进行校验时,网页内容篡改前后所对应的Hash值存在一定的碰撞问题。针对上述问题,提出了一种面向网页篡改检测的混沌MD5算法,通过基于明文分组的动态参数模型对传统MD5算法的静态参数进行优化,并采用整数帐篷映射对明文分组进行多次迭代,增强算法的抗碰撞性。实验表明,和传统MD5算法相比,混沌MD5算法的Hash值绝对距离与理想值的偏差率减小了0.6047‰,有效降低了网页篡改检测过程中的Hash值碰撞概率。 展开更多
关键词 网页篡改 MD5算法 碰撞攻击 帐篷映射
下载PDF
一种基于应用数据单元长度的加密网页识别方法
20
作者 魏子钧 程光 陈子涵 《网络空间安全科学学报》 2023年第3期3-12,共10页
网页指纹攻击可获取HTTPS网络流量中的信息,进而泄露用户隐私。研究网页识别有助于发现当前加密协议存在的安全漏洞,这对于改进用户隐私保护策略具有重要意义,同时也有助于提升网络服务提供商的网络管理水平。目前的网页识别研究并未充... 网页指纹攻击可获取HTTPS网络流量中的信息,进而泄露用户隐私。研究网页识别有助于发现当前加密协议存在的安全漏洞,这对于改进用户隐私保护策略具有重要意义,同时也有助于提升网络服务提供商的网络管理水平。目前的网页识别研究并未充分考虑应用层特征,且忽视了实际的网页浏览场景(如浏览器缓存机制)。鉴于HTTPS协议栈和网页加载方式的特性,研究提出了一种利用应用数据单元的二阶段网页识别方法Penetrator。应用数据单元特征还原增强了HTTPS流量中的应用层信息的利用率,以应用数据单元长度序列为特征进行网页识别。通过理论分析和实验验证,证明了应用层特征对于加密网页识别的有效性。实验表明,Penetrator能够有效消除HTTPS协议栈引入的误差,提取协议误差率低于0.98%的应用数据单元长度序列。通过与现有方法的对比,证明了Penetrator在网页识别中的优越性。 展开更多
关键词 加密流量分析 网页识别 应用数据单元 HTTPS 流量特征工程
下载PDF
上一页 1 2 41 下一页 到第
使用帮助 返回顶部