期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于URL特征的Phishing检测方法(英文) 被引量:2
1
作者 曹玖新 董丹 +1 位作者 毛波 王田峰 《Journal of Southeast University(English Edition)》 EI CAS 2013年第2期134-138,共5页
为了有效检测恶意网络钓鱼(phishing)行为,提出一种基于URL特征的phishing检测方法.该方法首先对现有钓鱼URL与合法URL进行分析对比,提取钓鱼URL的显著特征,然后采用机器学习算法对样本数据集训练从而获得分类检测模型,用来检测待检测的... 为了有效检测恶意网络钓鱼(phishing)行为,提出一种基于URL特征的phishing检测方法.该方法首先对现有钓鱼URL与合法URL进行分析对比,提取钓鱼URL的显著特征,然后采用机器学习算法对样本数据集训练从而获得分类检测模型,用来检测待检测的URL.为适应钓鱼URL的变化,分类模型需要根据新增样本不断更新,因此,设计了一种基于原始样本数据反馈的增量学习算法.实验表明:提取的URL特征与支持向量机(SVM)分类算法的结合能够使phishing检测达到较高的检测精度,且该增量学习算法是有效的. 展开更多
关键词 url特征 phishing检测 支持向量机 增量学习
下载PDF
基于URL混淆技术识别的钓鱼网页检测方法 被引量:4
2
作者 丁岩 努尔布力 《计算机工程与应用》 CSCD 北大核心 2017年第20期75-82,共8页
针对钓鱼URL常用的混淆技术,提出一种基于规则匹配和逻辑回归的钓鱼网页检测方法(RMLR)。首先,使用针对违反URL命名标准及隐藏钓鱼目标词等混淆技术所构建的规则库对给定网页分类,若可判定其为钓鱼网址,则省略后续的特征提取及检测过程... 针对钓鱼URL常用的混淆技术,提出一种基于规则匹配和逻辑回归的钓鱼网页检测方法(RMLR)。首先,使用针对违反URL命名标准及隐藏钓鱼目标词等混淆技术所构建的规则库对给定网页分类,若可判定其为钓鱼网址,则省略后续的特征提取及检测过程,以满足实时检测的需要。若未能直接判定为钓鱼网址,则提取该URL的相关特征,并使用逻辑回归分类器进行二次检测,以提升检测的适应性和准确率,并降低因规则库规模不足导致的误报率。同时,RMLR引入基于字符串相似度的Jaccard随机域名识别方法来辅助检测钓鱼URL。实验结果表明,RMLR准确率达到98.7%,具有良好的检测效果。 展开更多
关键词 钓鱼网页 统一资源定位符(url)混淆技术 规则匹配 机器学习
下载PDF
基于URL语言特征的钓鱼网站检测算法 被引量:7
3
作者 王雨琪 刘博文 林果园 《计算机工程与应用》 CSCD 北大核心 2019年第24期84-90,共7页
为了应对钓鱼网站的检测逃避策略,提出一种基于URL语言特征的钓鱼网站检测算法。通过分析钓鱼网站和合法网站的URL在不同检测域上的差异,定义基元和敏感度来描述其语言特征。先根据基元对主级域名进行相似性检测,当相似性低于预先设定... 为了应对钓鱼网站的检测逃避策略,提出一种基于URL语言特征的钓鱼网站检测算法。通过分析钓鱼网站和合法网站的URL在不同检测域上的差异,定义基元和敏感度来描述其语言特征。先根据基元对主级域名进行相似性检测,当相似性低于预先设定的阈值时,选取有效的子域名特征,利用随机森林算法对子域名的语言特征进行学习和检测。实验结果表明,该算法的准确率达95.6%,系统运行时间相对较小,平均识别时间小于1 s。 展开更多
关键词 钓鱼网站 统一资源定位符(url) 语言特征 基元 敏感度
下载PDF
基于URL文本特征及链接关系的钓鱼网站识别算法 被引量:3
4
作者 赵蹲宇 张兆心 《高技术通讯》 北大核心 2017年第8期708-717,共10页
为了提高对钓鱼网站的识别准确率,通过对钓鱼网站统一资源定位符(URL)文本数据的分析,结合钓鱼网站内部链接关系组成的网络拓扑结构特征,提出了基于URL文本特征及链接关系的钓鱼网站识别算法FAUFL。该算法的原理是:以URL文本特征作为输... 为了提高对钓鱼网站的识别准确率,通过对钓鱼网站统一资源定位符(URL)文本数据的分析,结合钓鱼网站内部链接关系组成的网络拓扑结构特征,提出了基于URL文本特征及链接关系的钓鱼网站识别算法FAUFL。该算法的原理是:以URL文本特征作为输入,采用随机森林算法生成基于URL文本特征的钓鱼网站判别算法;以链接关系作为输入构建相关网页群,采用基于最大流切割的相关网页群算法生成基于链接关系的钓鱼网站判别算法;将上述两种判别算法结果作为输入,采用Bagging算法进行进一步评估。测试结果表明钓鱼网站识别算法FAUFL算法的识别准确率为99.2%,比基于URL文本特征的算法的准确率提高3.9%,比基于链接关系的算法提高5.0%。 展开更多
关键词 钓鱼网站 融合算法 统一资源定位符(url) 文本特征 链接关系
下载PDF
基于URL索引划分的Web内容自适应算法 被引量:1
5
作者 吕勇 《计算机应用与软件》 CSCD 北大核心 2008年第9期260-262,共3页
Web集群服务的请求分配算法大多使用Hash方法对请求URL进行散列,并按一定规则对请求内容进行负载均衡调度。提出了一种基于URL词典排序及全部URL按其词典序列分为k*n个集合的URLALLOC算法。该算法通过对URL进行词典序排序并将全部URL按... Web集群服务的请求分配算法大多使用Hash方法对请求URL进行散列,并按一定规则对请求内容进行负载均衡调度。提出了一种基于URL词典排序及全部URL按其词典序列分为k*n个集合的URLALLOC算法。该算法通过对URL进行词典序排序并将全部URL按其词典序列分为k*n个集合,依访问流量排序及分段互补等一系列方法将Web负载尽可能均匀地分布到多个后端服务器中。仿真实验结果表明:URLALLOC算法比现有的URL散列方法具有更好的负载均衡能力。 展开更多
关键词 Web集群服务 内容自适应 url 负载均衡
下载PDF
一种新的细粒度URL权限管理方法 被引量:1
6
作者 岳康军 周红专 《湖南邮电职业技术学院学报》 2014年第2期52-57,共6页
通过分析Web应用中URL安全管理的局限性,提出了一种利用Struts2开发框架的配置变量namespace来管理URL权限的方法。首先读取用户自定义的配置文件,匹配授权角色和登录角色,再次调用解析算法解析操作权限值来匹配授权操作和请求操作。只... 通过分析Web应用中URL安全管理的局限性,提出了一种利用Struts2开发框架的配置变量namespace来管理URL权限的方法。首先读取用户自定义的配置文件,匹配授权角色和登录角色,再次调用解析算法解析操作权限值来匹配授权操作和请求操作。只有当两者都匹配成功,才允许用户正常访问。实验表明,该方法既能满足一般的URL权限管理,还能根据用户需求自定义权限控制的粒度来管理操作权限,且支持权限管理可配置,是一种通用的URL管理工具。 展开更多
关键词 WEB应用 url技术 权限管理 算法匹配 粒度
下载PDF
基于信息资源地址的Web集群分配策略 被引量:2
7
作者 李兰英 蒋维成 +1 位作者 何勇 李晓芳 《科学技术与工程》 北大核心 2016年第20期228-232,共5页
Web任务的分配影响Web服务器集群系统的整体性能。常用的分配方法是对用户的信息资源地址(URL)请求,根据服务器数量进行轮询分配。这种策略影响缓存的命中率和服务器性能的发挥。在分析了Web站点中文件的组织方式及用户对Web请求特征的... Web任务的分配影响Web服务器集群系统的整体性能。常用的分配方法是对用户的信息资源地址(URL)请求,根据服务器数量进行轮询分配。这种策略影响缓存的命中率和服务器性能的发挥。在分析了Web站点中文件的组织方式及用户对Web请求特征的基础上,提出了基于URL分配树的LT分配策略。根据URL地址构建URL分配树,对用户的请求进行响应;同时考虑任务的处理代价,各服务节点服务能力和当前负载状况,对服务节点进行负载均衡的任务分配。从缓存队列剩余、请求任务溢出情况和轮询分配策略进行了比较,实验表明分配策略能根据服务节点的服务能力、负载状况进行合理地分配,实现了负载的真正均衡,提高了系统整体吞吐量。 展开更多
关键词 信息资源地址(uniform resource locator url) 分配树 WEB服务 请求分配 处理费用
下载PDF
Java语言与Web页面设计 被引量:1
8
作者 张树芬 赵新建 《信阳师范学院学报(自然科学版)》 CAS 2000年第2期210-213,共4页
论述了 Java Applet方法和多媒体 Web页设计 .该方法制作的 Web页具有很强的交互和动态功能 ,是目前采用 HTML、Java Scrip和 Java Applet三种语言工具制作
关键词 统一资源定位 JAVA语言 JAVAAPPLET WEB页面设计
下载PDF
园区网风险账号评估方法 被引量:1
9
作者 曾煌尧 李丹丹 +1 位作者 马严 丛群 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2020年第9期1761-1767,共7页
基于账号的URL访问日志,通过检测风险设备定位风险账号;提取设备出现次数离散度、设备多账号风险度、收费网络占比等访问行为特征,将其量化为特征向量集;利用高斯混合模型(GMM)将所得到的特征向量集进行聚类,得出设备有异常访问行为的概... 基于账号的URL访问日志,通过检测风险设备定位风险账号;提取设备出现次数离散度、设备多账号风险度、收费网络占比等访问行为特征,将其量化为特征向量集;利用高斯混合模型(GMM)将所得到的特征向量集进行聚类,得出设备有异常访问行为的概率.使用修正余弦相似度算法计算同一账号下同类设备访问URL的相似程度.综合高斯混合模型的聚类结果和修正余弦相似度的计算结果得到风险账号的评估结果.实验结果表明,该方法在误报率低于5%的同时达到85%的检出率,可以在IP地址范围较小、账号登录频率不高的园区网环境下及时发现风险账号. 展开更多
关键词 统一资源定位符(url) 园区网 风险评估 高斯混合模型(GMM) 余弦相似度
下载PDF
企业CIMS与Internet/Intranet的集成接口
10
作者 郝宏宇 李雁春 郑寅 《自动化技术与应用》 2002年第5期29-31,39,共4页
本文从CIMS应用的角度出发 ,阐述了Internet/Intranet技术在制造业企业中的作用 ,结合CIMS应用集成平台的研究 ,介绍了集成平台Internet/Intranet接口技术的设计特点 ,给出了Internet/Intranet应用系统的客户服务器 (Client/Server)体... 本文从CIMS应用的角度出发 ,阐述了Internet/Intranet技术在制造业企业中的作用 ,结合CIMS应用集成平台的研究 ,介绍了集成平台Internet/Intranet接口技术的设计特点 ,给出了Internet/Intranet应用系统的客户服务器 (Client/Server)体系结构 ;描述了CIMS应用集成平台Internet/Intranet应用系统的设计与实现模型 ,该研究的最终目的是使企业的计算机应用系统与Inter 展开更多
关键词 企业 CIMS INTERNET INTRANET 集成接口
下载PDF
A Survey about Algorithms Utilized by Focused Web Crawler
11
作者 Yong-Bin Yu Shi-Lei Huang +3 位作者 Nyima Tashi Huan Zhang Fei Lei Lin-Yang Wu 《Journal of Electronic Science and Technology》 CAS CSCD 2018年第2期129-138,共10页
Abstract—Focused crawlers (also known as subjectoriented crawlers), as the core part of vertical search engine, collect topic-specific web pages as many as they can to form a subject-oriented corpus for the latter ... Abstract—Focused crawlers (also known as subjectoriented crawlers), as the core part of vertical search engine, collect topic-specific web pages as many as they can to form a subject-oriented corpus for the latter data analyzing or user querying. This paper demonstrates that the popular algorithms utilized at the process of focused web crawling, basically refer to webpage analyzing algorithms and crawling strategies (prioritize the uniform resource locator (URLs) in the queue). Advantages and disadvantages of three crawling strategies are shown in the first experiment, which indicates that the best-first search with an appropriate heuristics is a smart choice for topic-oriented crawlingwhile the depth-first search is helpless in focused crawling. Besides, another experiment on comparison of improved ones (with a webpage analyzing algorithm added) is carried out to verify that crawling strategies alone are not quite efficient for focused crawling and in most cases their mutual efforts are taken into consideration. In light of the experiment results and recent researches, some points on the research tendency of focused crawler algorithms are suggested. 展开更多
关键词 Crawling strategies focused crawler harvest rate uniform resource locator(url) prioritizing webpage analyzing
下载PDF
从CNNIC诉3721到百度诉3721看网络关键字寻址服务的规范
12
作者 余子新 王晶喆 《网络法律评论》 2004年第2期370-383,共14页
从2003年6月的CNNIC诉3721到今年百度诉3721这两起网络关键字搜索服务引起的案件来看,不管其背后的目的何在,我们均不得不承认网络关键字的搜索服务已成为网络服务市场争夺的热点。中国在这一新兴领域没有现成的规范引导,造成目前各方... 从2003年6月的CNNIC诉3721到今年百度诉3721这两起网络关键字搜索服务引起的案件来看,不管其背后的目的何在,我们均不得不承认网络关键字的搜索服务已成为网络服务市场争夺的热点。中国在这一新兴领域没有现成的规范引导,造成目前各方混战。规范这一领域已是必然,但究竟是采用国家强制手段还是采用行业自律规范,正是我们目前所面临的问题。一方面法律要求的稳定性很难适应技术的飞速发展;一方面完全放任的行业自律将有可能造成更深一层的垄断,其最终结果仍不利于网络关键字寻址服务市场的规范。因此,只有将法律规范的稳定性、强制性与行业自律规范的灵活性、自愿性结合起来,才能使这一领域在有秩序的竞争中实现网络关键字寻址服务商、企业和网民间利益的平衡。 展开更多
关键词 网络关键字 网络实名 法律规范 行业规范
原文传递
二维码位流长度最小化算法
13
作者 袁泰凌 徐昆 《中国图象图形学报》 CSCD 北大核心 2022年第8期2356-2367,共12页
目的 快速响应矩阵码(quick response code, QR code)简称二维码,是一种由深色和浅色模块组成的正方形符号。给定输入数据,不同编码算法可能输出不同的位流。位流长度决定了二维码的版本,进而决定了二维码每条边上的模块数量。减小二维... 目的 快速响应矩阵码(quick response code, QR code)简称二维码,是一种由深色和浅色模块组成的正方形符号。给定输入数据,不同编码算法可能输出不同的位流。位流长度决定了二维码的版本,进而决定了二维码每条边上的模块数量。减小二维码的版本能够在不减小模块大小的前提下节省面积,或者在不改变面积的前提下增大模块大小。为了减小二维码面积、提高二维码识读率,本文提出了位流长度最小化算法。方法 首先,根据二维码位流可以分段切换编码模式的特点,归纳了6种编码状态;然后,根据二维码位流编码标准推导了状态转移关系,从而将位流长度最小化问题转换成动态规划问题;最后,通过求解动态规划问题,计算出最短位流。针对统一资源定位符(uniform resource locator, URL)类型数据,利用其部分字段对大小写不敏感、部分字段可以转义的性质,提出了统一资源定位符的最短位流计算算法,进一步缩短位流。结果 本文构建了一个测试集,包含603个编码了非URL数据的二维码,以及1 679个编码了URL数据的二维码。实验结果表明,本文算法与二维码标准相比,对于非URL测试集,位流长度减小的二维码占比9.1%,版本减小的二维码占比1.2%;对于URL测试集,位流长度减小的二维码占比98.4%,版本减小的二维码占比31.7%。结论 二维码位流长度最小化算法输出的位流长度最短,输出的二维码版本最小,能在兼容标准二维码解码器且不影响纠错能力的前提下提升二维码的数据容量。同时,本文算法运行速度快,易于使用,没有需要调节的参数。 展开更多
关键词 二维码 快速响应矩阵码 二维码编码 动态规划 统一资源定位符(url)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部