检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到8篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

高效的基于段模式的恶意URL检测方法被引量：9: 1; 作者林海伦李焱 +2 位作者王伟平岳银亮林政《通信学报》 EI CSCD 北大核心 2015年第S1期141-148,共8页; 提出一种高效的基于段模式的检测恶意URL的方法,该方法首先解析已标注的恶意URL中的域名、路径名和文件名3个语义段,然后通过建立以三元组为词项的倒排索引快速计算恶意URL每个语义段的模式,最后基于倒排索引查找到的段模式来判定给定的... 展开更多; 关键词恶意url 段模式三元组倒排索引随机域名; 下载PDF 职称材料

基于双语URL匹配模式可信度的平行网页识别研究被引量：3: 2; 作者章成志马舒天 +1 位作者揭春雨姚旭晨《中文信息学报》 CSCD 北大核心 2018年第3期91-100,共10页; 平行语料是自然语言处理中一项重要的基础资源,在双语平行网页中大量存在。该文首先介绍双语URL匹配模式的可信度计算方法,然后提出基于局部可信度的双语平行网页识别算法,再依据匹配模式的全局可信度,提出两种优化方法:即利用全局可信... 展开更多; 关键词平行网页获取平行语料库双语url匹配模式双语文本挖掘; 下载PDF 职称材料

一种面向大规模URL过滤的多模式串匹配算法被引量：13: 3; 作者刘燕兵邵妍 +2 位作者王勇刘庆云郭莉《计算机学报》 EI CSCD 北大核心 2014年第5期1159-1169,共11页; 对大量有害的URL进行过滤,是目前网络安全应用系统中所亟需的关键技术.使用经典的串匹配算法检测庞大的URL规则集,需要消耗大量的计算资源和存储资源,性能十分低下.该文设计了一种适合于大规模URL过滤的多模式串匹配算法——SOGOPT.该... 展开更多; 关键词多模式串匹配 url过滤最优窗口选择模式串分组规约信息安全网络安全; 下载PDF 职称材料

URL模式与HTML结构相结合的平行网页获取方法被引量：6: 4; 作者刘奇刘洋孙茂松《中文信息学报》 CSCD 北大核心 2013年第3期91-99,共9页; 平行语料库是对机器翻译、跨语言信息检索等应用技术具有重要支撑作用的基础数据资源。虽然互联网上的平行网页数量巨大且持续增长,但由于平行网站的异构性和复杂性,如何快速自动获取高质量的平行网页进而构造平行语料库仍然是巨大的挑... 展开更多; 关键词平行网页获取平行语料库 url模式 HTML结构; 下载PDF 职称材料

基于URL模式集的主题爬虫被引量：18: 5; 作者胡萍瑞李石君《计算机应用研究》 CSCD 北大核心 2018年第3期694-699,726,共7页; 为提高主题爬虫的性能,依据站点信息组织的特点和URL的特征,提出一种基于URL模式集的主题爬虫。爬虫分两个阶段,在实验爬虫阶段,采集站点样本数据,采用基于URL前缀树的模式构建算法构建URL模式,形成模式关系图,并利用HITS算法分析该模... 展开更多; 关键词主题爬虫 url模式 url前缀树模式关系图 url模式重要性; 下载PDF 职称材料

一种新的Web用户群体和URL聚类算法的研究被引量：11: 6; 作者宋江春沈钧毅《控制与决策》 EI CSCD 北大核心 2007年第3期284-288,共5页; 提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问... 展开更多; 关键词 WEB使用挖掘用户浏览模式用户访问矩阵用户事务聚类站点url聚类; 下载PDF 职称材料

A Fast Multi-Pattern Matching Algorithm for Mining Big Network Data 被引量：3: 7; 作者 Jun Liu Guangkuo Bian +1 位作者 Chao Qin Wenhui Lin 《China Communications》 SCIE CSCD 2019年第5期121-136,共16页; The rapid development of mobile network brings opportunities for researchers to analyze user behaviors based on largescale network traffic data. It is important for Internet Service Providers(ISP) to optimize resource... 展开更多; 关键词 HTTP TRAFFIC multi-patterns MATCHING SPARK url MATCHING USER behavior; 下载PDF 职称材料

面向网络评论的文本信息抽取方法研究被引量：1: 8; 作者段建勇高会娟张梅《北方工业大学学报》 2015年第1期7-12,50,共7页; 为对网络在线评论进行高效率的文本分析与提取,本文提出一种基于HtmlParser的文本抽取解析算法.首先通过语言与格式规则进行标签筛选,实现基于HtmlParser的网页文本数据抽取算法,然后采用Regex模式对抽取文本进行清洗去噪.最后通过实验... 展开更多; 关键词网页提取信息抽取 url采集模式匹配; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	高效的基于段模式的恶意URL检测方法	林海伦李焱王伟平岳银亮林政	《通信学报》 EI CSCD 北大核心	2015	9	下载PDF 职称材料
2	基于双语URL匹配模式可信度的平行网页识别研究	章成志马舒天揭春雨姚旭晨	《中文信息学报》 CSCD 北大核心	2018	3	下载PDF 职称材料
3	一种面向大规模URL过滤的多模式串匹配算法	刘燕兵邵妍王勇刘庆云郭莉	《计算机学报》 EI CSCD 北大核心	2014	13	下载PDF 职称材料
4	URL模式与HTML结构相结合的平行网页获取方法	刘奇刘洋孙茂松	《中文信息学报》 CSCD 北大核心	2013	6	下载PDF 职称材料
5	基于URL模式集的主题爬虫	胡萍瑞李石君	《计算机应用研究》 CSCD 北大核心	2018	18	下载PDF 职称材料
6	一种新的Web用户群体和URL聚类算法的研究	宋江春沈钧毅	《控制与决策》 EI CSCD 北大核心	2007	11	下载PDF 职称材料
7	A Fast Multi-Pattern Matching Algorithm for Mining Big Network Data	Jun Liu Guangkuo Bian Chao Qin Wenhui Lin	《China Communications》 SCIE CSCD	2019	3	下载PDF 职称材料
8	面向网络评论的文本信息抽取方法研究	段建勇高会娟张梅	《北方工业大学学报》	2015	1	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部