期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于比特可分性的PRIDE和RoadRunneR积分区分器搜索 被引量:2
1
作者 李艳俊 赵京鸣 《计算机应用研究》 CSCD 北大核心 2020年第1期203-207,224,共6页
PRIDE和RoadRunneR是近几年提出的两种轻量级分组密码算法,在2016亚密会上,向泽军等人提出利用基于比特可分性的MILP(混合整数线性规划)模型搜索积分区分器。利用该思想,针对两种不同类型的轻量级分组密码算法,为了评估该算法积分性质,... PRIDE和RoadRunneR是近几年提出的两种轻量级分组密码算法,在2016亚密会上,向泽军等人提出利用基于比特可分性的MILP(混合整数线性规划)模型搜索积分区分器。利用该思想,针对两种不同类型的轻量级分组密码算法,为了评估该算法积分性质,验证新方法的实用性,根据其不同密码算法结构分别建立MILP模型,利用Gurobi优化器求解此模型,搜索可用的积分区分器。结果分别得到9轮和5轮的积分区分器,是PRIDE和RoadRunneR目前已知最长的积分区分器,利用该区分器可进行更多轮的积分攻击。 展开更多
关键词 PRIDE roadrunner 比特可分性 MILP模型 积分区分器
下载PDF
网页信息抽取RoadRunner技术浅析 被引量:1
2
作者 张国平 李钊 《科技创业月刊》 2010年第11期172-173,共2页
RoadRunner是网页数据抽取的一项重要技术,文章对RoadRunner的匹配算法ACME的基本原理进行了详细分析,具有很好的借鉴作用。
关键词 roadrunner ACME 不匹配
下载PDF
基于RoadRunner算法的RESTful Web服务信息收集研究
3
作者 季红梅 张轶昀 《宜春学院学报》 2013年第3期37-41,共5页
在服务组合不断发展的大背景下,新生代RESTful Web服务逐渐展示出其优越的性能从而迅速占领大量服务组合份额。与此同时,由于其自身设计特点,RESTful Web服务没有类似UDDI的注册检索中心,也没有合适的描述语言。各大网站通常以开放平台... 在服务组合不断发展的大背景下,新生代RESTful Web服务逐渐展示出其优越的性能从而迅速占领大量服务组合份额。与此同时,由于其自身设计特点,RESTful Web服务没有类似UDDI的注册检索中心,也没有合适的描述语言。各大网站通常以开放平台的方式各自为营,使API信息难于机器检索,为更大范围的服务组合带来了困难。为了解决这个问题,这里探索了一种使用聚焦爬虫收集RESTful Web服务API信息以提供统一的集中检索服务的思路,使用RoadRunner算法设计并实现了一个聚焦爬虫,从概念上验证了这个思路的可行性。 展开更多
关键词 服务组合 RESTFUL WEB服务 roadrunner 爬虫
下载PDF
Web信息抽取技术综述 被引量:22
4
作者 陈钊 张冬梅 《计算机应用研究》 CSCD 北大核心 2010年第12期4401-4405,共5页
快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统计理论的、基于视觉特征的、基于DOM树结构的和基于模板的几类。由于网页文本本身具有树结构并且具有一... 快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统计理论的、基于视觉特征的、基于DOM树结构的和基于模板的几类。由于网页文本本身具有树结构并且具有一定的相似性,基于DOM树结构和基于模板的抽取技术发展很快而且已经得到了广泛的应用。分别论述了上述几类技术在近几年来的研究进展,从自动化程度、适用范围和复杂性三个角度分析对比了几类技术的优缺点。 展开更多
关键词 WEB信息抽取 网页噪声 URL聚类 DSE算法 roadrunner系统 MDR 视觉特征 模板
下载PDF
基于相似页面的Web信息抽取系统的实现 被引量:3
5
作者 贡正仙 朱巧明 李培峰 《计算机应用》 CSCD 北大核心 2006年第8期1983-1986,共4页
分析了RoadRunner的核心算法,针对RoadRunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的W eb信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则... 分析了RoadRunner的核心算法,针对RoadRunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的W eb信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则的算法。 展开更多
关键词 WEB页面 roadrunner 相似页面 信息抽取
下载PDF
基于改进DSE算法的web信息抽取
6
作者 张冬梅 陈钊 陈剑 《数字技术与应用》 2012年第3期171-173,共3页
随着我国信息化进程的推进,人们开始认识到互联网作为信息来源的重要性,如何更有效地从网络的海量信息中抽取所需要的内容并进行合理的组织和利用已经成为亟待解决的问题。本文通过对DSE算法和RoadRunner系统中的算法的探讨和改进,提出... 随着我国信息化进程的推进,人们开始认识到互联网作为信息来源的重要性,如何更有效地从网络的海量信息中抽取所需要的内容并进行合理的组织和利用已经成为亟待解决的问题。本文通过对DSE算法和RoadRunner系统中的算法的探讨和改进,提出了一种新的自动生成模板的信息抽取方法,并且在确定同模板网页url的阈值时引入了生物信息学中的FDR方法,为阈值的确定提出了理论根据。实验结果表明,经过改进的抽取方法对抽取结果的准确率有着明显的改善作用。 展开更多
关键词 信息抽取 模板 DSE roadrunner 文档对象模型
下载PDF
基于智能的网页信息提取系统的研究与设计 被引量:7
7
作者 刘亚东 彭舰 张达平 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期957-962,共6页
随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.本文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人... 随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.本文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人工干预,实现了信息提取的智能化.实验表明,该系统能够更准确、更有效地分类相似网页和提取网页信息. 展开更多
关键词 智能 WEB信息提取 roadrunner HTML结构树
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部