期刊文献+
共找到121,230篇文章
< 1 2 250 >
每页显示 20 50 100
Fuzzy正则表达式与Fuzzy有限态自动机的关系 被引量:8
1
作者 柏明强 《纯粹数学与应用数学》 CSCD 2000年第4期1-6,共6页
首先给出了 Fuzzy正则表达式的定义 ,接着通过研究 Fuzzy正则表达式与Fuzzy有限态自动机的关系 ,得到了两个重要性质 ,即 :每一个 Fuzzy正则表达式 ,都有一个非确定性的 Fuzzy有限态自动机接受其代表的语言 ;每一个被确定性的Fuzzy有限... 首先给出了 Fuzzy正则表达式的定义 ,接着通过研究 Fuzzy正则表达式与Fuzzy有限态自动机的关系 ,得到了两个重要性质 ,即 :每一个 Fuzzy正则表达式 ,都有一个非确定性的 Fuzzy有限态自动机接受其代表的语言 ;每一个被确定性的Fuzzy有限态自动机接受的语言 ,都能被一个 Fuzzy正则表达式表示 . 展开更多
关键词 fuzzy正则表达式 Fuzy有限态自动机 fuzzy有限态自动机
全文增补中
基于变异的正则表达式反例测试串生成算法
2
作者 郑黎晓 余李林 +3 位作者 陈海明 陈祖希 骆翔宇 汪小勇 《软件学报》 EI CSCD 北大核心 2024年第7期3355-3376,共22页
正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些... 正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些字符串,并检查它们是否符合预期.现有的测试数据生成大多只关注正例串,而研究表明,实际开发中存在的错误大部分在于定义的语言比预期语言小,这类错误只能通过反例串才能发现.研究基于变异的正则表达式反例测试串生成.首先通过变异向被测表达式中注入缺陷得到一组变异体,然后在被测表达式所定义语言的补集中选取反例字符串揭示相应变异体所模拟的错误.为了能够模拟复杂缺陷类型,以及避免出现变异体特化而无法获得反例串的问题,引入二阶变异机制.同时采取冗余变异体消除、变异算子选择等优化技术对变异体进行约简,从而控制最终生成的测试集规模.实验结果表明,与已有工具相比,所提算法生成的反例测试串规模适中,并且具有较强的揭示错误能力. 展开更多
关键词 正则表达式 正则语言 字符串生成 变异测试 变异体约简
下载PDF
基于正则表达式和SQL语法树的SQL注入过滤算法研究
3
作者 赵广复 杜召彬 《信息技术与信息化》 2024年第9期201-204,共4页
随着信息技术的迅猛发展,Web技术已经渗透到各行各业中,其安全问题日益严峻,导致Web应用成为黑客攻击的重点对象。针对这一问题,提出基于正则表达式和SQL语法树的SQL注入过滤算法。首先使用正则表达式对Web页面输入信息进行初次过滤,然... 随着信息技术的迅猛发展,Web技术已经渗透到各行各业中,其安全问题日益严峻,导致Web应用成为黑客攻击的重点对象。针对这一问题,提出基于正则表达式和SQL语法树的SQL注入过滤算法。首先使用正则表达式对Web页面输入信息进行初次过滤,然后将输入内容代入SQL语法树中进行分析,实现再次过滤,达到提高SQL注入攻击的过滤效果。仿真实验显示,所提出的算法能够有效提高SQL注入攻击的防范效果。 展开更多
关键词 SQL注入 SQL语法树 WEB安全 正则表达式
下载PDF
基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配 被引量:2
4
作者 王冠南 郭丽娟 +2 位作者 彭曙蓉 陈慧霞 黄浩宇 《浙江电力》 2024年第1期20-27,共8页
针对220kV及以上电压等级智能变电站双套录波通道同源匹配问题,提出一种基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配方法。首先,针对录波通道命名不规范的问题,使用正则表达式对通道名称文本进行预处理,统一通道名称的表... 针对220kV及以上电压等级智能变电站双套录波通道同源匹配问题,提出一种基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配方法。首先,针对录波通道命名不规范的问题,使用正则表达式对通道名称文本进行预处理,统一通道名称的表达形式;同时,使用jieba分词算法和去停用词操作,去除通道名称文本中可能存在的冗余信息。然后,使用Jaccard相似系数匹配算法计算录波通道名称文本之间的相似度,依据相似度大小筛选出同源通道。最后,基于电网实际的录波文件数据进行仿真分析。仿真结果表明:所提方法可有效实现智能变电站录波通道同源匹配。 展开更多
关键词 录波通道同源匹配 文本匹配 正则表达式 Jaccard相似系数
下载PDF
基于多叉树和正则表达式的标定系统A2L文件的解析管理方法
5
作者 谢钊 杨亚联 刘昌东 《汽车工程学报》 2024年第1期135-143,共9页
根据汽车标定系统A2L文件的定义规律,设计了正则表达式匹配A2L文件关键信息,利用类结构体和多叉树模型对A2L文件信息进行表示,并对文件中不同的数据模块提出了对应的通用化解析流程。针对测量值可视化和标定值下载问题,依据各种预定义... 根据汽车标定系统A2L文件的定义规律,设计了正则表达式匹配A2L文件关键信息,利用类结构体和多叉树模型对A2L文件信息进行表示,并对文件中不同的数据模块提出了对应的通用化解析流程。针对测量值可视化和标定值下载问题,依据各种预定义类型和转换方法,设计原始量-物理量的转换公式,可为上位机软件提供转换工具。利用C#和窗体应用开发了A2L数据解析管理软件,实现对解析结果的可视化管理和修改。采用了“高内聚低耦合”的软件设计模式和动态链接库(dll),可进一步开发出测量标定软件。通过试验验证了所提出的A2L文件解析管理方法的有效性。 展开更多
关键词 A2L 正则表达式 数据解析 数据管理
下载PDF
ɑFA:一种基于非信任字符比较的高性能正则表达式匹配算法
6
作者 杨嘉佳 关健 +2 位作者 于增明 张雷 姚旺君 《电子技术应用》 2024年第6期57-60,共4页
正则表达式匹配技术在数据治理、解析提取和深度包检测方面有着重大应用价值。然而,由于其在通用平台上的匹配性能较低,无法满足实际环境下数据实时处理的应用需求,限制了其在高性能数据处理领域的应用范围。针对当前正则表达式匹配性... 正则表达式匹配技术在数据治理、解析提取和深度包检测方面有着重大应用价值。然而,由于其在通用平台上的匹配性能较低,无法满足实际环境下数据实时处理的应用需求,限制了其在高性能数据处理领域的应用范围。针对当前正则表达式匹配性能较低的问题,提出一种基于非信任字符比较的高性能正则表达式匹配算法,称之为ɑFA。该算法通过每次判断连续的若干个字符是否属于最常被访问状态的非信任字符集,获取无需通过DFA匹配可直接跳过的字符数,减少字符匹配过程中访问内存DFA状态转移表的次数,从而实现字符匹配的加速处理。实验结果表明,ɑFA算法可获得相比于原始DFA匹配算法约为1.05~7.58倍的性能加速比。 展开更多
关键词 正则表达式匹配 确定型有限自动机 高性能数据处理
下载PDF
面向真实世界的知识挖掘与知识图谱补全研究(三):基于正则表达式对膀胱癌真实世界数据的结构化信息抽取
7
作者 马文昊 石涵予 +7 位作者 黄桥 黄兴 王永博 王诗淳 任相颖 施悦 靳英辉 阎思宇 《医学新知》 CAS 2024年第3期312-321,共10页
随着医疗大数据的发展,真实世界研究近些年来越来越受到重视,发展前景良好,但真实世界研究的实施仍存在一些挑战,引起学者们广泛讨论。真实世界数据的非结构化是目前最亟待解决的问题。本研究以正则表达式为基础,通过基于规则的信息抽... 随着医疗大数据的发展,真实世界研究近些年来越来越受到重视,发展前景良好,但真实世界研究的实施仍存在一些挑战,引起学者们广泛讨论。真实世界数据的非结构化是目前最亟待解决的问题。本研究以正则表达式为基础,通过基于规则的信息抽取方法对武汉大学中南医院近几年膀胱癌患者的入院记录、病理报告、手术记录和影像记录等数据进行结构化信息抽取,并以准确率和召回率为指标评价其抽取效果,旨在为后续研究提供参考。 展开更多
关键词 真实世界数据 信息抽取 正则表达式 自然语言处理 电子病历数据 膀胱癌
下载PDF
基于正则表达式的文件批量改名
8
作者 黄绍龙 《信息与电脑》 2023年第17期57-59,63,共4页
规范化的文件名为有效管理文档提供了很多方便。在实际管理文档时,经常遇到大量不规范的文件名。手工更改文件名不仅会耗费大量时间,还容易出错。通过使用正则表达式从文件名中提取日期、标题、部门等信息,再用这些信息重组文件名,即可... 规范化的文件名为有效管理文档提供了很多方便。在实际管理文档时,经常遇到大量不规范的文件名。手工更改文件名不仅会耗费大量时间,还容易出错。通过使用正则表达式从文件名中提取日期、标题、部门等信息,再用这些信息重组文件名,即可批量将文件名规范化,从而达到快速有效管理文档的目的。 展开更多
关键词 正则表达式 文件名 批量改名
下载PDF
基于正则表达式的高性能PHP路由 被引量:1
9
作者 张文豪 陈平华 《计算机应用与软件》 北大核心 2023年第1期38-45,116,共9页
随着路由数量增加,即使采用组合的正则表达式路由方案,PHP路由性能也会严重下降。针对这个问题,对组合的正则表达式路由组合方式和分块大小进行深入研究,结合PHP底层机制制定了一个高性能PHP路由实现方案。方案通过PHP底层机制减少了路... 随着路由数量增加,即使采用组合的正则表达式路由方案,PHP路由性能也会严重下降。针对这个问题,对组合的正则表达式路由组合方式和分块大小进行深入研究,结合PHP底层机制制定了一个高性能PHP路由实现方案。方案通过PHP底层机制减少了路由加载性能损耗,增加路由匹配结果LRU缓存,保证了匹配性能的稳定性,同时使用C语言将路由方案封装为一个PHP路由库。在相同的路由信息集中,与其他组合的正则表达式PHP路由库进行对比测试实验,实验结果证明该方案路由库不仅性能优越而且可以不受路由数量的影响,能保持路由性能的稳定。 展开更多
关键词 PHP路由 组合正则表达式 PHP内核 高性能
下载PDF
正则表达式在统计普查中提取五级区划地址的应用
10
作者 李渊本 《统计与咨询》 2023年第5期20-22,共3页
我国行政区划由省级行政区、地级行政区、县级行政区、乡级行政区组成。为了精准开展统计普查工作,统计部门在四级行政区划基础上,新增到了村级行政区,本文介绍了按照省、市、县(区)、乡镇(街道)、村委会(居委会)五级区划,在统计日常办... 我国行政区划由省级行政区、地级行政区、县级行政区、乡级行政区组成。为了精准开展统计普查工作,统计部门在四级行政区划基础上,新增到了村级行政区,本文介绍了按照省、市、县(区)、乡镇(街道)、村委会(居委会)五级区划,在统计日常办公的Excel、WPS表格软件中,使用正则表达式规则,运用VBA、JSA语言编写程序代码,高效、便捷地提取普查对象、经营主体的五级行政区划地址,以达到提高统计调查效率、减少错误的目的。 展开更多
关键词 统计 普查 正则表达式 VBA JSA 行政区划地址
下载PDF
一种基于FP-Growth数据挖掘算法和正则表达式进行车驾管系统智能监管的实现方式
11
作者 张硕 《道路交通科学技术》 2023年第4期37-43,共7页
本文基于公安交通管理综合应用平台车驾管业务登记事项内容和基于传统表结构的车驾管数据库后台,通过FP-Growth数据挖掘算法和正则表达式,对前台窗口输入数据和数据库已有数据进行自动模式匹配,自动过滤错误数据或进行数据业务信息预警... 本文基于公安交通管理综合应用平台车驾管业务登记事项内容和基于传统表结构的车驾管数据库后台,通过FP-Growth数据挖掘算法和正则表达式,对前台窗口输入数据和数据库已有数据进行自动模式匹配,自动过滤错误数据或进行数据业务信息预警,实现对车驾管业务进行事中和事后监督,从而提高数据质量,完成业务监管。本文先介绍FP-Growth的概念及运行机制,自动挖掘数据中的规律的方法,再介绍正则表达式对系统前端数据的初步过滤方法,最后给出整套的数据监管流程。本文主要在理论层面讲述监管的运行原理和小规模实验结论,因实验环境设备所限,不涉及大量数据库真实数据的操作。最后对该算法的优化方向进行了讨论。 展开更多
关键词 FP-GROWTH 正则表达式 业务监督 运行原理 小规模实验结论
下载PDF
基于正则表达式的专利信息提取方法研究 被引量:15
12
作者 邱清盈 郑国民 +1 位作者 冯培恩 武建伟 《中国机械工程》 EI CAS CSCD 北大核心 2007年第19期2326-2329,共4页
针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信... 针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信息的批量提取,为后续高效率地对专利文献进行自动分析和知识挖掘提供了数据基础。 展开更多
关键词 专利分析 信息提取 正则表达式 设计知识
下载PDF
基于正则表达式的变电站集中监控信息解析方法 被引量:22
13
作者 鲁华永 袁越 +3 位作者 郭泓佐 袁良 王国栋 刘华伟 《电力系统自动化》 EI CSCD 北大核心 2017年第5期78-83,共6页
随着国家电网公司"大运行"体系建设的深入开展,海量、繁杂且存在不规则现象的集中监控信息的识别,已成为设备监控信息智能告警技术提升面临的主要问题。文中结合集中监控信息既定规则的特点,提出一种基于正则表达式描述的集... 随着国家电网公司"大运行"体系建设的深入开展,海量、繁杂且存在不规则现象的集中监控信息的识别,已成为设备监控信息智能告警技术提升面临的主要问题。文中结合集中监控信息既定规则的特点,提出一种基于正则表达式描述的集中监控信息解析方法。通过正则表达式规则提取信息关键要素进行信息解析,并采用最大分词匹配算法进行信息识别匹配,实现变电站集中监控信息实时解析及自动校验,为设备监控信息智能告警技术的进一步提升奠定了良好基础。实际工程应用验证了所提方法有效性和实用性。 展开更多
关键词 变电站集中监控 告警直传 信息解析 正则表达式 最大匹配算法
下载PDF
正则表达式在电子政务客户端校验中的应用 被引量:16
14
作者 王功明 吴华瑞 +1 位作者 赵春江 杨宝祝 《计算机工程》 CAS CSCD 北大核心 2007年第9期269-271,共3页
SQL注入技术通过输入带有SQL关键字的语句破坏后台数据库查询语句完整性,进而开展客户端攻击,危害性很强,此外,不合规范的输入数据,也加重系统负担,降低系统可靠性。所以电子政务系统安全性、可靠性亟待提高。正则表达式具有很强的模式... SQL注入技术通过输入带有SQL关键字的语句破坏后台数据库查询语句完整性,进而开展客户端攻击,危害性很强,此外,不合规范的输入数据,也加重系统负担,降低系统可靠性。所以电子政务系统安全性、可靠性亟待提高。正则表达式具有很强的模式匹配功能,可以用来校验各种类型数据。加入正则表达式校验层,扩充传统三层B/S架构至四层后,通过校验客户端输入数据,能够遏制某些客户端攻击,在一定程度上提高电子政务系统安全性、可靠性。在电子政务系统建设中应用该项技术,取得了优良的效果。 展开更多
关键词 电子政务 正则表达式 数据校验 数据锁 SQL注入
下载PDF
正则表达式在Web信息抽取中的应用 被引量:39
15
作者 胡军伟 秦奕青 张伟 《北京信息科技大学学报(自然科学版)》 2011年第6期86-89,共4页
针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web... 针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web信息抽取的过程中。 展开更多
关键词 WEB信息抽取 正则表达式 匹配 替换 提取
下载PDF
一种面向网络安全检测的高性能正则表达式匹配算法 被引量:27
16
作者 张树壮 罗浩 +1 位作者 方滨兴 云晓春 《计算机学报》 EI CSCD 北大核心 2010年第10期1976-1986,共11页
目前进行正则表达式匹配的典型工具DFA和NFA都存在匹配效率和内存需求之间不可调和的矛盾,无法胜任网络安全检测中大规模正则表达式的匹配.为了解决这个问题,文中从网络安全检测的行为特点出发,结合DFA、NFA模型各自的特性,提出了一种... 目前进行正则表达式匹配的典型工具DFA和NFA都存在匹配效率和内存需求之间不可调和的矛盾,无法胜任网络安全检测中大规模正则表达式的匹配.为了解决这个问题,文中从网络安全检测的行为特点出发,结合DFA、NFA模型各自的特性,提出了一种基于猜测-验证的匹配方法.首先使用DFA对正则表达式中的部分子特征进行搜索,完成特征存在性的猜测;当猜测到有可能匹配某个特征后,再使用NFA进行验证.文中方法既充分利用了DFA的高效性,减少了对相对较慢的验证过程的调用,又借助NFA避免了内存消耗过于巨大.结果表明,该方法可以在大大减少内存需求的情况下,实现正则表达式的高效匹配. 展开更多
关键词 特征匹配 正则表达式 有穷自动机 子特征 猜测-验证
下载PDF
正则表达式在中医文献研究中的应用初探 被引量:10
17
作者 王志飞 李晓君 +1 位作者 郭霞珍 张德政 《中国中医药信息杂志》 CAS CSCD 2010年第3期98-99,共2页
中医文献浩如烟海,《中国中医古籍总目》收录1949年以前的中医古籍,总数达到13455种;解放后,随着中医学的发展,中医文献资料更是日渐增多。庞大规模的资料,为中医文献研究提供了丰富的内容,但同时也决定了其研究任务的繁重性。面对这种... 中医文献浩如烟海,《中国中医古籍总目》收录1949年以前的中医古籍,总数达到13455种;解放后,随着中医学的发展,中医文献资料更是日渐增多。庞大规模的资料,为中医文献研究提供了丰富的内容,但同时也决定了其研究任务的繁重性。面对这种情况,只有寻找一种能够从海量文献中抽取有用信息的辅助工具,将文献研究化繁为简, 展开更多
关键词 正则表达式 中医文献 自然语言理解
下载PDF
面向网络安全的正则表达式匹配技术 被引量:29
18
作者 张树壮 罗浩 方滨兴 《软件学报》 EI CSCD 北大核心 2011年第8期1838-1854,共17页
分析了基于有穷状态自动机的正则表达式匹配方法的时间复杂度、空间复杂度以及二者之间的制约关系,深入讨论了在网络安全应用中遇到的特有问题与挑战.围绕这两个问题,对当前出现的多种优化技术和策略进行了全面的综述和评价,最后对未来... 分析了基于有穷状态自动机的正则表达式匹配方法的时间复杂度、空间复杂度以及二者之间的制约关系,深入讨论了在网络安全应用中遇到的特有问题与挑战.围绕这两个问题,对当前出现的多种优化技术和策略进行了全面的综述和评价,最后对未来的研究方向进行了总结和展望. 展开更多
关键词 特征匹配 深度包检测 正则表达式 有穷自动机 内存缩减
下载PDF
基于正则表达式的应用层协议识别加速 被引量:9
19
作者 范慧萍 宣蕾 +1 位作者 陈曙晖 黄高平 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期438-443,共6页
在当今网络中,传统的采用端口进行协议识别已越来越无法满足需求.采用了正则表达式进行协议识别,并对其匹配正确性和速度进行了优化.通过将NFA匹配引擎转换为DFA匹配引擎,不仅减少了其状态数,还提高了匹配的速度;在匹配方式上提出了3种... 在当今网络中,传统的采用端口进行协议识别已越来越无法满足需求.采用了正则表达式进行协议识别,并对其匹配正确性和速度进行了优化.通过将NFA匹配引擎转换为DFA匹配引擎,不仅减少了其状态数,还提高了匹配的速度;在匹配方式上提出了3种匹配方式,并加以测试比较,并与One-Pass扫描算法相结合.通过对DARPA数据集进行测试,验证加速后的匹配正确性比L7-filter高,匹配速度则可达到其6.5倍. 展开更多
关键词 正则表达式 协议识别 有限状态机 One-Pass扫描算法
下载PDF
应用正则表达式在ASP.NET中实现优化的输入验证方法 被引量:9
20
作者 刘小波 谢芊 李留英 《现代图书情报技术》 CSSCI 北大核心 2005年第10期80-83,共4页
输入验证是W eb应用中的常用环节,传统的通过客户端Script进行验证的方法也取得了一定的效果。本文根据.NET平台下的新特点,向大家介绍了利用正则表达式结合ASP.NET服务器端控件进行输入验证的简单方法。
关键词 正则表达式 ASP.NET 输入验证
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部