期刊文献+
共找到6,851篇文章
< 1 2 250 >
每页显示 20 50 100
基于Python正则表达式的航空气象观测报文检测 被引量:1
1
作者 李灿 《电脑知识与技术》 2017年第9期227-229,共3页
该文提出了一种不同于传统的防止报文错误的思路,使用以python语言与正则表达式模块对报文进行格式错误与逻辑错误检测:首先使用正则表达式对报文进行分割、验证,接着运用脚本语言动态进行逻辑判断,识别报文是否正确。
关键词 航空气象 观测报文 python正则表达式
下载PDF
Python正则表达式高级特性研究 被引量:3
2
作者 刘娜 《电脑编程技巧与维护》 2015年第22期12-13,共2页
介绍了正则表达式的基本概念和语法,并重点讲解了Python中正则表达式的一些高级特性分组,数据抽取,后向引用等。
关键词 python软件 正则表达式
下载PDF
基于Python正则表达式的彩票信息爬取 被引量:3
3
作者 沈漪 华敏敏 《安徽电子信息职业技术学院学报》 2018年第5期19-21,共3页
介绍了网络爬虫的基本步骤,完整介绍了使用Python语言,利用正则表达式爬取彩票网最新奖池数据的整个过程。
关键词 python 正则表达式 爬虫
下载PDF
Python正则表达式研究 被引量:4
4
作者 徐荣飞 《电脑编程技巧与维护》 2015年第9期45-45,49,共2页
研究了正则表达式的基本概念、定义及其元字符,讲解Python中正则表达式的常用函数和使用实例,并做了简单对比,分析了正则分组的概念并利用分组进行实际的正则匹配结果抽取。
关键词 正则表达式 元字符 分组
下载PDF
基于Python正则表达式的管制指令匹配与提取 被引量:1
5
作者 邓学鸣 《数字通信世界》 2019年第5期13-13,29,共2页
本文提出一种利用Python正则表达式对管制指令中的关键信息进行提取的方法,正则表达式灵活多变的优点能够解决管制指令不统一、不规范的问题,提高了信息提取的效率与准确度。将提取后的关键信息实时反馈给管制员,能有效避免"错忘漏... 本文提出一种利用Python正则表达式对管制指令中的关键信息进行提取的方法,正则表达式灵活多变的优点能够解决管制指令不统一、不规范的问题,提高了信息提取的效率与准确度。将提取后的关键信息实时反馈给管制员,能有效避免"错忘漏"的情况发生,对安全管理工作具有重要意义。 展开更多
关键词 管制指令 正则表达式 信息提取
下载PDF
基于变异的正则表达式反例测试串生成算法
6
作者 郑黎晓 余李林 +3 位作者 陈海明 陈祖希 骆翔宇 汪小勇 《软件学报》 EI CSCD 北大核心 2024年第7期3355-3376,共22页
正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些... 正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些字符串,并检查它们是否符合预期.现有的测试数据生成大多只关注正例串,而研究表明,实际开发中存在的错误大部分在于定义的语言比预期语言小,这类错误只能通过反例串才能发现.研究基于变异的正则表达式反例测试串生成.首先通过变异向被测表达式中注入缺陷得到一组变异体,然后在被测表达式所定义语言的补集中选取反例字符串揭示相应变异体所模拟的错误.为了能够模拟复杂缺陷类型,以及避免出现变异体特化而无法获得反例串的问题,引入二阶变异机制.同时采取冗余变异体消除、变异算子选择等优化技术对变异体进行约简,从而控制最终生成的测试集规模.实验结果表明,与已有工具相比,所提算法生成的反例测试串规模适中,并且具有较强的揭示错误能力. 展开更多
关键词 正则表达式 正则语言 字符串生成 变异测试 变异体约简
下载PDF
基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配 被引量:1
7
作者 王冠南 郭丽娟 +2 位作者 彭曙蓉 陈慧霞 黄浩宇 《浙江电力》 2024年第1期20-27,共8页
针对220kV及以上电压等级智能变电站双套录波通道同源匹配问题,提出一种基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配方法。首先,针对录波通道命名不规范的问题,使用正则表达式对通道名称文本进行预处理,统一通道名称的表... 针对220kV及以上电压等级智能变电站双套录波通道同源匹配问题,提出一种基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配方法。首先,针对录波通道命名不规范的问题,使用正则表达式对通道名称文本进行预处理,统一通道名称的表达形式;同时,使用jieba分词算法和去停用词操作,去除通道名称文本中可能存在的冗余信息。然后,使用Jaccard相似系数匹配算法计算录波通道名称文本之间的相似度,依据相似度大小筛选出同源通道。最后,基于电网实际的录波文件数据进行仿真分析。仿真结果表明:所提方法可有效实现智能变电站录波通道同源匹配。 展开更多
关键词 录波通道同源匹配 文本匹配 正则表达式 Jaccard相似系数
下载PDF
基于多叉树和正则表达式的标定系统A2L文件的解析管理方法
8
作者 谢钊 杨亚联 刘昌东 《汽车工程学报》 2024年第1期135-143,共9页
根据汽车标定系统A2L文件的定义规律,设计了正则表达式匹配A2L文件关键信息,利用类结构体和多叉树模型对A2L文件信息进行表示,并对文件中不同的数据模块提出了对应的通用化解析流程。针对测量值可视化和标定值下载问题,依据各种预定义... 根据汽车标定系统A2L文件的定义规律,设计了正则表达式匹配A2L文件关键信息,利用类结构体和多叉树模型对A2L文件信息进行表示,并对文件中不同的数据模块提出了对应的通用化解析流程。针对测量值可视化和标定值下载问题,依据各种预定义类型和转换方法,设计原始量-物理量的转换公式,可为上位机软件提供转换工具。利用C#和窗体应用开发了A2L数据解析管理软件,实现对解析结果的可视化管理和修改。采用了“高内聚低耦合”的软件设计模式和动态链接库(dll),可进一步开发出测量标定软件。通过试验验证了所提出的A2L文件解析管理方法的有效性。 展开更多
关键词 A2L 正则表达式 数据解析 数据管理
下载PDF
ɑFA:一种基于非信任字符比较的高性能正则表达式匹配算法
9
作者 杨嘉佳 关健 +2 位作者 于增明 张雷 姚旺君 《电子技术应用》 2024年第6期57-60,共4页
正则表达式匹配技术在数据治理、解析提取和深度包检测方面有着重大应用价值。然而,由于其在通用平台上的匹配性能较低,无法满足实际环境下数据实时处理的应用需求,限制了其在高性能数据处理领域的应用范围。针对当前正则表达式匹配性... 正则表达式匹配技术在数据治理、解析提取和深度包检测方面有着重大应用价值。然而,由于其在通用平台上的匹配性能较低,无法满足实际环境下数据实时处理的应用需求,限制了其在高性能数据处理领域的应用范围。针对当前正则表达式匹配性能较低的问题,提出一种基于非信任字符比较的高性能正则表达式匹配算法,称之为ɑFA。该算法通过每次判断连续的若干个字符是否属于最常被访问状态的非信任字符集,获取无需通过DFA匹配可直接跳过的字符数,减少字符匹配过程中访问内存DFA状态转移表的次数,从而实现字符匹配的加速处理。实验结果表明,ɑFA算法可获得相比于原始DFA匹配算法约为1.05~7.58倍的性能加速比。 展开更多
关键词 正则表达式匹配 确定型有限自动机 高性能数据处理
下载PDF
面向真实世界的知识挖掘与知识图谱补全研究(三):基于正则表达式对膀胱癌真实世界数据的结构化信息抽取
10
作者 马文昊 石涵予 +7 位作者 黄桥 黄兴 王永博 王诗淳 任相颖 施悦 靳英辉 阎思宇 《医学新知》 CAS 2024年第3期312-321,共10页
随着医疗大数据的发展,真实世界研究近些年来越来越受到重视,发展前景良好,但真实世界研究的实施仍存在一些挑战,引起学者们广泛讨论。真实世界数据的非结构化是目前最亟待解决的问题。本研究以正则表达式为基础,通过基于规则的信息抽... 随着医疗大数据的发展,真实世界研究近些年来越来越受到重视,发展前景良好,但真实世界研究的实施仍存在一些挑战,引起学者们广泛讨论。真实世界数据的非结构化是目前最亟待解决的问题。本研究以正则表达式为基础,通过基于规则的信息抽取方法对武汉大学中南医院近几年膀胱癌患者的入院记录、病理报告、手术记录和影像记录等数据进行结构化信息抽取,并以准确率和召回率为指标评价其抽取效果,旨在为后续研究提供参考。 展开更多
关键词 真实世界数据 信息抽取 正则表达式 自然语言处理 电子病历数据 膀胱癌
下载PDF
基于正则表达式的文件批量改名
11
作者 黄绍龙 《信息与电脑》 2023年第17期57-59,63,共4页
规范化的文件名为有效管理文档提供了很多方便。在实际管理文档时,经常遇到大量不规范的文件名。手工更改文件名不仅会耗费大量时间,还容易出错。通过使用正则表达式从文件名中提取日期、标题、部门等信息,再用这些信息重组文件名,即可... 规范化的文件名为有效管理文档提供了很多方便。在实际管理文档时,经常遇到大量不规范的文件名。手工更改文件名不仅会耗费大量时间,还容易出错。通过使用正则表达式从文件名中提取日期、标题、部门等信息,再用这些信息重组文件名,即可批量将文件名规范化,从而达到快速有效管理文档的目的。 展开更多
关键词 正则表达式 文件名 批量改名
下载PDF
基于正则表达式的高性能PHP路由 被引量:1
12
作者 张文豪 陈平华 《计算机应用与软件》 北大核心 2023年第1期38-45,116,共9页
随着路由数量增加,即使采用组合的正则表达式路由方案,PHP路由性能也会严重下降。针对这个问题,对组合的正则表达式路由组合方式和分块大小进行深入研究,结合PHP底层机制制定了一个高性能PHP路由实现方案。方案通过PHP底层机制减少了路... 随着路由数量增加,即使采用组合的正则表达式路由方案,PHP路由性能也会严重下降。针对这个问题,对组合的正则表达式路由组合方式和分块大小进行深入研究,结合PHP底层机制制定了一个高性能PHP路由实现方案。方案通过PHP底层机制减少了路由加载性能损耗,增加路由匹配结果LRU缓存,保证了匹配性能的稳定性,同时使用C语言将路由方案封装为一个PHP路由库。在相同的路由信息集中,与其他组合的正则表达式PHP路由库进行对比测试实验,实验结果证明该方案路由库不仅性能优越而且可以不受路由数量的影响,能保持路由性能的稳定。 展开更多
关键词 PHP路由 组合正则表达式 PHP内核 高性能
下载PDF
正则表达式在统计普查中提取五级区划地址的应用
13
作者 李渊本 《统计与咨询》 2023年第5期20-22,共3页
我国行政区划由省级行政区、地级行政区、县级行政区、乡级行政区组成。为了精准开展统计普查工作,统计部门在四级行政区划基础上,新增到了村级行政区,本文介绍了按照省、市、县(区)、乡镇(街道)、村委会(居委会)五级区划,在统计日常办... 我国行政区划由省级行政区、地级行政区、县级行政区、乡级行政区组成。为了精准开展统计普查工作,统计部门在四级行政区划基础上,新增到了村级行政区,本文介绍了按照省、市、县(区)、乡镇(街道)、村委会(居委会)五级区划,在统计日常办公的Excel、WPS表格软件中,使用正则表达式规则,运用VBA、JSA语言编写程序代码,高效、便捷地提取普查对象、经营主体的五级行政区划地址,以达到提高统计调查效率、减少错误的目的。 展开更多
关键词 统计 普查 正则表达式 VBA JSA 行政区划地址
下载PDF
一种基于FP-Growth数据挖掘算法和正则表达式进行车驾管系统智能监管的实现方式
14
作者 张硕 《道路交通科学技术》 2023年第4期37-43,共7页
本文基于公安交通管理综合应用平台车驾管业务登记事项内容和基于传统表结构的车驾管数据库后台,通过FP-Growth数据挖掘算法和正则表达式,对前台窗口输入数据和数据库已有数据进行自动模式匹配,自动过滤错误数据或进行数据业务信息预警... 本文基于公安交通管理综合应用平台车驾管业务登记事项内容和基于传统表结构的车驾管数据库后台,通过FP-Growth数据挖掘算法和正则表达式,对前台窗口输入数据和数据库已有数据进行自动模式匹配,自动过滤错误数据或进行数据业务信息预警,实现对车驾管业务进行事中和事后监督,从而提高数据质量,完成业务监管。本文先介绍FP-Growth的概念及运行机制,自动挖掘数据中的规律的方法,再介绍正则表达式对系统前端数据的初步过滤方法,最后给出整套的数据监管流程。本文主要在理论层面讲述监管的运行原理和小规模实验结论,因实验环境设备所限,不涉及大量数据库真实数据的操作。最后对该算法的优化方向进行了讨论。 展开更多
关键词 FP-GROWTH 正则表达式 业务监督 运行原理 小规模实验结论
下载PDF
基于正则表达式的专利信息提取方法研究 被引量:15
15
作者 邱清盈 郑国民 +1 位作者 冯培恩 武建伟 《中国机械工程》 EI CAS CSCD 北大核心 2007年第19期2326-2329,共4页
针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信... 针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信息的批量提取,为后续高效率地对专利文献进行自动分析和知识挖掘提供了数据基础。 展开更多
关键词 专利分析 信息提取 正则表达式 设计知识
下载PDF
基于正则表达式的变电站集中监控信息解析方法 被引量:22
16
作者 鲁华永 袁越 +3 位作者 郭泓佐 袁良 王国栋 刘华伟 《电力系统自动化》 EI CSCD 北大核心 2017年第5期78-83,共6页
随着国家电网公司"大运行"体系建设的深入开展,海量、繁杂且存在不规则现象的集中监控信息的识别,已成为设备监控信息智能告警技术提升面临的主要问题。文中结合集中监控信息既定规则的特点,提出一种基于正则表达式描述的集... 随着国家电网公司"大运行"体系建设的深入开展,海量、繁杂且存在不规则现象的集中监控信息的识别,已成为设备监控信息智能告警技术提升面临的主要问题。文中结合集中监控信息既定规则的特点,提出一种基于正则表达式描述的集中监控信息解析方法。通过正则表达式规则提取信息关键要素进行信息解析,并采用最大分词匹配算法进行信息识别匹配,实现变电站集中监控信息实时解析及自动校验,为设备监控信息智能告警技术的进一步提升奠定了良好基础。实际工程应用验证了所提方法有效性和实用性。 展开更多
关键词 变电站集中监控 告警直传 信息解析 正则表达式 最大匹配算法
下载PDF
正则表达式在电子政务客户端校验中的应用 被引量:16
17
作者 王功明 吴华瑞 +1 位作者 赵春江 杨宝祝 《计算机工程》 CAS CSCD 北大核心 2007年第9期269-271,共3页
SQL注入技术通过输入带有SQL关键字的语句破坏后台数据库查询语句完整性,进而开展客户端攻击,危害性很强,此外,不合规范的输入数据,也加重系统负担,降低系统可靠性。所以电子政务系统安全性、可靠性亟待提高。正则表达式具有很强的模式... SQL注入技术通过输入带有SQL关键字的语句破坏后台数据库查询语句完整性,进而开展客户端攻击,危害性很强,此外,不合规范的输入数据,也加重系统负担,降低系统可靠性。所以电子政务系统安全性、可靠性亟待提高。正则表达式具有很强的模式匹配功能,可以用来校验各种类型数据。加入正则表达式校验层,扩充传统三层B/S架构至四层后,通过校验客户端输入数据,能够遏制某些客户端攻击,在一定程度上提高电子政务系统安全性、可靠性。在电子政务系统建设中应用该项技术,取得了优良的效果。 展开更多
关键词 电子政务 正则表达式 数据校验 数据锁 SQL注入
下载PDF
正则表达式在Web信息抽取中的应用 被引量:38
18
作者 胡军伟 秦奕青 张伟 《北京信息科技大学学报(自然科学版)》 2011年第6期86-89,共4页
针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web... 针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web信息抽取的过程中。 展开更多
关键词 WEB信息抽取 正则表达式 匹配 替换 提取
下载PDF
一种面向网络安全检测的高性能正则表达式匹配算法 被引量:27
19
作者 张树壮 罗浩 +1 位作者 方滨兴 云晓春 《计算机学报》 EI CSCD 北大核心 2010年第10期1976-1986,共11页
目前进行正则表达式匹配的典型工具DFA和NFA都存在匹配效率和内存需求之间不可调和的矛盾,无法胜任网络安全检测中大规模正则表达式的匹配.为了解决这个问题,文中从网络安全检测的行为特点出发,结合DFA、NFA模型各自的特性,提出了一种... 目前进行正则表达式匹配的典型工具DFA和NFA都存在匹配效率和内存需求之间不可调和的矛盾,无法胜任网络安全检测中大规模正则表达式的匹配.为了解决这个问题,文中从网络安全检测的行为特点出发,结合DFA、NFA模型各自的特性,提出了一种基于猜测-验证的匹配方法.首先使用DFA对正则表达式中的部分子特征进行搜索,完成特征存在性的猜测;当猜测到有可能匹配某个特征后,再使用NFA进行验证.文中方法既充分利用了DFA的高效性,减少了对相对较慢的验证过程的调用,又借助NFA避免了内存消耗过于巨大.结果表明,该方法可以在大大减少内存需求的情况下,实现正则表达式的高效匹配. 展开更多
关键词 特征匹配 正则表达式 有穷自动机 子特征 猜测-验证
下载PDF
正则表达式在中医文献研究中的应用初探 被引量:10
20
作者 王志飞 李晓君 +1 位作者 郭霞珍 张德政 《中国中医药信息杂志》 CAS CSCD 2010年第3期98-99,共2页
中医文献浩如烟海,《中国中医古籍总目》收录1949年以前的中医古籍,总数达到13455种;解放后,随着中医学的发展,中医文献资料更是日渐增多。庞大规模的资料,为中医文献研究提供了丰富的内容,但同时也决定了其研究任务的繁重性。面对这种... 中医文献浩如烟海,《中国中医古籍总目》收录1949年以前的中医古籍,总数达到13455种;解放后,随着中医学的发展,中医文献资料更是日渐增多。庞大规模的资料,为中医文献研究提供了丰富的内容,但同时也决定了其研究任务的繁重性。面对这种情况,只有寻找一种能够从海量文献中抽取有用信息的辅助工具,将文献研究化繁为简, 展开更多
关键词 正则表达式 中医文献 自然语言理解
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部