摘要
文中利用正则表达式能够完成对字符串的匹配,替换的功能,以抽取HTML文档中的信息为例,介绍了正则表达式的理论和在Web中的不同使用方法。以达到从大量数据中挖掘出某些特定信息的目的。其原因是正则表达式是代表具有特殊意义字符的字符串,它能实现将某个字符模式与所预先定义的字符串模式进行匹配,从而抽取出所需的字符串。所以正则表达式使字符串的模式匹配变得更加容易。对于处理字符串的应用程序而言,它起着很重要的作用,应用十分广泛,是一个不可缺少的工具。
Use regular expressions to complete the string match, replace function, taking extract information in a HTML document for ex- ample, introduced the theory of regular expressions and different method applied in Web, reaching the purpose to mine specific informa- tion from massive data. Because the regular expression represents the character string has special significance,it can deliver a character- mode and match the search string, and find the information you need. So the regular expressions make pattern matching of string easy. It plays an important role for application program to deal with string, is an indispensable tool.
出处
《计算机技术与发展》
2013年第2期82-84,88,共4页
Computer Technology and Development
基金
上海市教育科技创新项目(12YZ074)
关键词
正则表达式
模式匹配
NET
regular expression
pattern matching
. NET