正则表达式初学

JerryXia 发表于 , 阅读 (999)
对于开发人员来说,正则表达式是一个非常有用的功能。它提供了查找,匹配,替换句子,单词,或者其他格式的字符串。在这篇文章里,我已经编写了15个贼有用的正则表达式,WEB开发人员都应该将它收藏到自己的工具包。开始使用正则表达式对初学者来说,正则看起来很难学习和使用。事实上他们并非你想想的那么难,在我们深入掌握正则之前,先迅速看看这些入门基础:正则表达式语法正则表达式 将会匹配foo ——————字符串“foo”^foo ——————以“foo”开头的字符串foo$ ——————以... 阅读全文

正则表达式笔记

JerryXia 发表于 , 阅读 (1,868)
正则表达式是用来进行文本处理的技术,是语言无关的,在几乎所有语言中都有实现。一个正则表达式就是由普通字符以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。就像通配符“*.jpg”、“%ab%”,它是对字符串进行匹配的特殊字符串。元字符.:匹配任何单个字符。例如正则表达式“b.g”能匹配如下字符串:“big”、“bug”、“b g”,但是不匹配“buug”,“b..g”可以匹配“buu... 阅读全文

正则表达式之去除font和span标签

JerryXia 发表于 , 阅读 (2,821)
在程序爬行网页时有个很头疼的问题,就是网页中有很多无用的修饰性的标签。一个一个删的话工程量太大,幸好平时接触过一些正则表达式,先看看以下内容:<p><font style="font-size:16px;font-family:宋体"><span lang="zh-cn">如何使用</span></font>sed<font color="#0df2a3">&... 阅读全文