现在的位置: 首页 > 软件开发 > 正文

JavaScript常用正则表达式备忘

2010年10月29日 软件开发 ⁄ 共 22560字 暂无评论 ⁄ 被围观 0+

JavaScript常用正则表达式备忘

匹配结尾的数字

30CAC0040 取出40
3SFASDF92 取出92

正则如下:

/\d+$/g

统一空格个数

字符串内字符键有空格,但是空格的数量可能不一致,通过正则将空格的个数统一变为一个。

例如:蓝 色  理    想 , 变成:蓝 色 理 想

正则如下:

<script type="text/javascript">
 var str="蓝 色 理 想"
 var reg=/\s+/g
 str = str.replace(reg," ")
 document.write(str)
</script>

判断字符串是不是由数字组成

正则如下:

<script type="text/javascript">
 function isDigit(str){
  var reg = /^\d*$/;
  return reg.test(str);
 }
 var str = "7654321";
 document.write(isDigit(str));
 var str = "test";
 document.write(isDigit(str));
</script>

电话号码正则

/^\d{3,4}-\d{7,8}(-\d{3,4})?$/

区号必填为3-4位的数字,区号之后用“-”与电话号码连接

^\d{3,4}-

电话号码为7-8位的数字

\d{7,8}

分机号码为3-4位的数字,以“-”与电话号码相连接

(-\d{3,4})?

手机号码正则表达式

正则验证手机号,忽略前面的0,支持130-139,140-149,150-159,180-189。忽略前面0之后判断它是11位的。

正则:

/^0*(13|14|15|18)\d{9}$/

^0*匹配掉开头任意数量的0。

由于手机号码是13/14/15/18后跟任意数字9位,所以可以用(13|14|15|18)\d{9}匹配。

测试代码如下:

function testReg(reg,str){
  return reg.test(str);
}
var reg = /^0*(13|15)\d{9}$/;
var str = '13889294444';
var str2 = '12889293333';
var str3 = '23445567';
document.write(testReg(reg,str)+'<br />');
document.write(testReg(reg,str2)+'<br />');
document.write(testReg(reg,str3)+'<br />');

使用正则表达式实现删除字符串中的空格:

代码以及测试代码如下:

<script type="text/javascript">
 //删除字符串两侧的空白字符。
 function trim(str){
  return str.replace(/^\s+|\s+$/g,'');
 }
 //删除字符串左侧的空白字符。
 function ltrim(str){
  return str.replace(/^\s+/g,'');
 }
 //删除字符串右侧的空白字符。
 function rtrim(str){
  return str.replace(/\s+$/g,'');
 }
 //以下为测试代码
 var trimTest = " 123456789 ";
 //前后各有一个空格。
 document.write('length:'+trimTest.length+'<br />');
 //使用前
 document.write('ltrim length:'+ltrim(trimTest).length+'<br />');
 //使用ltrim后
 document.write('rtrim length:'+rtrim(trimTest).length+'<br />');
 //使用rtrim后
 document.write('trim length:'+trim(trimTest).length+'<br />');
 //使用trim后
</script>

测试的结果如下:

 length:11
 ltrim length:10
 rtrim length:10
 trim length:9

限制文本框只能输入数字和小数点等等

只能输入数字和小数点

var reg = /^\d*\.?\d{0,2}$/

开头有若干个数字,中间有0个或者一个小数点,结尾有0到2个数字。

只能输入小写的英文字母和小数点,和冒号,正反斜杠(:./\)

var reg = /[a-z\.\/\\:]+/;

a-z包括了小写的英文字母,\.是小数点,\/和\\分别是左右反斜线,最后是冒号。整个组成一个字符集和代码任一均可,最后在加上+,1或者多个。

替换小数点前内容为指定内容

例如:infomarket.php?id=197 替换为 test.php?id=197

应该可以把第一个点“.”之前的所有单词字符替换为test就可以了。正则如下:

<script type="text/javascript">
 var str = "infomarket.php?id=197";
 var reg = /^\w*/ig;
 //匹配字符串开头的任意个单词字符
 str = str.replace(reg,'test');
 document.write(str);
</script>

只匹配中文的正则表达式

正则如下:

/[\u4E00-\u9FA5\uf900-\ufa2d]/

写了一个简单的测试,会把所有的中文替换成“哦”。

<script type="text/javascript">
 var str = "有中文?and English.";
 var reg = /[\u4E00-\u9FA5\uf900-\ufa2d]/ig;
 str = str.replace(reg,'哦');
 document.write(str);
</script>

返回字符串的中文字符个数

一般的字符长度对中文和英文都是不分别的,如JS里的length,那么如何返回字符串中中文字符的个数呢?处理办法:先去掉非中文字符,再返回length属性。测试代码如下:

<script type="text/javascript">
 function cLength(str){
  var reg = /[^\u4E00-\u9FA5\uf900-\ufa2d]/g;
  //匹配非中文的正则表达式
  var temp = str.replace(reg,'');
  return temp.length;
 }
 var str = "中文123";
 document.write(str.length+'<br />');
 document.write(cLength(str));
</script>

结果:

 5
 2

中文两个,数字三个,结果正确。

测试代码2:

 var str = "中文123tets@#!#%$#[][{}";
 document.write(str.length+'<br />');
 document.write(cLength(str));

正则表达式取得匹配IP地址前三段

192.168.118.101,192.168.118.72, 192.168.118.1都替换成:192.168.118

只要匹配掉最后一段并且替换为空字符串就行了,正则如下:

/\.\d{1,3}$/

匹配结尾的.n,.nn或者.nnn。

测试代码如下:

function replaceReg(reg,str){
  return str.replace(reg,'')
}
var reg = /\.\d{1,3}$/;
var str = '192.168.118.101';
var str2 = '192.168.118.72';
var str3 = '192.168.118.1';
document.write(replaceReg(reg,str)+'<br />');
document.write(replaceReg(reg,str2)+'<br />');
document.write(replaceReg(reg,str3)+'<br />');

匹配<ul>与<ul>之间的内容

<ul>safsf<ul>safsf</ul><ul>safsf</ul></ul>

用正则可以得到 <ul>起到下个<ul> 之间的内容。

正则如下:

/&lt;ul&gt;[\s\S]+?&lt;ul&gt;/i

首先匹配两侧的ul标签,中间的[\s\S]+?可以匹配一个或者多个任意字符,一定要非贪婪,否则会匹配<ul>safsf<ul>safsf</ul><ul>。

用正则表达式获得文件名

c:\images\tupian\006.jpg

可能是直接在盘符根目录下,也可能在好几层目录下,要求替换到只剩文件名。

正则如下:

/[^\\\/]*[\\\/]+/g

首先匹配非左右斜线字符0或多个,然后是左右斜线一个或者多个。形如“xxx/”或者“xxx\”或者“/”或者“\”

函数以及测试代码:

&lt;script type=&quot;text/javascript&quot;&gt;
 function getFileName(str){
  var reg = /[^\\\/]*[\\\/]+/g;
  //xxx\或者是xxx/
  str = str.replace(reg,'');
  return str;
 }
 var str = &quot;c:\\images\\tupian\&#92;&#48;06.jpg&quot;;
 document.write(getFileName(str)+'&lt;br /&gt;');
 var str2 = &quot;c:/images/tupian/test2.jpg&quot;;
 document.write(getFileName(str2));
&lt;/script&gt;

注意,"\"需要转义。

绝对路径变相对路径

将<img height="120" width="800" src="http://20.123.12.12/image/somepic.gif">转换为:<img height="120" width="800" src="/image/somepic.gif">。

其中网址可能改变,例如http://localhost等等。

正则如下:

/http:\/\/[^\/]+/

首先是http://,然后[^\/]+找过1个或者多个非/字符,因为遇到第一个/表示已经到目录了,停止匹配。

测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 var str = '&lt;img height=&quot;120&quot; width=&quot;800&quot; src=&quot;http://23.123.22.12/image/somepic.gif&quot;&gt;';
 var reg = /http:\/\/[^\/]+/;
 str = str.replace(reg,&quot;&quot;);
 alert(str)
&lt;/script&gt;

用户名正则

用于用户名注册,用户名只能用 中文、英文、数字、下划线、4-16个字符。

正则如下:

/^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/

中文字符或者单词字符,4到16个。实现4到16结成到正则里的关键就是开始^和结束$,这就等于整个字符串只能有这些匹配的内容,不能有多余的。

函数和测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function isEmail(str){
  var reg = /^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/;
   return reg.test(str);
 }
 var str = '超级无敌用户名regExp';
 var str2 = '捣乱的@';
 var str3 = '太短'
 var str4 = '太长longlonglonglonglonglonglonglong'
 document.write(isEmail(str)+'&lt;br /&gt;');
 document.write(isEmail(str2)+'&lt;br /&gt;');
 document.write(isEmail(str3)+'&lt;br /&gt;');
 document.write(isEmail(str4)+'&lt;br /&gt;');
&lt;/script&gt;

匹配英文地址

规则如下:

包含 "点", "字母","空格","逗号","数字",但开头和结尾不能是除字母外任何字符。

[\.a-zA-Z\s,0-9]这个字符集就实现了字母,空格,逗号和数字。最终正则如下:

/^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/

开头必须有字母,结束也必须是一个以上字母。测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function testReg(reg,str){
  return reg.test(str);
 }
 var reg = /^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/;
 var str = 'No.8,ChangAn Street,BeiJing,China';
 var str2 = '8.No,ChangAn Street,BeiJing,China';
 var str3 = 'No.8,ChangAn Street,BeiJing,China88';
 document.write(testReg(reg,str)+'&lt;br /&gt;')
 document.write(testReg(reg,str2)+'&lt;br /&gt;')
 document.write(testReg(reg,str3)+'&lt;br /&gt;')
&lt;/script&gt;

正则匹配价格

价格的格式应该如下:

开头数字若干位,可能有一个小数点,小数点后面可以有两位数字。hansir给出的对应正则如下:

/^(\d*\.\d{0,2}|\d+).*$/

测试代码如下:

&lt;!DOCTYPE html PUBLIC &quot;-//W3C//DTD XHTML 1.0 Transitional//EN&quot;
&quot;http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd&quot;&gt;
&lt;html xmlns=&quot;http://www.w3.org/1999/xhtml&quot;&gt;
&lt;head&gt;
&lt;meta http-equiv=&quot;Content-Type&quot; content=&quot;text/html; charset=gb2312&quot; /&gt;
&lt;title&gt;正则匹配价格正则测试&lt;/title&gt;
&lt;script type=&quot;text/javascript&quot;&gt;
 function checkPrice(me){
  if(!(/^(?:\d+|\d+\.\d{0,2})$/.test(me.value))){
  me.value = me.value.replace(/^(\d*\.\d{0,2}|\d+).*$/,'$1');
  }
 }
&lt;/script&gt;
&lt;/head&gt;
&lt;body&gt;
 &lt;input type=&quot;text&quot; onkeyup=&quot;checkPrice(this);&quot;/&gt;
&lt;/body&gt;
&lt;/html&gt;

身份证号码的匹配

身份证号码可以是15位或者是18位,其中最后一位可以是X。其它全是数字,正则如下:

/^(\d{14}|\d{17})(\d|[xX])$/

开头是14位或者17位数字,结尾可以是数字或者是x或者是X。

测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function testReg(reg,str){
  return reg.test(str);
 }
 var reg = /^(\d{14}|\d{17})(\d|[xX])$/;
 var str = '123456789012345';//15位
 var str2 = '123456789012345678';//18位
 var str3 = '12345678901234567X';//最后一位是X
 var str4 = '1234';//位数不对
 document.write(testReg(reg,str)+'&lt;br /&gt;');
 document.write(testReg(reg,str2)+'&lt;br /&gt;');
 document.write(testReg(reg,str3)+'&lt;br /&gt;');
 document.write(testReg(reg,str4)+'&lt;br /&gt;');
&lt;/script&gt;

要求文本有指定行数

要求:可以支持所有字符,中间可带空格,可以包括英文、数字、中文、标点

正则如下:

/\S+?\s*?[\n\r]\s*?\S+?/i

单词首字母大写

每单词首字大写,其他小写。如blue idea转换为Blue Idea,BLUE IDEA也转换为Blue Idea

正则如下:

/\b(\w)|\s(\w)/g

所谓“首字母”包括两种情况:第一种是边界(开头)的单词字符,一种是空格之后的新单词的第一个字母。测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function replaceReg(reg,str){
  str = str.toLowerCase();
  return str.replace(reg,function(m){return m.toUpperCase()})
 }
 var reg = /\b(\w)|\s(\w)/g;
 var str = 'blue idea';
 var str2 = 'BLUE IDEA';
 var str3 = 'Test \n str is no good!';
 var str4 = 'final test';
 document.write(replaceReg(reg,str)+'&lt;br /&gt;');
 document.write(replaceReg(reg,str2)+'&lt;br /&gt;');
 document.write(replaceReg(reg,str3)+'&lt;br /&gt;');
 document.write(replaceReg(reg,str4)+'&lt;br /&gt;');
&lt;/script&gt;

正则验证日期格式

yyyy-mm-dd格式

正则如下:

/^\d{4}-\d{1,2}-\d{1,2}$/

4位数字,横线,1或者2位数字,再横线,最后又是1或者2位数字。

测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function testReg(reg,str){
  return reg.test(str);
 }
 var reg = /^\d{4}-\d{1,2}-\d{1,2}$/;
 var str = '2008-8-8';
 var str2 = '2008-08-08';
 var str3 = '08-08-2008';
 var str4 = '2008 08 08';
 document.write(testReg(reg,str)+'&lt;br /&gt;');
 document.write(testReg(reg,str2)+'&lt;br /&gt;');
 document.write(testReg(reg,str3)+'&lt;br /&gt;');
 document.write(testReg(reg,str4)+'&lt;br /&gt;');
&lt;/script&gt;

针对 yyyy-mm-dd或yyyy/mm/dd 的形式,用“或”简单地修改一下就行了。

/^\d{4}(-|\/)\d{1,2}(-|\/)\d{1,2}$/

去掉文件的后缀名

www.abc.com/dc/fda.asp变为www.abc.com/dc/fda

如果文件后缀已知的话这个问题就非常简单了,正则如下:

/\.asp$/

匹配最后的.asp而已,测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function delAspExtension(str){
  var reg = /\.asp$/;
  return str.replace(reg,'');
 }
 var str = 'www.abc.com/dc/fda.asp';
 document.write(delAspExtension(str)+'&lt;br /&gt;');
&lt;/script&gt;

如果文件名未知的话就用这个正则:/\.\w+$/,测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function delExtension(str){
  var reg = /\.\w+$/;
  return str.replace(reg,'');
 }
 var str = 'example.com/dc/fda.asp';
 document.write(delExtension(str)+'&lt;br /&gt;');
 var str2 = 'test/regular/fda.do';
 document.write(delExtension(str2)+'&lt;br /&gt;');
 var str3 = 'example.com/dc/fda.strange_extension';
 document.write(delExtension(str3)+'&lt;br /&gt;');
&lt;/script&gt;

验证邮箱的正则表达式

正则:

/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/

开始必须是一个或者多个单词字符或者是-,加上@,然后又是一个或者多个单词字符或者是-。然后是点“.”和单词字符和-的组合,可以有一个或者多个组合。

&lt;script type=&quot;text/javascript&quot;&gt;
 function isEmail(str){
  var reg = /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;
  return reg.test(str);
 }
 var str = 'test@hotmail.com';
 document.write(isEmail(str)+'&lt;br /&gt;');
 var str2 = 'test@sima.vip.com';
 document.write(isEmail(str2)+'&lt;br /&gt;');
 var str3 = 'te-st@qq.com.cn';
 document.write(isEmail(str3)+'&lt;br /&gt;');
 var str4 = 'te_st@sima.vip.com';
 document.write(isEmail(str4)+'&lt;br /&gt;');
 var str5 = 'te.._st@sima.vip.com';
 document.write(isEmail(str5)+'&lt;br /&gt;');
&lt;/script&gt;

匹配源代码中的链接

能够匹配HTML代码中链接的正则。

正则如下:

/&lt;a\s(\s*\w*?=&quot;.+?&quot;)*(\s*href=&quot;.+?&quot;)(\s*\w*?=&quot;.+?&quot;)*\s*&gt;[\s\S]*?&lt;\/a&gt;/

思路如下:首先要有<a和一个空格。/<a\s/

第一个(\s*\w*?=".+?")*

可以匹配一个属性,属性前面可能有或者没有多余的空格,用\s*匹配;属性名肯定是单词字符,用\w*?匹配;=".+?"就是匹配属性值了非换行字符若干个;整个括号外面加个*表示可能有任意多个属性。

(\s*href=".+?")

匹配href,它也是一个属性,所以只要把上面子正则表达式中的\w修改为href=就行了。

(\s*\w*?=".+?")*重复第一个子正则表达式,再次接受任意个属性。

\s*>,属性最后再加上若干个空格和>。
[\s\S]*?,链接的文字,可能有任何字符组成,若干个,非贪婪。

<\/a>最后是结束标签。

补充:属性名和=之间,以及=和属性值之间也可能有空格。所以要再加上几个\s*。

最后的实例代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function findLinks(str){
  var reg = /&lt;a\s(\s*\w*?\s*=\s*&quot;.+?&quot;)*(\s*href\s*=\s*&quot;.+?&quot;)(\s*\w*?\s*=\s*&quot;.+?&quot;)
 *\s*&gt;[\s\S]*?&lt;\/a&gt;/g;
  var arr = str.match(reg);
  for(var i=0;i&lt;arr.length;i++){
  //alert(arr[i]);
  document.write('link:'+arr[i]+'&lt;br /&gt;');
  }
 }
 var str = '&lt;p&gt;测试链接:&lt;a id = &quot;test&quot; href=&quot;http://bbs.blueidea.com&quot; title=&quot;无敌&quot;&gt;经典论坛
 &lt;/a&gt;&lt;/p&gt;&lt;a? href = &quot;http://www.blueidea.com/&quot;? &gt;蓝色理想&lt;/a&gt;';
 var arr = findLinks(str);
&lt;/script&gt;

会把所有的链接在页面直接显示出来。

匹配链接的文字

代码:<a href="#>这里要保存</a>,只保存链接的文本内容,标签信息删掉。

正则如下:

/&lt;a\s(?:\s*\w*?\s*=\s*&quot;.+?&quot;)*(?:\s*href\s*=\s*&quot;.+?&quot;)(?:\s*\w*?\s*=\s*&quot;.+?&quot;)*\s*&gt;([\s\S]*?)&lt;\/a&gt;/

测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function anchorText(str){
  var reg =/&lt;a\s(?:\s*\w*?\s*=\s*&quot;.+?&quot;)*(?:\s*href\s*=\s*&quot;.+?&quot;)(?:\s*\w*?\s*=\s*&quot;.+?&quot;)*\s*&gt;([\s\S]*?)&lt;\/a&gt;/;
  str = str.replace(reg,'$1');
  return str;
 }
 var str = '&lt;a id = &quot;test&quot; href=&quot;http://bbs.blueidea.com&quot; title=&quot;无敌&quot;&gt;经典论坛&lt;/a&gt;';
 document.write(anchorText(str));
&lt;/script&gt;

正则判断标签是否闭合

例如:<img xxx=”xxx” 就是没有闭合的标签;

<p>p的内容,同样也是没闭合的标签。

从简单的正则开始,先匹配起始标签

/&lt;[a-z]+/i

再加上若干属性:

/&lt;[a-z]+(\s*\w*?\s*=\s*&quot;.+?&quot;)*/i

关键点:标签的闭合。标签可能有两种方式闭合,<img xxx=”xxx” />

或者是<p>xxx </p>。

(\s*\/>)

匹配img类的结束,即/>。

(\s*?>[\s\S]*?<\/\1>)

匹配\p类标签的结束标签。>是其实标签末尾,之后是标签内容若干个任意字符,最后的<\/\1>就是结束标签了。

加上一个或就可以解决了,最后的完整正则表达式:

整个正则:

/&lt;([a-z]+)(\s*\w*?\s*=\s*&quot;.+?&quot;)*(\s*?&gt;[\s\S]*?&lt;\/\1&gt;|\s*\/&gt;)/i

拿这个正则,只要匹配到了就表示闭合,没匹配到则没有闭合。不过没有考虑相同标签嵌套的问题,例如

<div>aaaaaa<div>test</div>

也被判断为合格,可以通过把最后的匹配p类结束标签写成子正则表达式,并且更改为非贪心,然后在匹配结果中检查是否成对。正则如下:

/&lt;([a-z]+)(\s*\w*?\s*=\s*&quot;.+?&quot;)*(\s*?&gt;[\s\S]*?(&lt;\/\1&gt;)+|\s*\/&gt;)/i

用正则获得指定标签的内容

有如下代码:

&lt;channel&gt;
   &lt;title&gt;蓝色理想&lt;/title&gt;
 &lt;/channel&gt;
 &lt;item&gt;
   &lt;title&gt;界面设计测试规范&lt;/title&gt;
 &lt;/item&gt;
 &lt;item&gt;
     &lt;title&gt;《古典写实美女》漫画教程&lt;/title&gt;
 &lt;/item&gt;
 &lt;item&gt;
     &lt;title&gt;安远――消失的光年&lt;/title&gt;
 &lt;/item&gt;
 &lt;item&gt;
     &lt;title&gt;asp.net 2.0多语言网站解决方案&lt;/title&gt;
 &lt;/item&gt;

要求匹配item里的title而不匹配channel里的title。

基本正则:

/&lt;title&gt;[\s\S]*?&lt;\/title&gt;/gi

首先是title标签,内容为任意字符若干个,然后是title结束标签。这个正则已经能匹配到所有的title标签。

首先,我简单地修改了一下原正则:

/&lt;title&gt;[^&lt;&gt;]*?&lt;\/title&gt;/gi,

因为title里面不应该再嵌有其它标签,这个正则同样是匹配所有标题的内容,最后再加上不去匹配channel中的title。整个正则如下:

/&lt;title&gt;[^&lt;&gt;]*?&lt;\/title&gt;(?!\s*&lt;\/channel&gt;)/gi

(?!\s*<\/channel>)表示要匹配字符串的后面不能跟着若干个空格和一个channel的结束标签。

原帖里有很方便的测试工具,这里就不给测试代码了。

正则判断是否为数字与字母的混合

不能小于12位,且必须为字母和数字的混合。

验证字符串包含数字简单,验证字符串包含字母也简单,验证字符串不包含其它字符也简单,可以用这三个正则分别检查一次字符串,逻辑运算出最终结果。

但是怎么能把这些功能写进一个正则表达式里呢?这个问题真有点伤脑筋。

正则如下:

/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig

思路非常的清晰啊:

[a-z]+(?=[0-9])

字母开头,后面必须紧跟着数字。

[0-9]+(?=[a-z]

数字开头,后面必须紧跟着字母。

[a-z0-9]+

后面的字符只要是数字或者字母就可以了。经过测试,发现不好使,123dd会被识别为不合法,dd123则为合法,可见“数字开头,紧跟字母”的正则没有起作用。测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function istrue(str){
 var reg=/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig;
 return reg.test(str);
 }
 var str? = 'AaBc';
 var str2 = 'aaa123';
 var str3 = '123dd';
 var str4 = '1230923403982';
 document.write(istrue(str)+'&lt;br /&gt;');
 document.write(istrue(str2)+'&lt;br /&gt;');
 document.write(istrue(str3)+'&lt;br /&gt;');
 document.write(istrue(str4)+'&lt;br /&gt;');
&lt;/script&gt;

结果为:

false,true,false,false

结果中的第三个,将'123dd'判断为非法是错误的。刚开始以为是g的问题,去掉了还是不好使。应该是浏览器bug,我认为lexrus的正则是正确的,可能是浏览器无法处理或”|”的两边都包含正向预查(?=)。

修改之后的正则如下:

/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i

意思和上面差不多,但是没有使用正向预查,测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function istrue(str){
 var reg=/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i;
 return reg.test(str);
 }
 var str? = 'AaBc';
 var str2 = 'aaa123';
 var str3 = '123dd';
 var str4 = '1230923403982';
 document.write(istrue(str)+'&lt;br /&gt;');
 document.write(istrue(str2)+'&lt;br /&gt;');
 document.write(istrue(str3)+'&lt;br /&gt;');
 document.write(istrue(str4)+'&lt;br /&gt;');
&lt;/script&gt;

结果为

false,true,true,false

正确。

空格与英文同时存在

匹配英文以及空格,要求必须既有英文字母又有空格。

这个思路和上面的差不多,只要把数字改成空格就可以了。正则如下:

/^(([a-z]+\s+)|(\s+[a-z]+))[a-z\s]*$/i

英文开头加空格,或者是空格开头加英文,后面可以是英文或者空格。测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function istrue(str){
 var reg=/^(([a-z]+\s+)|(\s+[a-z]+))[a-z\s]*$/i;
 return reg.test(str);
 }
 var str? = 'asdf';
 var str2 = 'sadf sdf';
 var str3 = 'asdf ';
 document.write(istrue(str)+'&lt;br /&gt;');
 document.write(istrue(str2)+'&lt;br /&gt;');
 document.write(istrue(str3)+'&lt;br /&gt;');
&lt;/script&gt;

利用这个思路也可以实现英文空格英文,英文单词多于两个的匹配。同样,也可以把英文字母换成单词字符\w。

显示或者保存正则表达式匹配的部分内容

有如下电话号码:

13588888333

13658447322

13558885354

13587774654

13854554786

要求,要求只匹配135开头的电话,但是匹配结果只保留135后面的数字。

由于JavaScript里的正则不支持(?=xx)xxx的模式,只支持xxx(?=xx)的模式。所以只能将135后面的内容作为一个子正则表达式匹配的内容,然后再在后面引用。

Carl给出的函数如下:

function f(phoneNumber) {
   var pattern = /^(135)(\d{8})$/;
     if(pattern.test(phoneNumber))
  return phoneNumber.replace(pattern,&quot;$2&quot;);
   else
  return &quot;不是135打头的手机号码!&quot;;
 }
 /^(135)(\d{8})$/

正则中,135作为开头表示第一个子正则表达式,第二个括号内的子正则表达式则匹配后面的8个数字,然后在replace中使用$2就可以引用这个子正则表达式匹配的内容了。测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function f(phoneNumber) {
   var pattern = /^(135)(\d{8})$/;
   if(pattern.test(phoneNumber))
  return phoneNumber.replace(pattern,&quot;$2&quot;);
   else
  return &quot;不是135打头的手机号码!&quot;;
 }
 var arr = new Array(
   &quot;13588888333&quot;,
   &quot;13658447322&quot;,
   &quot;13558885354&quot;,
   &quot;13587774654&quot;,
   &quot;13854554786&quot;
 );
 for(var i = 0; i &lt; arr.length; i++)
   document.write(f(arr[i])+'&lt;br /&gt;');
&lt;/script&gt;

正则表达式替换变量

有一个数组:

var _A = ['A','B','C','D'];

有一个有“变量”的字符串。

var _B = '<ul><li>$0$</li><li>$1$</li><li>$2$</li><li>$3$</li></ul>';

说是变量,其实只是字符串中的特殊字符,例如$0$,就称这个为伪变量吧。

最后的要求就是使用正则获得下面这样一个字符串:

_C = '<ul><li>A</li><li>B</li><li>C</li><li>D</li></ul>';

测试代码:

&lt;script type=&quot;text/javascript&quot;&gt;
 var _A = ['A','B','C','D'];
 var _B = '&lt;ul&gt;&lt;li&gt;$0$&lt;/li&gt;&lt;li&gt;$1$&lt;/li&gt;&lt;li&gt;$2$&lt;/li&gt;&lt;li&gt;$3$&lt;/li&gt;&lt;/ul&gt;';
 var reg=/\$\d+\$/ig;
 C=_B.replace(reg,function($1){
 var indexnum=$1.replace(/\$/ig,&quot;&quot;);
 if (indexnum&lt;_A.length)
 {return _A[indexnum];}
 else{return &quot;&quot;}
 });
 alert(C);
&lt;/script&gt;

代码分析:看到代码之后感觉有点晕,首先,正则reg中没有任何的括号,应该是没有捕获内容的,那么后面怎么又使用$1了引用了呢?通过alert测试,发现它是整个正则匹配的内容,而且不一定要写作$1,可以写为$0,甚至是写为x都没关系,它总是整个匹配。

第一次,$1匹配到_B中的“$0$”,匿名函数中将它的$去掉,变成了0,检查是否越界之后,用这个0作为下标去访问数组_A。

由于正则reg定义了g属性,所以会继续替换$1$、$2$等等。步骤都和上面一样。

正则替换指定属性中的文本

有如下代码:

<td align="center"><img src="../photo/ccg/thumbnails/O'Malley's West_jpg.gif" border="0" onClick="MM_openBrWindow('../photo/ccg/pages/O'Malley's West_jpg.htm','BE','width=386,height=306')"><br>

O'Malley's West</td>

要求将所有onclick属性中的’替换成\’,也就是将单引号转义。

首先,需要匹配onclick属性:

/onclick\s*=\s*&quot;.+?&quot;/ig

然后再将所有的’都替换成\’就可以了。

将阿拉伯数字替换为中文大写形式

将123替换成壹贰叁。

只要匹配一个数字就可以了,测试代码如下(如果显示为乱码就调整一下浏览器的字符编码):

function replaceReg(reg,str){
  return str.replace(reg,function(m){return arr[m];})
}
arr=new Array(&quot;零&quot;,&quot;壹&quot;,&quot;贰&quot;,&quot;叁&quot;,&quot;肆&quot;,&quot;伍&quot;,&quot;陆&quot;,&quot;柒&quot;,&quot;捌&quot;,&quot;玖&quot;);
var reg = /\d/g;
var str = '13889294444';
var str2 = '12889293333';
var str3 = '23445567';
document.write(replaceReg(reg,str)+'&lt;br /&gt;');
document.write(replaceReg(reg,str2)+'&lt;br /&gt;');
document.write(replaceReg(reg,str3)+'&lt;br /&gt;');

替换文本中的URL为链接

将一个用户输入的一段文字中的url替换成可以点击的link地址。例如:http://www.blueidea.com可以替换成

或<a href="http://www.cctv.com">http://www. blueidea.com</a>.

这个正则的关键就在于匹配链接,匹配之后,在两边加上a标签和属性不是问题。

/http:\/\/[\w-]*(\.[\w-]*)+/ig

首先匹配http://。

[\w-]*是可能的www和bbs等。

\.[\w-]*匹配.xxx形式,至少有一个。

测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function replaceReg(reg,str){
  return str.replace(reg,function(m){return '&lt;a href=&quot;'+m+'&quot;&gt;'+m+'&lt;/a&gt;';})
 }
 var reg = /http:\/\/[\w-]*(\.[\w-]*)+/ig;
 var str = '将一个用户输入的一段文字中的url替换成可以点击的link地址。\
测试一下:http://www.blueidea.com紧接着中文,还有http://bbs.blueidea.com \
is very good!http://blueidea.com!最后在看看带.cn的:http://www.sina.com.cn呵呵。';
 document.write(replaceReg(reg,str)+'&lt;br /&gt;');
&lt;/script&gt;

从HTML代码段删除指定标签及内容

在一段代码中去除<script ...... /script>, <head>...</head>,<%.....%>等代码块

正则如下:

/&lt;(script|head|%)[\s\S]*?\/\1&gt;/ig

用正则给文本分段

原代码:[title]标题一[/title]内容一232323sdfga [title]标题二[/title]内容二2232323 [title]标题三[/title]内容三2232323

要把文本分段成如下格式:

一、[title]标题一[/title]内容一232323sdfga

二、[title]标题二[/title]内容二2232323

三、[title]标题三[/title]内容三2232323

只要用正则匹配title就可以了,所以正则比较简单

/\[title\]/ig

至于开始的的汉字序号,只要一个数组就解决了,最终代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function replaceReg(reg,str){
  var mark =0;
  return str.replace(reg,function(m){mark++;return '&lt;br /&gt;'+arr[mark]+'、'+m;})
 }
 var arr = [&quot;零&quot;,&quot;壹&quot;,&quot;贰&quot;,&quot;叁&quot;,&quot;肆&quot;,&quot;伍&quot;,&quot;陆&quot;,&quot;柒&quot;,&quot;捌&quot;,&quot;玖&quot;];
 var reg = /\[title\]/ig;
 var str = '[title]标题一[/title]内容一232323sdfga [title]标题二[/title]内容二2232323 [title]标题三[/title]内容三2232323';
 document.write(replaceReg(reg,str)+'&lt;br /&gt;');
&lt;/script&gt;

转换源代码中的标签

将代码中的HTML标签img转换为[img]url[/img]。

/<img(?:\s*\w*?\s*=\s*".+?")*?\s*src\s*=\s*"(.+?)"(?:\s*\w*?\s*=\s*".+?")*\s*>/ig

这段正则和匹配链接标签的正则基本一样,修改如下,标签名img,没有结束标签而是>结束。

测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function replaceReg(reg,str){
  return str.replace(reg,'[img]$1[/img]')
 }
 var reg =
/&lt;img(?:\s*\w*?\s*=\s*&quot;.+?&quot;)*?\s*src\s*=\s*&quot;(.+?)&quot;(?:\s*\w*?\s*=\s*&quot;.+?&quot;)*\s*&gt;/ig;
 var str = '我就是传说中的图片了&lt;img src=&quot;URL&quot;&gt;哎。';
 document.write(replaceReg(reg,str)+'&lt;br /&gt;');
&lt;/script&gt;

第二个是替换object代码嵌入的flash代码替换为[swf]url[/swf]。

针对原文的正则如下:

/&lt;object[\s\S]*?src=([\s\S]+?)(?=\s)[\s\S]*&lt;\/object&gt;/i

如果是所有的属性都有双引号的话正则也需要修改。

测试如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function replaceReg(reg,str){
  return str.replace(reg,'[swf]$1[/swf]')
 }
 var reg = /&lt;object[\s\S]*?src=([\s\S]+?)(?=\s)[\s\S]*&lt;\/object&gt;/i;
 var str = '&lt;object classid=clsid:D27CDB6E-AE6D-11cf-96B8-444553540000 \
codebase=http://download.macromedia.com/pub/shockwave/cabs/flash/\
swflash.cab#version=5,0,0,0 width=255 height=250&gt;&lt;param name=movie \
value=url&gt;&lt;param name=quality value=high&gt;&lt;embed src=url quality=high \
pluginspage=http://www.macromedia.com/shockwave/download/index.cgi?\
P1_Prod_Version=ShockwaveFlash type=application/x-shockwave-flash \
width=255 height=250&gt;&lt;/embed&gt;&lt;/object&gt;';
 document.write(replaceReg(reg,str)+'&lt;br /&gt;');
 &lt;/script&gt;

给属性添加双引号

给HTML标签中的属性添加双引号。

<a href=xxx>改为:<a href="xxx">

正则1如下:

/(\s+\w+)\s*=\s*([^&lt;&gt;&quot;\s]+)(?=[^&lt;&gt;]*&gt;)/ig

正则2:

str=str.replace(/(?!&lt;\w+)(\s+\w+)\s*=\s*([^&gt;\&quot;\s]+)(?=[^&gt;]*&gt;)/ig,'$1=&quot;$2&quot;')
.replace(/\&quot;\'([^\'\&quot;]+)\'\&quot;/ig,'\&quot;$1\&quot;');

测试代码如下:

&lt;script type=&quot;text/javascript&quot;&gt;
 function rp(str,trg){
  var reg1 = /(\s+\w+)\s*=\s*([^&lt;&gt;&quot;\s]+)(?=[^&lt;&gt;]*&gt;)/ig
  var reg2 = /&quot;'([^'&quot;]*)'&quot;/ig;
  str=str.replace(reg1,'$1=&quot;$2&quot;').replace(reg2,'\&quot;$1\&quot;');
  trg.value=str;
 }
&lt;/script&gt;
&lt;textarea id=&quot;sou&quot; style=&quot;width:100%&quot;&gt;
&lt;a href = xxx name=aaa target=_blank title='asdfasf'
onclick=alert('blueidea')&gt; asfd=asfd
&lt;/textarea&gt;
&lt;input type=&quot;button&quot; onclick=&quot;rp(sou.value,sou)&quot; value=&quot;replace&quot;/&gt;

正则3:

/(\s+\w+)\s*=\s*([^&quot;\s]+)(?=[^&lt;&gt;]*&gt;)/ig

给table加上tbody

有若干table,但是没有tbody。现在需要用正则批量加上。

匹配table结束标签</table>比较简单,在前面加上一个</tbody>就行了。

但是,匹配table的起始标签有点难度,因为可能有属性。不过之前匹配过链接了,这个也大同小异。

实例table代码如下:

<table width="100%" border="0" cellpadding="2" cellspacing="3">

<table width="100%">

正则:

/&lt;table\s(\s*\w*?\s*=\s*&quot;.+?&quot;)*?\s*?&gt;/g

匹配一个<table,在匹配若干个属性,最后只要再找到>就代表标签结束。

之后再replace一下,加上<tbody>就可以了。

去掉标签的所有属性

<td style="width: 23px; height: 26px;" align="left">***</td>

变成没有任何属性的

<td>***</td>

思路:非捕获匹配属性,捕获匹配标签,使用捕获结果替换掉字符串。正则如下:

/(&lt;td)\s(?:\s*\w*?\s*=\s*&quot;.+?&quot;)*?\s*?(&gt;)/

首先,td匹配掉了标签,后面可以用$1引用,后面的若干属性被(?:)匹配掉,而最后匹配的>则可以在后面用$2引用。

示意代码:

str = str.replace(reg,’$1$2’);

正则替换特定单词

要求禁止输入某几个单词,如果拒绝red,yellow,white。这个帖子到时不难,但是让我弄清楚了好几个概念。

第一个,小心字符集合里的“或”

/[^red|yellow|white]/

这个正则里的所有或都没有意义,等同于:

/[^redyellowwhite]/

意思就是不能含有以下列出的所有字母。

正解:

/red|yellow|white/

第二个概念:

只要整个正则匹配成功,无论子正则表达式是否匹配成功,括号都会捕捉。例如

/(red)|(yellow)|(white)/

会捕捉到三个结果,尽管实际上最多只可能有一个括号匹配成功。但是只要有一个匹配到了,两外两个也会记录空串。

指定文字高亮显示

测试代码:

&lt;!DOCTYPE html PUBLIC &quot;-//W3C//DTD XHTML 1.0 Transitional//EN&quot;
 &quot;http://www.w3.org/TR/2000/REC-xhtml1-20000126/DTD/xhtml1-transitional.dtd&quot;&gt;
 &lt;html xmlns=&quot;http://www.w3.org/1999/xhtml&quot;&gt;
 &lt;head&gt;
 &lt;meta http-equiv=&quot;Content-Type&quot; content=&quot;text/html; charset=gb2312&quot; /&gt;
 &lt;META name=&quot;Author&quot; content=&quot;Sheneyan&quot; /&gt;
 &lt;script type=&quot;text/javascript&quot;&gt;
 function encode(s){
   return  s.replace(/&amp;/g,&quot;&amp;amp;&quot;).replace(/&lt;/g,&quot;&amp;lt;&quot;).replace(/&gt;/g,&quot;&amp;gt;&quot;).replace(/([\\\.\*\[\]\(\)\$\^])/g,&quot;\\$1&quot;);
 }
 function decode(s){
   return  s.replace(/\\([\\\.\*\[\]\(\)\$\^])/g,&quot;$1&quot;).replace(/&amp;gt;/g,&quot;&gt;&quot;).replace(/&amp;lt;/g,&quot;&lt;&quot;).replace(/&amp;amp;/g,&quot;&amp;&quot;);
 }
 function highlight(s){
   if (s.length==0){
  alert('搜索关键词未填写!');
  return false;
   }
   s=encode(s);
   var obj=document.getElementsByTagName(&quot;body&quot;)[0];
   var t=obj.innerHTML.replace(/&lt;span\s+class=.?highlight.?&gt;([^&lt;&gt;]*)&lt;\/span&gt;/gi,&quot;$1&quot;);
   obj.innerHTML=t;
   var cnt=loopSearch(s,obj);
   t=obj.innerHTML
   var r=/{searchHL}(({(?!\/searchHL})|[^{])*){\/searchHL}/g
   t=t.replace(r,&quot;&lt;span class='highlight'&gt;$1&lt;/span&gt;&quot;);
   obj.innerHTML=t;
   alert(&quot;搜索到关键词&quot;+cnt+&quot;处&quot;)
 }
 function loopSearch(s,obj){
   var cnt=0;
   if (obj.nodeType==3){
  cnt=replace(s,obj);
  return cnt;
   }
   for (var i=0,c;c=obj.childNodes[i];i++){
  if (!c.className||c.className!=&quot;highlight&quot;)
  cnt+=loopSearch(s,c);
   }
   return cnt;
 }
 function replace(s,dest){
   var r=new RegExp(s,&quot;g&quot;);
   var tm=null;
   var t=dest.nodeValue;
   var cnt=0;
   if (tm=t.match(r)){
  cnt=tm.length;
  t=t.replace(r,&quot;{searchHL}&quot;+decode(s)+&quot;{/searchHL}&quot;)
  dest.nodeValue=t;
   }
   return cnt;
 }
 &lt;/script&gt;
 &lt;style type=&quot;text/css&quot;&gt;
 .highlight{background:green;font-weight:bold;color:white;}
 &lt;/style&gt;
 &lt;/head&gt;
 &lt;body&gt;
 &lt;form onsubmit=&quot;highlight(this.s.value);return false;&quot;&gt;
 &lt;p&gt;&lt;input name=&quot;s&quot; id=&quot;s&quot; title=&quot;搜索内容:&quot;/&gt;&lt;input type=&quot;submit&quot; value=&quot;搜索&quot;/&gt;&lt;/p&gt;
 &lt;/form&gt;
 &lt;div id=&quot;content&quot;&gt;
 测试高亮的代码。很长很长的代码……………………
 &lt;/div&gt;
 &lt;/body&gt;
 &lt;/html&gt;

删除标签

删除除了<img>、<br>、<p>之外所有的标签。子虚乌有给出代码中关键的一句:

o.innerHTML.replace(/(&lt;\/?(?!br|p|img)[^&gt;\/]*)\/?&gt;/gi,'');

这个正则不用区分起始和结束标签。

&amp;lt;\/?(?!br|p|img)

匹配除了保护标签外标签的起始标签或者是结束标签的一部分。

[^&amp;gt;\/]*

匹配到>或者/就结束。

\/?&amp;gt;

起始标签或者结束标签的结尾。

给我留言

您必须 [ 登录 ] 才能发表留言!

×
#