世界之窗论坛's Archiver

tanjianwen 发表于 2008-5-12 10:57

网页内容过滤有BUG!

/\/[a-zA-Z]+[^a-z0-9%-]?\d{3}[x_]\d{2,3}[^a-z0-9%]{1}([a-z]*|\d)\.(?:gif|swf)/
/\/[a-zA-Z]+[^a-z0-9%-]{1}\d{3}[x_]\d{2,3}_?(?:[a-z]*|\d{5,})\.(?:gif|swf)/
当使用这两条正则表达式时CPU占用马上提高

tanjianwen 发表于 2008-5-17 14:00

没人看见?

Aycox 发表于 2008-5-17 15:05

不是很懂,说错了莫怪。不管是第一条还是第二条,前半段均是从有 /  字符处开始一个字符一个字符的匹配,直到遇到符号、大写A~Z或三个数字然后才匹配后半段,也就是说一个页面几乎所有链接都要这样匹配一遍。

tanjianwen 发表于 2008-5-18 12:02

当使用这两条正则表达式时CPU占用马上提高,是因为写得不好吗?

needed 发表于 2008-5-18 12:22

打个比方..
   你每天口算1000条 2位×2位的 乘法你也会头疼吧  :D

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.