世界之窗论坛's Archiver

shieep 发表于 2009-6-12 12:30

2X系列正则的一个BUG

[i=s] 本帖最后由 shieep 于 2009-6-12 12:32 编辑 [/i]

我把程序和配置文件打包上传了。
以这个页面为例。会导致CPU全满了。2核的话,CPU占用是50%。
[url=http://bbs.news.163.com/bbs/society/138294681.html]http://bbs.news.163.com/bbs/society/138294681.html[/url]
BBS.news.163.com开头的都会是这样。但是其他163的页面没有问题。

needed 发表于 2009-6-12 12:59

任何 不规范的黑名单都有可能导致 假死.. :lol:

smile16888 发表于 2009-6-12 15:11

[code]#exd#*.163.com*#<(div).*"(?:ad360|adList|endAd550|ad960_70|leftad|div_pic1|Ad|hrContent)"[^>]*>(?:<\1[^>]*>(?:<\1[^>]*>(?:<\1[^>]*>(?:<\1[^>]*>[\s\S]*?</\1>|[\s\S])*?</\1>|[\s\S])*?</\1>|[\s\S])*?</\1>|[\s\S])*?</\1>$###<!--163已过滤-->[/code]把你的这条广告过滤规则去掉试试,这条规则太复杂了。
我这没有出现楼主的问题

shieep 发表于 2009-6-12 16:26

[quote]#exd#*.163.com*#]*>(?:]*>(?:]*>(?:]*>(?:]*>[\s\S]*?|[\s\S])*?|[\s\S])*?|[\s\S])*?|[\s\S])*?$###把你的这条广告过滤规则去掉试试,这条规则太复杂了。
我这没有出现楼主的问题
[size=2][color=#999999]smile16888 发表于 2009-6-12 15:11[/color] [url=http://bbs.ioage.com/cn/redirect.php?goto=findpost&pid=913904&ptid=95103][img]http://bbs.ioage.com/cn/images/common/back.gif[/img][/url][/size][/quote]
我知道是这个问题,这个正则是没有问题的。是TW内部处理出了问题。所以应该修正下。这个没办法,我要过滤163新闻的广告只能用多重了。这是5个嵌套。

shieep 发表于 2009-6-12 16:27

[quote]任何 不规范的黑名单都有可能导致 假死.. :lol:
[size=2][color=#999999]needed 发表于 2009-6-12 12:59[/color] [url=http://bbs.ioage.com/cn/redirect.php?goto=findpost&pid=913692&ptid=95103][img]http://bbs.ioage.com/cn/images/common/back.gif[/img][/url][/size][/quote]我的黑名单是规范的。

琴心赏笛 发表于 2009-6-13 02:27

那些黑名单是规范的?

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.