返回列表 发帖

好像PREVIEW4的正则过滤有问题!!!

测试网站:http://club1.ccmove.com/nclub/boarddisplay-1189-1.html

网站有个广告:http://www.papav.com/cooperate/frame_Nx1?n=8&width=70&height=55

这个广告的左侧但是网站的LOGO,与广告是在一个<TR>里的。

在过滤中加入: /(www)\.(papav)\.(com)\/(cooperate)\/(frame_Nx)*/

会将临近的<TD>(即LOGO所在的TD)也给过滤掉了,结果就是网站的布局失真了!

大家可以测试一下,是不是有这样的问题!!
爱拼才会赢

是我的写法有问题么,还是确实存在问题?????


爱拼才会赢

TOP

黑名单过滤不会匹配网页结构,而是匹配关键词,在同一个表格中关键词不同的不会被过滤

还有,你的写法有也有问题,在正则式中"*"不是跟通配符一样的含义,这里它表示匹配它前面的子表达式任意次数,显然跟你要达到的目的不一样

最后类似这种单个网站目录的直接用通配符就可以,不一定要用正则,直接过滤掉http://www.papav.com/cooperate/*

或者你干脆过滤掉/cooperate/
*/cooperate/*或者/\/cooperate/
也可以直接添加到置顶规则的第一条,随便加到那里就好了,只要用"|"跟其他关键词分割开就好

TOP

回复 #3 elkay 的帖子

一样的啊,原来PREVIEW3就是这么写的,好用的,但到4就不好用了!

而且用http://www.papav.com/cooperate/*和/\/cooperate/frame等都是同样的效果!!

我已经在这里试过无数次了!

我承认正则式我不太会写,但重要的问题不在这里!!!

希望您也测试一下!!!!然后再帮我看看问题的所在!!!!
爱拼才会赢

TOP

那你改成下面的试试看
/www\.papav\.com\/cooperate\/frame_Nx.*/

TOP

回复 #5 elkay 的帖子

这个早就用过了,我不知道版主是否测试了,不好用了,同样会过滤掉其左侧的与LOGO有关的<TD>,导致网页失真!

其实版主还没明白,不是我语法上的问题,而是过滤时出了问题!我现在还在测试!应该说已经确认这个问题了!!

[ 本帖最后由 mnxinu 于 2007-2-5 00:27 编辑 ]
爱拼才会赢

TOP

不知版主是否亲自测试了CCMOVE网站的情况,不要从上下文或字面中寻找答案
爱拼才会赢

TOP

我当然是试过才跟你说的啊,我这里完全没有问题啊

你截个图来看看呢


我先上个我的截图吧,你看看是不是这样的?

[ 本帖最后由 elkay 于 2007-2-5 00:44 编辑 ]
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

TOP

回版主

看一下,对比如图!
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们
爱拼才会赢

TOP

版主看到了么?
我在想是不是我们的版本不同?我用PREVIEW3时好用的,今天才下的4,我觉得4有这样的问题!3时没有这样的问题!
爱拼才会赢

TOP

特地注册了一个帐号截了个回复主题的图,你试试清空所有的规则,只留下一条试试看
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

TOP

也试过了,同样!

另外,版主是否设置过滤后的替换文字?怎么没看到替换后的文字呢?是不是那片空白还没出来了,有时候需要点时间才能出来的!因为是外部链接过来的!!
爱拼才会赢

TOP

返回列表