世界之窗论坛's Archiver

mnxinu 发表于 2007-2-4 23:28

好像PREVIEW4的正则过滤有问题!!!

测试网站:[url=http://club1.ccmove.com/nclub/boarddisplay-1189-1.html]http://club1.ccmove.com/nclub/boarddisplay-1189-1.html[/url]

网站有个广告:[url=http://www.papav.com/cooperate/frame_Nx1?n=8&width=70&height=55][color=#0000ff]http://www.papav.com/cooperate/frame_Nx1?n=8&width=70&height=55[/color][/url]

这个广告的左侧但是网站的LOGO,与广告是在一个<TR>里的。

在过滤中加入: /(www)\.([color=black]papav)\.(com)\/(cooperate)\/(frame_Nx)*/[/color]
[color=#000000][/color]
[color=#000000]会将临近的<TD>(即LOGO所在的TD)也给过滤掉了,结果就是网站的布局失真了![/color]
[color=#000000][/color]
[color=#000000]大家可以测试一下,是不是有这样的问题!![/color]

mnxinu 发表于 2007-2-4 23:34

是我的写法有问题么,还是确实存在问题?????


:mad:

elkay 发表于 2007-2-4 23:49

黑名单过滤不会匹配网页结构,而是匹配关键词,在同一个表格中关键词不同的不会被过滤

还有,你的写法有也有问题,在正则式中"*"不是跟通配符一样的含义,这里它表示匹配它前面的子表达式任意次数,显然跟你要达到的目的不一样:)

最后类似这种单个网站目录的直接用通配符就可以,不一定要用正则,直接过滤掉[url]http://www.papav.com/cooperate/[/url]*

或者你干脆过滤掉/cooperate/
*/cooperate/*或者/\/cooperate/
也可以直接添加到置顶规则的第一条,随便加到那里就好了,只要用"|"跟其他关键词分割开就好:)

mnxinu 发表于 2007-2-5 00:02

回复 #3 elkay 的帖子

一样的啊,原来PREVIEW3就是这么写的,好用的,但到4就不好用了!

而且用[url]http://www.papav.com/cooperate/[/url]*和/\/cooperate/frame等都是同样的效果!!

我已经在这里试过无数次了!

我承认正则式我不太会写,但重要的问题不在这里!!!

希望您也测试一下!!!!然后再帮我看看问题的所在!!!!

elkay 发表于 2007-2-5 00:16

那你改成下面的试试看:)
/www\.papav\.com\/cooperate\/frame_Nx.*/

mnxinu 发表于 2007-2-5 00:26

回复 #5 elkay 的帖子

这个早就用过了,我不知道版主是否测试了,不好用了,同样会过滤掉其左侧的与LOGO有关的<TD>,导致网页失真!

其实版主还没明白,不是我语法上的问题,而是过滤时出了问题!我现在还在测试!应该说已经确认这个问题了!!

[[i] 本帖最后由 mnxinu 于 2007-2-5 00:27 编辑 [/i]]

mnxinu 发表于 2007-2-5 00:30

不知版主是否亲自测试了CCMOVE网站的情况,不要从上下文或字面中寻找答案:D

elkay 发表于 2007-2-5 00:37

我当然是试过才跟你说的啊,我这里完全没有问题啊

你截个图来看看呢


我先上个我的截图吧,你看看是不是这样的?

[[i] 本帖最后由 elkay 于 2007-2-5 00:44 编辑 [/i]]

mnxinu 发表于 2007-2-5 00:50

回版主

看一下,对比如图!

mnxinu 发表于 2007-2-5 00:51

版主看到了么?
我在想是不是我们的版本不同?我用PREVIEW3时好用的,今天才下的4,我觉得4有这样的问题!3时没有这样的问题!

elkay 发表于 2007-2-5 00:56

特地注册了一个帐号截了个回复主题的图,你试试清空所有的规则,只留下一条试试看

mnxinu 发表于 2007-2-5 01:10

也试过了,同样!

另外,版主是否设置过滤后的替换文字?怎么没看到替换后的文字呢?是不是那片空白还没出来了,有时候需要点时间才能出来的!因为是外部链接过来的!!

mnxinu 发表于 2007-2-5 01:10

版主把你的版本给我发一个吧!我估计我们的版本不同!!

elkay 发表于 2007-2-5 01:15

我的替换文字就是空白啊。

你试试把现在的ini文件改名,重建一个不要用任何其他过滤规则,只是加上过滤这个地方的那一条

版本都是一样的,不会有区别的

mnxinu 发表于 2007-2-5 01:18

版主啊,我就是新产生的ini文件,原来的ini文件升级后不能用了!!!:sad:

要不算了吧,以后再说吧,在这个问题上浪费的时间太多了!

我现在只能“要么就不过滤,要么都过滤掉!!”:sad2:

mnxinu 发表于 2007-2-5 01:19

:sad: :sad: :sad: :sad: :sad: :sad: :sad: :sad: :sad: :sad: :sad: :sad:

elkay 发表于 2007-2-5 01:23

呵呵,我看可能是跟你的系统有关了,升级后原来的ini一直可以用的啊:cold:

mnxinu 发表于 2007-2-5 01:27

是不是IE7的问题,我一直用IE7

mnxinu 发表于 2007-2-5 01:38

用ex0=这种方法应该如何写?
我试了下面的写法,不过滤:
ex0=<frame.*?src="25%.*?>(?:.|\n)*?[url]http://www.papav.com/cooperate/frame_Nx(?:.|[/url]\n)*?<\/frame>

:)

mnxinu 发表于 2007-2-5 01:39

关于“空格”“?”“:”这几个东东,在正则表达式中应该如何写?:loveliness:

mnxinu 发表于 2007-2-5 01:40

为什么添加的ex0=这样的过滤,在修改TW的过滤后,会被删除???

TiGer-X 发表于 2007-2-5 08:42

置顶贴的过滤规则已经有这黑名单过滤的了。
[code]TiGer-x朋友提供的过滤规则
/(\.|\/|_|")(51yes|7town|adpolestar|adjs|co(ope|rpo)rate|ggg|hserver|(g|ma)img|is686|keyrun|stats?|ukaka|zframe|zview)(\.|\/)/
/(\/|\-|_)(\d){2,3}x(\d){2,3}[^0-9]+(asp|html?|js\w?)/
/(online(\d)|(\w){1,4})\.(265|ete).+(_\d+|show)(.php)/
/(dds|biz(\d))\.(sandai|sogua).+(gif|htm|jpg)/
/\.(ku6|mumayi).+(\d{2,}|head\d?)\.htm/[/code]
这里第一条中的 co(ope|rpo)rate 即可匹配 cooperate 和 corporate。

这就是过滤后的网页效果:

Amelia 发表于 2007-2-5 10:50

[quote]原帖由 [i]mnxinu[/i] 于 2/5/2007 01:39 发表
关于“空格”“?”“:”这几个东东,在正则表达式中应该如何写?:loveliness: [/quote]
英文的" "、"?"、":"么?应该分别写成" "、"\?"、":"

mnxinu 发表于 2007-2-6 14:03

[size=4]多谢上两楼朋友的回复!不过我的问题依旧,还没找到原因![/size]

[[i] 本帖最后由 mnxinu 于 2007-2-6 14:06 编辑 [/i]]

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.