返回列表 发帖
我已经屏蔽了FLASH


这里是我截取的源代码
<!--帖子列表页广告开始-->
<tr ><td colspan="6" align="center">
<table><tr><td>
<div class="tableborder">
<!--注意这里不能用fieldset标记,否则管理时的全选功能会失效-->
<iframe id="article_ad_book"  marginwidth=0 marginheight=0  frameborder=0 bordercolor="#000000" scrolling=no src="adbook.php" width=468 height=60></iframe>
</div>
</td></tr>
</table>
</td></tr>
<!--广告结束-->

如何屏蔽这个洞洞的呢?
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

我试了一下直接屏蔽这个文件,不过看起来效果很烂~

/\/(adbook)\.(php)/
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP


/\/
(163|google|gezibottom|mootermedia|yahoo|yahoo200x26|sohu|mop|topad|sina|keyrun|gg|daqi|BOLAA|9v|
8le|sogou|taolai)(\d)*\.html?/


这个规则的最后的那个d是个什么意思,为什么最后的那个*不能包含yahoo200x26的200x26
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

原帖由 elkay 于 2007-1-30 21:54 发表
混神朋友把下面的加入页面过滤规则,使用方法置顶帖有

[quote]ex0=<iframe.*?id="article_ad_.*?>(?:.|\n)*?<\/iframe>
re0=<!--ad-->
ex1=<fieldset.*?style='width:.*?>(?:.|\n)*?<\/fieldset>
re1=<!--ad-->

[/quote]

这个非常好,不过貌似在我再次修改黑名单后自动消失了?关闭TW再打开就没有了~

还需要再次手动在INI中添加~


/\/
(163|google|gezibottom|mootermedia|yahoo|yahoo200x26|sohu|mop|topad|sina|keyrun|gg|daqi|BOLAA|9v|
8le|sogou|taolai)(\d)*\.html?/

我把最后的部分按照你说的.*替换后,发现作用的太大了,所以就换回来了。

而且我发现这样的规则并不能过滤js文件夹中的js后缀文件的广告。

举个例子,比如我的网站www.hanlei.cn,里面有两个google图片广告(左边一个,下边一个),我用的是span的语句(我基本是个小菜,照抄的)。

我最后只好修改了一下,并加了一个语句

/(\/js\/|\/temp\/|\/gg\/|\/html\/|\/)(163|google|gezibottom|mootermedia|firefox|yahoo|yahoo200x26|sohu|mop|topad|sina|keyrun|gg|daqi|BOLAA|9v|8le|db2|sogou|taolai)(\d)*\.html?/
*googlesyndication*

是个笨办法,不过暂时有用,希望你能指点一下~

还有,希望能看看www.sodu.org这个网站的上下广告,广告很好去掉,只在你的第一条规则中加了ulinkjs和ulinkdir,可是不知道怎么回事会留下大片的空白,在1.3中是没有的~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

/(\.|\/|_|")(ad|adima?ge?|adgif|adgraph|adinfo|adlog|adpic|ads?file|aliunion|all4ad|allyes|banner|cpc|cpro|gga?o?|guangga?o?|mygg|newhuagg|p4p|pfp|sms|sponsor|themis|usmsweb|xc|union|unionsky|unionsys|ulinkjs|ulinkdir)(s)?(\d)*(\.|\/|_)/

这个中如何包含


*gg/*
*guangg*


这两个规则一个就是www.hanlei.cn的左边和下边的google广告,第二个就是www.sodu.org的上下白边。


不好意思,我刚刚点错了编辑,改了你的帖子,现在改回来了

[ 本帖最后由 elkay 于 2007-1-31 18:25 编辑 ]
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

说实话,我也看起来好像是包含了,可是实际上,并没有包含。

因为如果没有*gg/*这个规则,那么www.hanlei.cn的左边的一个和下边的google广告就还会出现。
如果没有*guangg*那么www.sodu.org的上下白边就依然在,不过如果加入这个规则,则白边就立刻消失了~

可见这个正则表达式还是有不完善的地方,希望能够仔细推敲一下~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

而且现在的广告越来越多的使用js文件夹的js文件,特别是google广告。

比如http://www.openitpower.com/kabasiji/这个网站的google广告,也是用的这种方式来做的。

在我碰到的网页中,还没有把有用的的js文件放到js文件夹中的,基本都是广告。

因为你在置顶帖子中的规则并没有考虑到这种情况,现在只好把*/js/*作为过滤规则,否则就时不时的蹦出来个google广告~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

如果是页面中的google广告确实能够过滤,不过现在很多的google广告都做成很小的js文件,此时以前的规则确实是不能成功过滤。

因为我也是小菜,所以都是直接COPY的,如果你还有什么特殊的规则,可能确实能够过滤。

比如我前几个回帖中说的*gg/*,*guangg*,*/js/*规则,则确实是没有的话就不能过滤我说的那几个广告。

新的规则我明天再仔细体会,看看是否包含了*gg/*,*guangg*~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP


/(\.|\/|_|")(ads?(\d|code|gif|graph|list|log|puba|file|sence|site|show)|(ali)?union(sky|sys)?|all(4ad|yes)|bdun|banner|cp(c|ro)|(guan|my|newhua)?gg(ao)?|p(4|f)p|sms|sp(onsor||code)|themis|un|usmsweb|xc)(s)?(\d)*(\.|\/|_)/

2月3日最新的规则中,这个双竖杠是有意义的呢,还是疏忽了呢?

而且好像对于TOM的广告没有加入。


/(\.|\/|_|")(ads?(\d|code|gif|graph|list|log|puba|file|sence|site|show)|(ali)?union(sky|sys)?|all(4ad|yes)|bdun|banner|cp(c|ro)|(guan|my|newhua)?gg(ao)?|p(4|f)p|sms|sp(onsor|code)|themis|un|usmsweb|ulink(js|dir)|xc)(s)?(\d)*(\.|\/|_)/
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

还是www.sodu.org,如果把其它所有的规则全部去掉,只留一个*guangg*的话,依然能够去掉所有的广告,请问到底如何把这个加入到置顶的规则中呢?

我看置顶的规则中好像是有这条,但是却不能代替这条。

用置顶的规则,会在原广告位置留下大片的空白,而用*guangg*则是清理干净的。

我现在是实在搞不明白*guangg*和置顶规则中的哪个相似的东东到底有什么区别~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

是不是置顶规则中必须是前后跟有那三个符号的语句才能被过滤,而这个*guangg*则不是?
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

2.6和2.9的过滤规则
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

返回列表