返回列表 发帖
原帖由 xwhyc 于 2007-2-1 17:15 发表
请问中新网http://www.chinanews.com.cn/的flash用黑名单如何过滤


我一般是不显示flash的,所以不会有flash的广告,如果你需要flash显示的,就过滤掉这个网站的swf文件好了

原帖由 evilcat 于 2007-2-1 19:41 发表
e版


还是这个

www.pingshu8.com

这个是有广告的,如果没有点一下连接肯定会有的。TW并有拦截这个弹出的网页


看到了,好像不是每次都有,我点了好几个才出来一个连接,这个应该是后台脚本在控制,我想想办法吧

TOP

e版


还是这个

www.pingshu8.com

这个是有广告的,如果没有点一下连接肯定会有的。TW并有拦截这个弹出的网页

TOP

没有吧,强制刷新看看,霏凡正常啊

TOP

霏凡的错位了
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

TOP

请问中新网http://www.chinanews.com.cn/的flash用黑名单如何过滤

TOP

原帖由 混神 于 2007-2-1 01:45 发表
如果是页面中的google广告确实能够过滤,不过现在很多的google广告都做成很小的js文件,此时以前的规则确实是不能成功过滤。

因为我也是小菜,所以都是直接COPY的,如果你还有什么特殊的规则,可能确实能够过 ...


类似gg、guanggao、guangg、ggao这样的都可以匹配到,但是"js"是不会匹配的,这个目录下很多内容都是正常脚本,没有了这些一些网站会出问题的,建议不要过滤,还是根据网站的具体情况单独过滤掉广告脚本比较好

TOP

如果是页面中的google广告确实能够过滤,不过现在很多的google广告都做成很小的js文件,此时以前的规则确实是不能成功过滤。

因为我也是小菜,所以都是直接COPY的,如果你还有什么特殊的规则,可能确实能够过滤。

比如我前几个回帖中说的*gg/*,*guangg*,*/js/*规则,则确实是没有的话就不能过滤我说的那几个广告。

新的规则我明天再仔细体会,看看是否包含了*gg/*,*guangg*~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

原帖由 混神 于 2007-1-31 21:42 发表
而且现在的广告越来越多的使用js文件夹的js文件,特别是google广告。

比如http://www.openitpower.com/kabasiji/这个网站的google广告,也是用的这种方式来做的。

在我碰到的网页中,还没有把有用的的js文 ...


置顶帖的又更新过了你试一下

另外有广告的时候先强制刷新一下试试,因为我访问你提供的网站都没有google的广告了,实际上google广告一开始就考虑到了,所以早就过滤了啊

TOP

而且现在的广告越来越多的使用js文件夹的js文件,特别是google广告。

比如http://www.openitpower.com/kabasiji/这个网站的google广告,也是用的这种方式来做的。

在我碰到的网页中,还没有把有用的的js文件放到js文件夹中的,基本都是广告。

因为你在置顶帖子中的规则并没有考虑到这种情况,现在只好把*/js/*作为过滤规则,否则就时不时的蹦出来个google广告~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

说实话,我也看起来好像是包含了,可是实际上,并没有包含。

因为如果没有*gg/*这个规则,那么www.hanlei.cn的左边的一个和下边的google广告就还会出现。
如果没有*guangg*那么www.sodu.org的上下白边就依然在,不过如果加入这个规则,则白边就立刻消失了~

可见这个正则表达式还是有不完善的地方,希望能够仔细推敲一下~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

[quote]/(\.|\/|_|")(ad|adima?ge?|adgif|adgraph|adinfo|adlog|adpic|ads?file|aliunion|all4ad|allyes|banner|cpc|cpro|gga?o?|guangga?o?|mygg|newhuagg|p4p|pfp|sms|sponsor|themis|usmsweb|xc|union|unionsky|unionsys|ulinkjs|ulinkdir)(s)?(\d)*(\.|\/|_)/

这个中如何包含

*gg/*
*guangg*

这两个规则一个就是www.hanlei.cn的左边和下边的google广告,第二个就是www.sodu.org的上下白边。[/quote]

已经包含了啊
gga?o?同时匹配ggao和gg

页面上留下的空白需要用页面过滤规则,下面的可以去掉网页左边的google广告空白


  1. ex0=<div.*?id="Side_GooGle.*?>(?:.|\n)*?<\/div>
  2. re0=<!--ad-->
复制代码

[ 本帖最后由 elkay 于 2007-1-31 18:28 编辑 ]

TOP

/(\.|\/|_|")(ad|adima?ge?|adgif|adgraph|adinfo|adlog|adpic|ads?file|aliunion|all4ad|allyes|banner|cpc|cpro|gga?o?|guangga?o?|mygg|newhuagg|p4p|pfp|sms|sponsor|themis|usmsweb|xc|union|unionsky|unionsys|ulinkjs|ulinkdir)(s)?(\d)*(\.|\/|_)/

这个中如何包含


*gg/*
*guangg*


这两个规则一个就是www.hanlei.cn的左边和下边的google广告,第二个就是www.sodu.org的上下白边。


不好意思,我刚刚点错了编辑,改了你的帖子,现在改回来了

[ 本帖最后由 elkay 于 2007-1-31 18:25 编辑 ]
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

返回列表