- UID
- 1676
- 帖子
- 7732
- 精华
- 2
- 贡献
- 30
- 推广
- 0
- 有效BUG
- 0
- 来自
- 广西-北海
- 注册时间
- 2005-7-10
|
此规则的威力不错,但我个人感觉这样全放在一条规则中不好,一是降低可读性,二是可能会对某些网页的框架结构产生影响破坏视觉效果。
如果能够将常见的广告推广联盟的代码单独分离出来,以后维护就容易多啦。
例如:
-
- /(?:cpro|vodone|keyrun|union|unstat|p4p|7clink|heima8|alimama|adsence|allyes\.com|un\.265|lianmeng|clickeye|spcode)/
- /\d{2,3}?[-_x]\d{2,3}\.(?:jpg|gif|swf|js)/
- /[\W\d_]ad(?:s|v)?[\W\d_]/
- #ex#<script[^>]*?[\W\d_]ad(?:s|v)?[\W\d_][\s\S]*?</script>###
- #ex#<div[^>]*?[\W\d_]ad(?:s|v)?[\W\d_]((?!<div[^>]*?>)[\s\S])*?</div>###
- #ex#<span[^>]*?[\W\d_]ad(?:s|v)?[\W\d_][\s\S]*?</span>###
复制代码
第一条是针对各种广告推广联盟的过滤代码,如果要更新只需要在最后将新的特征符加上即可。
第二条是针对“数字_数字”之类的图片、flash、脚本进行过滤
第三条是针对 含“ad”、“ads”、“adv”、“ad_”、“ad-”等的连接地址进行拦截下载,可拦截img、js、script等
第四、五、六条分别是对标题中含有“ad”特征符的script、div、span进行过滤。 |
|