返回列表 发帖

[过滤规则] 中华网(china.com)的过滤规则

需要下载附件china.rar,并解压缩到filter目录下(具体请看置顶帖)
目录结构如下:
├theworld.exe
└filter
    └china
         └chinadotcomstyle.css

规则如下:
  1. #exd#*.china.com*#<table[^>]*?class="(?:full)?AdsTab(?:le)?[^>]*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
  2. #exd#*.china.com*#<div (:?class|id)="[^>]*?ads">(?:.|\n)*?<\/div>###<!--Ad blocked by TheWorld2-->
  3. #exd#*.china.com*#<table[^>]*?class="headbanner.*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
  4. #exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
  5. #exd#*.china.com*#<link href=[^>]*?endpage/css0610/style.css[^>]*?>###<link href="$tw2f://china/chinadotcomstyle.css" rel="stylesheet" type="text/css" media="all" />
  6. #exd#*.china.com*#<(?:iframe|script)[^>]*?(?:adclient|ads)[^>]*?><\/(?:iframe|script)>
复制代码


___

关于本规则的问题或者网站更新无法过滤请直接回帖
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

#exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
这条杀伤力太强了,把一些非广告都给删了。


看看我这条怎样,研究了一下午的正则表达式搞出来的:

#exd#*.china.com*#<div id="endtxtad"(?:[\s\S]*?<\/div>){14}###< AD >

适用于过滤文章右侧的广告

TOP

现在打开中华网军事频道有部分广告过滤不了
http://military.china.com/zh_cn/top01/11053249/20080305/14708439.html

[ 本帖最后由 zlzlzl 于 2008-3-5 13:15 编辑 ]
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

TOP

回复 3# 的帖子

收到,不过暂时不提供规则了,这几天人大会首页上也有新的广告出来,等大会过几天结束了恢复常态再提供规则吧

TOP

为什么还没更新.......

原来的规则开中华网现在是一塌糊涂了

唉,自己又不知道写......

TOP

返回列表