Board logo

标题: [过滤规则] 中华网(china.com)的过滤规则 [打印本页]

作者: elkay    时间: 2007-7-13 14:23     标题: 中华网(china.com)的过滤规则

需要下载附件china.rar,并解压缩到filter目录下(具体请看置顶帖)
目录结构如下:
├theworld.exe
└filter
    └china
         └chinadotcomstyle.css

规则如下:
  1. #exd#*.china.com*#<table[^>]*?class="(?:full)?AdsTab(?:le)?[^>]*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
  2. #exd#*.china.com*#<div (:?class|id)="[^>]*?ads">(?:.|\n)*?<\/div>###<!--Ad blocked by TheWorld2-->
  3. #exd#*.china.com*#<table[^>]*?class="headbanner.*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
  4. #exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
  5. #exd#*.china.com*#<link href=[^>]*?endpage/css0610/style.css[^>]*?>###<link href="$tw2f://china/chinadotcomstyle.css" rel="stylesheet" type="text/css" media="all" />
  6. #exd#*.china.com*#<(?:iframe|script)[^>]*?(?:adclient|ads)[^>]*?><\/(?:iframe|script)>
复制代码


___

关于本规则的问题或者网站更新无法过滤请直接回帖
作者: 非虎    时间: 2007-9-28 19:06

#exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
这条杀伤力太强了,把一些非广告都给删了。


看看我这条怎样,研究了一下午的正则表达式搞出来的:

#exd#*.china.com*#<div id="endtxtad"(?:[\s\S]*?<\/div>){14}###< AD >

适用于过滤文章右侧的广告
作者: zlzlzl    时间: 2008-3-5 12:01

现在打开中华网军事频道有部分广告过滤不了
http://military.china.com/zh_cn/top01/11053249/20080305/14708439.html[attach]40726[/attach][attach]40727[/attach]

[ 本帖最后由 zlzlzl 于 2008-3-5 13:15 编辑 ]
作者: elkay    时间: 2008-3-5 13:56     标题: 回复 3# 的帖子

收到,不过暂时不提供规则了,这几天人大会首页上也有新的广告出来,等大会过几天结束了恢复常态再提供规则吧
作者: zlzlzl    时间: 2008-5-2 10:22

为什么还没更新.......

原来的规则开中华网现在是一塌糊涂了

唉,自己又不知道写......




欢迎光临 世界之窗论坛 (http://bbs.theworld.cn/) Powered by Discuz! 7.2