世界之窗论坛's Archiver

elkay 发表于 2007-7-13 14:23

中华网(china.com)的过滤规则

需要下载附件china.rar,并解压缩到filter目录下(具体请看置顶帖)
目录结构如下:
├theworld.exe
└filter
    └china
         └chinadotcomstyle.css

规则如下:
[code]#exd#*.china.com*#<table[^>]*?class="(?:full)?AdsTab(?:le)?[^>]*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
#exd#*.china.com*#<div (:?class|id)="[^>]*?ads">(?:.|\n)*?<\/div>###<!--Ad blocked by TheWorld2-->
#exd#*.china.com*#<table[^>]*?class="headbanner.*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
#exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
#exd#*.china.com*#<link href=[^>]*?endpage/css0610/style.css[^>]*?>###<link href="$tw2f://china/chinadotcomstyle.css" rel="stylesheet" type="text/css" media="all" />
#exd#*.china.com*#<(?:iframe|script)[^>]*?(?:adclient|ads)[^>]*?><\/(?:iframe|script)>[/code]

___

关于本规则的问题或者网站更新无法过滤请直接回帖

非虎 发表于 2007-9-28 19:06

#exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
这条杀伤力太强了,把一些非广告都给删了。


看看我这条怎样,研究了一下午的正则表达式搞出来的:

#exd#*.china.com*#<div id="endtxtad"(?:[\s\S]*?<\/div>){14}###< AD >

适用于过滤文章右侧的广告

zlzlzl 发表于 2008-3-5 12:01

现在打开中华网军事频道有部分广告过滤不了
[url=http://military.china.com/zh_cn/top01/11053249/20080305/14708439.html]http://military.china.com/zh_cn/top01/11053249/20080305/14708439.html[/url][attach]40726[/attach][attach]40727[/attach]

[[i] 本帖最后由 zlzlzl 于 2008-3-5 13:15 编辑 [/i]]

elkay 发表于 2008-3-5 13:56

回复 3# 的帖子

收到,不过暂时不提供规则了,这几天人大会首页上也有新的广告出来,等大会过几天结束了恢复常态再提供规则吧

zlzlzl 发表于 2008-5-2 10:22

为什么还没更新.......

原来的规则开中华网现在是一塌糊涂了

唉,自己又不知道写......

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.