中华网(china.com)的过滤规则
需要下载附件china.rar,并解压缩到filter目录下(具体请看置顶帖)目录结构如下:
├theworld.exe
└filter
└china
└chinadotcomstyle.css
规则如下:
[code]#exd#*.china.com*#<table[^>]*?class="(?:full)?AdsTab(?:le)?[^>]*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
#exd#*.china.com*#<div (:?class|id)="[^>]*?ads">(?:.|\n)*?<\/div>###<!--Ad blocked by TheWorld2-->
#exd#*.china.com*#<table[^>]*?class="headbanner.*?>(?:.|\n)*?<\/table>###<!--Ad blocked by TheWorld2-->
#exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
#exd#*.china.com*#<link href=[^>]*?endpage/css0610/style.css[^>]*?>###<link href="$tw2f://china/chinadotcomstyle.css" rel="stylesheet" type="text/css" media="all" />
#exd#*.china.com*#<(?:iframe|script)[^>]*?(?:adclient|ads)[^>]*?><\/(?:iframe|script)>[/code]
___
关于本规则的问题或者网站更新无法过滤请直接回帖 #exd#*.china.com*#<div id="chan_mainBlk_rgt">(?:.|\n)*?<div id="pageFooter">###</div><div id="pageFooter">
这条杀伤力太强了,把一些非广告都给删了。
看看我这条怎样,研究了一下午的正则表达式搞出来的:
#exd#*.china.com*#<div id="endtxtad"(?:[\s\S]*?<\/div>){14}###< AD >
适用于过滤文章右侧的广告 现在打开中华网军事频道有部分广告过滤不了
[url=http://military.china.com/zh_cn/top01/11053249/20080305/14708439.html]http://military.china.com/zh_cn/top01/11053249/20080305/14708439.html[/url][attach]40726[/attach][attach]40727[/attach]
[[i] 本帖最后由 zlzlzl 于 2008-3-5 13:15 编辑 [/i]]
回复 3# 的帖子
收到,不过暂时不提供规则了,这几天人大会首页上也有新的广告出来,等大会过几天结束了恢复常态再提供规则吧 为什么还没更新.......原来的规则开中华网现在是一塌糊涂了
唉,自己又不知道写......
页:
[1]