Board logo

标题: [过滤规则] 百度(baidu.com)的过滤规则(07/25/2008更新) [打印本页]

作者: elkay    时间: 2007-7-13 14:17     标题: 百度(baidu.com)的过滤规则(07/25/2008更新)

需要下载附件baidu.rar,并解压缩到filter目录下(具体请看置顶帖)

目录结构如下:
├theworld.exe
└filter
    └baidu
         └fixbaidu.js

规则如下(感谢needed版主写的自动跳转脚本):
  1. #exd#*.baidu.*#<!--ecombegin-->[\s\S]*?<!--ecomend-->###<!--Ad blocked by TheWorld2-->
  2. #exd#*.baidu.*#<table[^>]*?width="?(?:175|25%)[^>]*?>[\s\S]*?<\/table>###<!--Ad blocked by TheWorld2-->
  3. #exd#*.baidu.*#<table\sborder="0"\scellpadding="0"\scellspacing="0">[\s\S]*?<a[^>]*?baidu\.php[^>]*?>[\s\S]*?<\/table>###<!--Ad blocked by TheWorld2-->
  4. #exd#*.baidu.*#<div[^>]*?width:84%">[\s\S]*?eiv\.baidu\.com[\s\S]*?<\/div>###<!--Ad blocked by TheWorld2-->
  5. #exd#*.baidu.*#<div[^>]*?id="?b?dfs[^>]*?>[\s\S]*?<\/div>(?:<br>)?###<!--Ad blocked by TheWorld2-->
  6. #exd#*.baidu.*#<script>?[^<]*?eiv\.baidu\.com[^<]*?<\/script>###<!--Ad blocked by TheWorld2-->
  7. #exd#*.baidu.*#<div[^>]*?188px[^>]*?>[\s\S]*?<\/div>###<!--Ad blocked by TheWorld2-->
  8. #exd#*.baidu.*#<td\swidth="250[^>]*?>[\s\S]*?<\/td>###<!--Ad blocked by TheWorld2-->
  9. #exd#*.baidu.*#<div[^>]*?background:#F9FDF0[^>]*?>[\s\S]*?<\/div>###<!--Ad blocked by TheWorld2-->
  10. #exd#*.baidu.*#<iframe[^>]*?height=92px[^>]*?><\/iframe>###<!--Ad blocked by TheWorld2-->
  11. #exd#*.baidu.*#<([^>]*?)\s[^>]*?(?:eiv|hc)\.baidu[^>]*?>###<!--Ad blocked by TheWorld2-->
  12. #exd#*mp3.baidu.*#<!--\s广告\s-->[\s\S]*?(<div\sid=leftRes>)###<!--Ad blocked by TheWorld2-->$1
  13. #exd#*mp3.baidu.*#<table[^>]*?id=rightAd[^>]*?>[\s\S]*?<\/table>###<!--Ad blocked by TheWorld2-->
  14. #exd#*video.baidu.*#<div[^>]*?id="rlinks">[\s\S]*?<\/div>###<!--Ad blocked by TheWorld2-->
  15. #exd#*video.baidu.*#<table[^>]*?align="left">[\s\S]*?<\/table>###<!--Ad blocked by TheWorld2-->
复制代码


可选规则
提供给希望改变baidu搜索结果页面的朋友,这个会拉伸页面宽度,可以根据自己显示器的大小说动修改规则中的数字以符合自己的浏览习惯。非必须规则,请选择性使用
最后一个为页面跳转脚本,在极端情况下百度搜索结果第一页会全是广告,这个脚本就是用来跳转的
  1. #exd#*.baidu.*#(\.f\{[^\}]*?width:)32(em[^\}]*?\})###$160$2
  2. #exd#*tieba.baidu.*#(<table\swidth=")75(%[^>]*?>)###$195$2
  3. #exd#*mp3.baidu.*#(#leftRes{padding-left:10px;margin:0;width:)74(%!important;width:)76(%;})###$1100$2100$3
  4. #exd#*.baidu.*#(<\/html>)###<SCRIPT src="$tw2f://baidu/fixbaidu.js" defer></SCRIPT>$1
复制代码


___

更新记录:
2008.07.25 稍微更新一下
2008.01.13 更新了规则。可能会有遗漏,过滤是个双面刃,总会有误杀,很难做到完美。有些朋友总是反应有误杀,所以这个版本放宽了限制,可能会有遗漏
作者: taitan001    时间: 2007-7-14 19:45

搜索页面   顶上有一片空白
作者: lchunghan    时间: 2007-7-19 11:56

[attach]27044[/attach]


叶面 http://post.baidu.com/f?kz=231202447

图片 http://eiv.baidu.com/hyimg/20070716/83265161110.gif

百度更新了
作者: elkay    时间: 2007-7-19 14:47

没有啊,请再使用过滤规则的同时一定要配合置顶帖一楼的黑名单以达到最好的效果
作者: lchunghan    时间: 2007-7-19 14:50

没用 过滤 不掉 !
作者: elkay    时间: 2007-7-19 15:23

哦,我再仔细看看,我这里确实没有发现这个问题
作者: lchunghan    时间: 2007-7-19 15:50

15点30分 后 广告消失了


感觉百度在打游击战
作者: kisazhu    时间: 2007-7-19 23:06

无广告,我也不用filter。。。
作者: evilcat    时间: 2007-7-28 18:55

似乎有问题哦
作者: elkay    时间: 2007-7-31 19:01

修正一个会引起tw假死的问题
作者: 擱淺Δē√瑷    时间: 2007-7-31 20:00

。。难道我这几天COOKIES丢失,网页自动关掉都是这个引起的?
作者: Conet    时间: 2007-8-1 08:33

怪不得我上次死一次,马上更新!
作者: lb5221111    时间: 2007-8-1 10:39

半边是空白的看起来很不爽
不知道可不可也做成像sina一样的把文本都把屏幕拉满呀
作者: bluerain09    时间: 2007-8-1 10:54

这个filter怎么个用法呀,怎么按照楼主的目录结构放好后不起作用呢,麻烦详解一下!!!
作者: elkay    时间: 2007-8-1 14:52

原帖由 lb5221111 于 2007-8-1 10:39 发表 http://bbs.ioage.com/cn/images/common/back.gif
半边是空白的看起来很不爽
不知道可不可也做成像sina一样的把文本都把屏幕拉满呀


你是指哪个页面?有些页面我已经做了处理了
作者: elkay    时间: 2007-8-1 14:53

原帖由 bluerain09 于 2007-8-1 10:54 发表 http://bbs.ioage.com/cn/images/common/back.gif
这个filter怎么个用法呀,怎么按照楼主的目录结构放好后不起作用呢,麻烦详解一下!!!



按照一楼的目录结构在一般使用的情况下是看不出效果的,只有当你搜索特定的词汇的时候才会有效

注:搜索某些特定词汇百度首页将全是推广广告,这个时候就起作用了
作者: bluerain09    时间: 2007-8-6 09:38

多谢版主,听您这么一解释就豁然开朗了。
作者: darrowl    时间: 2007-8-6 16:27

了解一下了。。试试看。
作者: 擱淺Δē√瑷    时间: 2007-8-23 11:49

错误啦  我用了这个黑名单   不加关键词 直接按搜索按钮,打不开百度主页
作者: 擱淺Δē√瑷    时间: 2007-8-23 11:50

我搜索栏是百度引擎, 如果不打关键字,直接按搜索按钮,就会出现个新页面
http://www.baidu.com/s?tn=ichune ... uner_4_pg&pn=10

一直刷新,就是打不开
作者: elkay    时间: 2007-8-23 13:44     标题: 回复 #20 擱淺Δē√瑷 的帖子

没有问题
作者: 擱淺Δē√瑷    时间: 2007-8-23 14:02

我汗~!!  再试试
作者: 擱淺Δē√瑷    时间: 2007-8-23 14:10

下载了本页面的 附件baidu.rar   覆盖原来的文件夹,搞定
作者: 擱淺Δē√瑷    时间: 2007-8-23 14:11

我原来下载的好像是置顶贴里面的集合包, 应该是那有毛病,LZ请检查下
作者: elkay    时间: 2007-8-23 20:10     标题: 回复 #24 擱淺Δē√瑷 的帖子

早就更新过了
作者: 擱淺Δē√瑷    时间: 2007-8-25 23:43

好的 , 多谢版主~!!
作者: fuckworld    时间: 2007-12-19 20:56

楼主你有没有试过在地址栏里搜索百度知道/百度mp3,出现的结果有时要刷新一下才能看到。我用的规则基本上都是你提供的,不知道怎么回事,回头我再试看。
作者: 285900537    时间: 2007-12-20 22:41     标题: 百度(baidu.com)(2007-12-20更新)

我尝试写了一个,练习练习(2007-12-20更新)
  1. #exd#*baidu.com*#<div[^>]*?class="r"[^\n]*?id="bdfs[\d]">[\s\S]*?<\/div><br>###
  2. #exd#*baidu.com*#<div[^\n]*?eiv\.[^\n]*?ff\.js[\s\S]*?<\/div>###
  3. #exd#*baidu.com*#<a[^\n]*?ma\.baidu[^\n]*?rcv\/click[^\n]*?(?:阿里巴巴|通用|慧聪|优酷网)<\/a><br>###
  4. #exd#*baidu.com*#<script[^\n]*?eiv[^\n]*?ff\.js[^\n]*?<\/script>###
  5. #exd#*baidu.com*#<script[^\n]*?swfobject\.js"><\/script>###
  6. #exd#*baidu.com*#<script[^\n]*?(?:ma|eiv|hc|rcv|hyimg|maing)[^\n]*?<\/script>###
  7. #exd#*baidu.com*#<table[^>]*?><tr><td><a[^\n]*?(?:ma|eiv|hc|rcv|click|hyimg|maing)[^\n]*?<\/table><br>###
  8. #exd#*baidu.com*#<!-- begin 广告 -->[^\n]*?<!-- end 广告 -->###
  9. #exd#*baidu.com*#<a[^>]*?ma\.baidu[^\n]*?(?:rcv|eiv)[^\n]*?(?:gif|jpeg|jpg|png|bmp|swf)[^\n]*?<\/a>###
  10. #exd#*baidu.com*#<!-- 广告结束 -->[\s\S]*?(<div id=leftRes>)###$1
  11. #exd#*baidu.com*#<div[^\n]*?click\.php[^\n]*?<\/div>###
  12. #exd#*baidu.com*#<div[^\n]*?baidu\.com\/baidu\.php[^\n]*?<\/div>###
  13. #exd#*z.baidu.com*#<div id=bdfs[\d][^\n]*?<\/div>###
  14. #exd#*z.baidu.com*#<span class=f14>[^\n]*?<\/span>###
  15. #exd#*zhidao.baidu.com*#<div id=bdfs[\d][^\n]*?<\/div>###
  16. #exd#*zhidao.baidu.com*#<span class=f14>[^\n]*?<\/span>###
  17. #exd#*mp3.baidu.com*#<!-- 广告 -->[\s\S]*?<!-- 广告结束 -->###
  18. #exd#*tieba.baidu.com*#<div onClick=[^\n]*?id="bdfs[\d]"[\s\S]*?<\/div>###
  19. #exd#*post.baidu.com*#<div onClick=[^\n]*?id="bdfs[\d]"[\s\S]*?<\/div>###
  20. #exd#*hao123.com*#<a[^>]*?3158\.cn[^\n]*?<\/a>###
  21. #exd#*hao123.com*#<h4>[^\n]*?<\/h4>###
复制代码
有几个小问题
1,image.baidu.com,搜索之后下面会出现绿色的广告框,没有成功去掉,不知如何才好。
2,财经页面(caijing.baidu.com OR cj.baidu.com OR finance.baidu.com)的“商机”广告没有成功去掉。

财经页面需要分别针对三个玉米进行过滤,不知道有没有办法同时对两个玉米的站点进行过滤
比如我写的规则中,zhidao.baidu.com一条和z.baidu.com重复,因为两个玉米都可访问。
又如tupian.baidu.com和image.baidu.com则不需要重复,因为tupian.baidu.com会转向域名image.baidu.com。

[ 本帖最后由 285900537 于 2007-12-20 23:07 编辑 ]
作者: panda0    时间: 2007-12-25 22:41

在地址栏里搜索百度知道/百度mp3,出现的结果有时要刷新一下才能看到,用的规则是置顶黑名单+百度过滤规则 搜索MP3的时候很不方便 elkay看一下
作者: maxint    时间: 2007-12-27 20:20

果然有效,不过没广告了,反而有点不习惯了
作者: elkay    时间: 2007-12-27 20:32     标题: 回复 29# 的帖子

新的规则已经在测试中,我会尽快发布的
作者: ttrry    时间: 2007-12-27 21:36

我用了E版及靖版发的通用规则及百度页面规则,结果经常出现:百度搜索MP3时,不能正常搜索,浏览贴吧时,帖子打开,内容全无,或贴吧主页面出现“ff.js”或其他因过滤部分而显示的网页代码,或出现贴吧最下面  (内容、图片链接、等以后)字体与其他页面正常字体不一样,图片链接未换到下一行,估计可能是最后面因误过滤代码问题而无法调用CSS样式吧~
请E版修改新规则时能考虑这些~  估计可能是  通用规则与BD页面规则有重复间及多条页面规则间有重复过滤赞成的吧~~~
作者: ttrry    时间: 2007-12-27 21:38

或者也可能是代码匹配问题,因为有很多时候是出现问题后,再刷新几次又好了~~~    像页面出现“ff.js”或其他代码,以及贴吧浏览帖子 帖子也全被过滤,都是刷新几次又能看到了~~~
作者: elkay    时间: 2007-12-27 22:03

新规则正在测试,暂时没有发现这类问题,我会扩大测试范围,尽量做好
作者: 285900537    时间: 2008-1-5 01:36

原帖由 ttrry 于 2007-12-27 21:36 发表 http://bbs.ioage.com/cn/images/common/back.gif
我用了E版及靖版发的通用规则及百度页面规则,结果经常出现:百度搜索MP3时,不能正常搜索,浏览贴吧时,帖子打开,内容全无,或贴吧主页面出现“ff.js”或其他因过滤部分而显示的网页代码,或出现贴吧最下面  (内容 ...


通用规则使用置顶帖的那个。我也遇到过你的问题,现在好了。

下面是我所使用的通用规则(和置顶帖的一样,似乎改过,不记得了)
  1. /(?:\.|\/|_|")(?:ads?(?:\d|code|gif|graph|list|log|puba|s?file|sence|site|show)?|(?:ali)?union(?:sky|sys)?|all(?:4ad|yes)|banner|bdun|cp(?:c|ro)|(?:guan|my|newhua)?gg(?:ao)?|keyrun|p(?:4|f)p|sp(?nsor|code))s?(?:\d)*(?:\.|\/|_)/
  2. /[\W_]ads?(?!=&)(?:banner|click|flow|frame|ima?ge?|log|serv(?:er|e)?|stream|type|view|vert(?:ising|ise?ment)?|trix|xchange|wrapper)?s?[\W\d_]/
  3. /(?:\.|\/|_)(?:soft|hot)?ads?(?:s..|img|vert|rotator|view|bot|c_|client|council|gif|graph|images|info|log|pic)?(?:\.|\/|_)/
  4. /(?:\.|\/|_|")(?:a2d|cooperate|corporate|SogouUnion.*|themis|ulink(?:js|dir)|un|usmsweb|xc)s?(?:\d)*(?:\.|\/|_)/
  5. /(?:\/|\-|_)(?:\d){2,3}x(?:\d){2,3}[^0-9]+(?:swf|gif|jpg|js)/
  6. #ex#<![^>]*?MSIEalert[^>]*?>###
  7. #ex#document\.write(?:ln)?\([^\)]*?hasIE_level[\s\S]*?\);\s+###
  8. #ex#<script[^>]*?(?:alimama|clickeye|dotmore|sogou|ifocus|ivansms|vodone|vogate)[^>]*?>[\s\S]*?<\/script>###
  9. #ex#<SCRIPT[^>]*?>[\s\S]*?Please\sUse\sIE[\s\S]*?<\/script>###
复制代码

下面的是我自己写的百度规则,现在自己用没什么大问题,ttrry。E版的规则还没有出来,暂时就先用我的规则顶替吧:)
  1. #exd#*baidu.com*#<div[^>]*?class="r"[^\n]*?id="bdfs[\d]">[\s\S]*?<\/div><br>###
  2. #exd#*baidu.com*#<div[^\n]*?eiv\.[^\n]*?ff\.js[\s\S]*?<\/div>###
  3. #exd#*baidu.com*#<a[^\n]*?ma\.baidu[^\n]*?rcv\/click[^\n]*?(?:阿里巴巴|通用|慧聪|优酷网)<\/a><br>###
  4. #exd#*baidu.com*#<script[^\n]*?eiv[^\n]*?ff\.js[^\n]*?<\/script>###
  5. #exd#*baidu.com*#<script[^\n]*?swfobject\.js"><\/script>###
  6. #exd#*baidu.com*#<table[^>]*?><tr><td><a[^\n]*?(?:ma|eiv|hc|rcv|click|hyimg|maing)[^\n]*?<\/table><br>###
  7. #exd#*baidu.com*#<!-- begin 广告 -->[^\n]*?<!-- end 广告 -->###
  8. #exd#*baidu.com*#<a[^>]*?ma\.baidu[^\n]*?(?:rcv|eiv)[^\n]*?(?:gif|jpeg|jpg|png|bmp|swf)[^\n]*?<\/a>###
  9. #exd#*baidu.com*#<!-- 广告结束 -->[\s\S]*?(<div id=leftRes>)###$1
  10. #exd#*baidu.com*#<div[^\n]*?click\.php[^\n]*?<\/div>###
  11. #exd#*baidu.com*#<div[^\n]*?baidu\.com\/baidu\.php[^\n]*?<\/div>###
  12. #exd#*z.baidu.com*#<div id=bdfs[\d][^\n]*?<\/div>###
  13. #exd#*z.baidu.com*#<span class=f14>[^\n]*?<\/span>###
  14. #exd#*zhidao.baidu.com*#<div id=bdfs[\d][^\n]*?<\/div>###
  15. #exd#*zhidao.baidu.com*#<span class=f14>[^\n]*?<\/span>###
  16. #exd#*mp3.baidu.com*#<!-- 广告 -->[\s\S]*?<!-- 广告结束 -->###
  17. #exd#*tieba.baidu.com*#<div onClick=[^\n]*?id="bdfs[\d]"[\s\S]*?<\/div>###
  18. #exd#*post.baidu.com*#<div onClick=[^\n]*?id="bdfs[\d]"[\s\S]*?<\/div>###
复制代码


[ 本帖最后由 285900537 于 2008-1-5 01:44 编辑 ]
作者: elkay    时间: 2008-1-5 17:53

遇到百度搜索有问题的请把你们的关键字提供一下,以便于我测试,我测试了好久都没有遇到你们上面说的这些问题
作者: 285900537    时间: 2008-1-5 18:05

E版,他用的通用规则不是官方的(也就是置顶的),那个帖子现在沉底了,就是我上一回在过滤群里发出的那两条规则
作者: ttrry    时间: 2008-1-22 17:24

好啊~~~  E版终于更新BD的规则了
作者: qionglaoer    时间: 2008-1-22 18:38

管它的,只要是老大的都更新
作者: lchunghan    时间: 2008-1-22 23:56

更新后太棒了 简直完美  ! 感动的流泪阿
作者: ttrry    时间: 2008-1-26 09:30

#exd#*.baidu.*#<table\sborder="0"\scellpadding="0"\scellspacing="0">[\s\S]*?<a[^>]*?baidu\.php[^>]*?>[\s\S]*?<\/table>###<!--Ad blocked by TheWorld2-->
这条规则在百度网页搜索页(搜索“全脑开发”)会引起误杀~将前几条搜索内容给过滤掉了,然后留下几个<br>产生一段空白~~~搜索有的关键字不会出现问题,有的就会有问题(例如上面我搜索“全脑开发”)
这段代码是过滤哪里广告的哦?因为暂时不清楚,我先将这段代码去掉了
希望楼主能更新修正~

上面被过滤的前几条看来也是BD的广告,不过是放在正常搜索页内容中的,如果要过滤这部分内容建议改成:
#exd#*.baidu.*#<table\sborder="0"\scellpadding="0"\scellspacing="0">[\s\S]*?<a[^>]*?baidu\.php[^>]*?>[\s\S]*?<\/table>(?:<br>)?###<!--Ad blocked by TheWorld2-->

[ 本帖最后由 ttrry 于 2008-1-28 14:27 编辑 ]
作者: elkay    时间: 2008-1-26 15:18     标题: 回复 41# 的帖子

改成你那样某些页面会出问题的,已经考虑到了,暂时只能这样,以后想到办法再说吧
作者: konglingzi    时间: 2008-1-27 19:46

会把百度知道的问题和答案都过滤掉了,过于强力了。 如图,上面是未加规则,下面是加了规则。有时不停刷新N次可以刷出问题和答案来。


[attach]39211[/attach]

[attach]39212[/attach]
作者: elkay    时间: 2008-1-27 22:11     标题: 回复 43# 的帖子

没有任何问题,这次的规则我测试了很久了
作者: tt911    时间: 2008-2-21 16:08     标题: 这个二级页面又不行了

http://zhidao.baidu.com/question/46553266.html
真是郁闷,这个狗知道怎么这这么多广告啊
作者: elkay    时间: 2008-2-21 16:37     标题: 回复 45# 的帖子

没有问题,无法重现
作者: tt911    时间: 2008-2-25 19:24     标题: 哪个页面不存在了

多谢老大费心了
对有的页面又正常了
作者: ttrry    时间: 2008-3-11 18:50

百度用户信息中心,查看用户资料时,无法查看“贴吧发言”、“知道回答”、“百科贡献”等项~~~
停用广告过滤就好了~
作者: ttrry    时间: 2008-3-11 19:01

  1. #ex#<[\s]*?iframe[^>]*?\s(height|width)[\s]*?=[\s]*?(\x22|\x27)?[\s]*?\d{1}[\s]*?(\x22|\x27)?(?=\D)[^>]*?>(<\/iframe[\s]*?>)?###<!--Ad~TW-->
复制代码
这条代码的问题~~~
作者: elkay    时间: 2008-3-11 21:36     标题: 回复 49# 的帖子

这个问题可以去发布这个规则的帖子反应,看看作者有没有办法修复
作者: ttrry    时间: 2008-3-11 23:08

49楼的那条规则应该是很早以前有人在论坛上发布的常见通用页面过滤规则,现在找不到了~
估计是已经被淘汰了,那我也把它淘汰了吧~~~
作者: ttrry    时间: 2008-3-12 22:20

使用广告过滤基础黑名单、常见通用过滤规则及本帖百度过滤规则,访问贴吧某帖子(http://tieba.baidu.com/f?kz=337717747)100%死掉~~~  CPU占用100%。
TW版本:2.1.1.9
系统:XPSP2
杀软:金山毒霸套装(已将杀软防火墙有关服务及进程全部关闭)
开黑名单广告过滤,访问http://tieba.baidu.com/f?kz=337717747则100%假死,CPU100%,只有任务管理器关闭进程;关闭黑名单广告过滤则不再死掉~~~
请E版帮忙调测~谢谢!~
作者: elkay    时间: 2008-3-13 00:13     标题: 回复 52# 的帖子

试了一下,页面打开会稍微慢一点,但是不会假死啊,几秒钟就正常了
作者: ttrry    时间: 2008-3-13 11:14

我这里表现为页面内容基本打开后,TW就死掉~
看图,而且是每次都一样~
作者: ttrry    时间: 2008-3-13 11:29

经测试,是#exd#*.baidu.*#(<\/html>)###<SCRIPT src="$tw2f://baidu/fixbaidu.js" defer></SCRIPT>$1这条规则引起的~去掉这条规则即不再死掉~
请E版再帮忙测试~~~
我这里fixbaidu.js内容,就是在本帖下载的~:
var tw2_pageContent = document.body.innerText;
if(/下一页/.test(tw2_pageContent)){
try{
     tw2_pageContent =tw2_pageContent.replace(/\s/g,"").replace(/[\s\S]+篇,用时(.*?)1\[2\]\[3\][\s\S]+/,"$1");
        if(tw2_pageContent.length <10){
                var tw_curUrl =  document.location.href;
                if(/pn=0/.test(tw_curUrl)){
                        tw_curUrl = tw_curUrl.replace(/pn=0/g,"");
                }
                document.location.href = tw_curUrl + "&tn=ichuner_4_pg&pn=10";
        }
}
catch(e){}
}

把那个网页的代码存下来,然后把最后的</html>改为
<SCRIPT language="javascript">
var tw2_pageContent = document.body.innerText;
if(/下一页/.test(tw2_pageContent)){
try{
     tw2_pageContent =tw2_pageContent.replace(/\s/g,"").replace(/[\s\S]+篇,用时(.*?)1\[2\]\[3\][\s\S]+/,"$1");
        if(tw2_pageContent.length <10){
                var tw_curUrl =  document.location.href;
                if(/pn=0/.test(tw_curUrl)){
                        tw_curUrl = tw_curUrl.replace(/pn=0/g,"");
                }
                document.location.href = tw_curUrl + "&tn=ichuner_4_pg&pn=10";
        }
}
catch(e){}
}
</SCRIPT>
保存后,使用IE及TW打开那个网页都是会假死~~~   是不是这段代码在遇到网页中某些代码时出现了死循环~~~

[ 本帖最后由 ttrry 于 2008-3-13 18:48 编辑 ]
作者: elkay    时间: 2008-3-13 14:11     标题: 回复 55# 的帖子

好的,我研究研究
作者: 天竺葵    时间: 2008-4-18 10:59

要更新一下了吧,百度知道顶有广告了。右侧也有的。
作者: daysky    时间: 2008-4-24 13:49

应该更新了
作者: elkay    时间: 2008-4-24 16:39

知道了,會更新的
作者: earn555    时间: 2008-6-5 00:08     标题: 弄了半天,这是我的百度过滤

乱来的,反正现在我能用,还没问题。
  1. #exd#*baidu.com*#width:32em;###
  2. #exd#*baidu.com*#width="72%"###
  3. #exd#*baidu.com*#<div\sstyle="margin:0[\s\S]*?<\/div>###<!-- 上广告 -->
  4. #exd#*baidu.com*#id="rightAd"[\s\S]*?<\/table>###></table><!-- Ad -->
  5. #exd#*baidu.com*#<table\swidth="25%"[\s\S]*id=ScriptDiv[\s\S]*?<\/table>###<!-- Ad -->
  6. #exd#http://zhidao.baidu.com*#<div\sclass="r"\sid="bdfs\d">[\s\S]*?<\/div>
  7. ###<!-- 知道右广告 -->
复制代码

作者: zbzcb    时间: 2008-6-16 13:32

广告过滤得很干净,我很喜欢~~~
只是在http://list.mp3.baidu.com/topso/mp3topsong.html?id=1?top2这个界面的顶部很乱,希望能修改一下~~~
作者: elkay    时间: 2008-7-13 14:46

更新一下
作者: 爱可以很久    时间: 2008-7-14 10:13

更新的内容有哪些,可否说明一下。
作者: 爱可以很久    时间: 2008-7-14 14:31

贴吧打开帖子右侧会有广告图片..就不截图了,以前的规则就能屏蔽掉,希望LZ确认一下。
作者: elkay    时间: 2008-7-14 16:07     标题: 回复 64# 爱可以很久 的帖子

难道连提供一下广告遗漏的详细信息都不愿意么?既然如此,我也懒得一一去测试了,你自己想办法吧
作者: tinham    时间: 2008-7-17 18:08

我觉得大E的语气完全不必这样
作者: lchunghan    时间: 2008-7-25 12:46

老的还比较干净 !更新后好些地方不能过滤了 !

[ 本帖最后由 lchunghan 于 2008-7-25 12:48 编辑 ]
作者: sh1991    时间: 2008-8-1 13:46

这个是在拦截百度搜索上的广告吗
作者: dengcb179    时间: 2008-8-1 15:22

牛人啊,呵呵
作者: xujun99663311    时间: 2008-8-14 15:34

感觉使用起来有点麻烦哦
作者: xiaoqiang527    时间: 2008-8-21 20:01

盼望出个傻瓜安装包。呵呵
作者: 八阵图    时间: 2008-8-23 16:14

提示: 作者被禁止或删除 内容自动屏蔽
作者: lsyer    时间: 2008-9-12 18:32

如图
贴吧发帖 回帖的框子消失了~
作者: elkay    时间: 2008-9-12 19:15

没有问题
作者: wongker    时间: 2008-9-24 09:53



这段时间一直研究网页过滤了,发现了自己之前忽略了2点
一个是规则累计下失效规则没有去除干净
另一个是注释不完整导致添加近似却相对重复的规则

有问题的同学们可以看看是不是常备一份基本清单,以网站为分界,时常清理

还有就是发现百度等似乎对广告Gif和SWF的随机变换,有时候提取的检索字符串会被绕过,当然大E的规则还是很赞的。

说下自己学习过程,因为喜欢清爽自由的冲浪,所以常和兄长一块整理网页重写过滤规则,添加得乱七八糟,可读性就很差了,尤其是更新被回避的旧检索字符串时更是如此。加之个人同时应用Prox和Adm这类跨浏览器网页重写过滤工具,夸张的广告倒是少了,就是误过滤有点多了,因此建议工作室能稍稍加强黑名单和白名单的可读性,方便我等懒人快速定位和及时去除无效元素,能更多的方便后来人,尤其是最近了解到Firefox 的 Adblock Plus 插件,有中国的朋友维护自动更新列表,希望工作室和大E也搞个类似的,哈哈,有点奢想了。。。

一家之言,见笑。



[ 本帖最后由 wongker 于 2008-9-24 10:05 编辑 ]
作者: 八阵图    时间: 2008-9-25 21:20

提示: 作者被禁止或删除 内容自动屏蔽
作者: april    时间: 2008-10-16 14:51

没过滤明白,放弃了
作者: xujun99663311    时间: 2008-11-7 00:35     标题: 管理员,我的怎么没有效果啊,百度知道的广告还在啊


帮帮我啊
作者: cn2002cn    时间: 2008-11-7 16:52

现在的这个过滤包已经不好用了,因为百度的广告更加牛逼更加流氓了..
请高手重新做一下吧...谢谢了
作者: lzpang    时间: 2008-11-23 21:38

谢谢楼主!!!!

辛苦了!!!

给我这个菜鸟的帮助!!!
作者: noonoo    时间: 2008-11-27 00:30     标题: 呜哈哈

呜哈哈
作者: jym2005    时间: 2009-1-16 15:15

提示: 作者被禁止或删除 内容自动屏蔽
作者: 夜雨朦胧    时间: 2009-2-6 10:27

谢谢楼主,真的有用吗?
作者: luciferkid    时间: 2009-3-8 18:36

有时候,莫名其妙就弹出一个视屏的广告,网页界面右下角
点击关闭优惠弹出一个网页
作者: ylym8888    时间: 2009-4-27 11:06

似乎有问题哦
作者: smile16888    时间: 2009-5-28 16:26

本帖最后由 smile16888 于 2009-5-28 16:34 编辑

稍微写了下新规则,有遗漏的可以反馈:
  1. #exd#*baidu.com*#<table[^>]*?rightAd[^>]*?>(?:[\s\S]*?<\/table>){3}###<!--ad blocked by tw2-->
  2. #exd#*baidu.com*#<div[^>]*?><script>[^>]*?ff\.js[\s\S]*?<\/div>###<!--ad blocked by tw2-->
  3. #exd#*baidu.com*#<script>[^>]*?click\.php[\s\S]*?<\/script>###<!--ad blocked by tw2-->
  4. #exd#*baidu.com*#<div[^>]*?id="(?:dMA|ad_fd|ecomAdDiv|ad)"[^>]*?>[\s\S]*?<\/div>###<!--ad blocked by tw2-->
复制代码





欢迎光临 世界之窗论坛 (http://bbs.theworld.cn/) Powered by Discuz! 7.2