返回列表 发帖
原帖由 混神 于 2007-1-30 21:36 发表


这个规则的最后的那个d是个什么意思,为什么最后的那个*不能包含yahoo200x26的200x26


应该是"\d"这个表示匹配数字,正则式中"*"是没有意义的,如果你要匹配 0 次或一次的任何字符要用".*",你修改一下再试试呢

原帖由 big 于 2007-1-30 21:23 发表
我用了楼主的公式,很好用,谢谢。<br />
我也照猫画虎一番,下面的可以红火蚁中文上的猫扑链接(很烦人,没有正经东西)<br />
/(union)\.(mop)\.(com)(\/)(ushow)\.(jsp?idea=)*(&user=)*/ ...


只有符合自己的才是最好的,

原帖由 renior 于 2007-1-30 21:29 发表
搂住能过滤中天在线论坛的弹出式广告吗,否则拖拽功能用不了,
论坛地址 http://bbs.366tian.net


这个没有广告啊,截图说明一下?

[ 本帖最后由 elkay 于 2007-1-30 22:03 编辑 ]

TOP

原帖由 xuyong 于 2007-1-30 21:07 发表
一只用 elkay 的正则式,看了elkay 所写的正则式简易教程,有点理解了,谢谢!



不客气,希望对你有用

希望每个人写出符合自己上网习惯的过滤规则,这样就最好

TOP

原帖由 elkay 于 2007-1-30 16:48 发表


是的,这个网站是被过滤了,因为地址中含有union,目前据说域名白名单还没起作用,所以只能在上这个网站的时候临时关闭广告过滤功能

看了对话,看来我用这个的时候只能重拾IE了

TOP

原帖由 george136 于 2007-1-30 22:22 发表

看了对话,看来我用这个的时候只能重拾IE了


你可以试试再黑名单中加入
@@你要访问的网站域名

不保证能用,呵呵,如果不行我也没有办法

TOP

原帖由 elkay 于 2007-1-30 21:54 发表
混神朋友把下面的加入页面过滤规则,使用方法置顶帖有

[quote]ex0=<iframe.*?id="article_ad_.*?>(?:.|\n)*?<\/iframe>
re0=<!--ad-->
ex1=<fieldset.*?style='width:.*?>(?:.|\n)*?<\/fieldset>
re1=<!--ad-->

[/quote]

这个非常好,不过貌似在我再次修改黑名单后自动消失了?关闭TW再打开就没有了~

还需要再次手动在INI中添加~


/\/
(163|google|gezibottom|mootermedia|yahoo|yahoo200x26|sohu|mop|topad|sina|keyrun|gg|daqi|BOLAA|9v|
8le|sogou|taolai)(\d)*\.html?/

我把最后的部分按照你说的.*替换后,发现作用的太大了,所以就换回来了。

而且我发现这样的规则并不能过滤js文件夹中的js后缀文件的广告。

举个例子,比如我的网站www.hanlei.cn,里面有两个google图片广告(左边一个,下边一个),我用的是span的语句(我基本是个小菜,照抄的)。

我最后只好修改了一下,并加了一个语句

/(\/js\/|\/temp\/|\/gg\/|\/html\/|\/)(163|google|gezibottom|mootermedia|firefox|yahoo|yahoo200x26|sohu|mop|topad|sina|keyrun|gg|daqi|BOLAA|9v|8le|db2|sogou|taolai)(\d)*\.html?/
*googlesyndication*

是个笨办法,不过暂时有用,希望你能指点一下~

还有,希望能看看www.sodu.org这个网站的上下广告,广告很好去掉,只在你的第一条规则中加了ulinkjs和ulinkdir,可是不知道怎么回事会留下大片的空白,在1.3中是没有的~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

原帖由 elkay 于 2007-1-30 22:29 发表


你可以试试再黑名单中加入
@@你要访问的网站域名

不保证能用,呵呵,如果不行我也没有办法

不光这个网站了,主要这个网站的在线,在很多论坛都有支持,这个不是用上面方法解决得了的吧

TOP

原帖由 混神 于 2007-1-31 00:37 发表
这个非常好,不过貌似在我再次修改黑名单后自动消失了?关闭TW再打开就没有了~
还需要再次手动在INI中添加~

我把最后的部分按照你说的.*替换后,发现作用的太大了,所以就换回来了。

而且我发现这样的规则并不能过滤js文件夹中的js后缀文件的广告。

举个例子,比如我的网站www.hanlei.cn,里面有两个google图片广告(左边一个,下边一个),我用的是span的语句(我基本是个小菜,照抄的)。

我最后只好修改了一下,并加了一个语句


会自动消失的问题我也没办法,希望下个版本的tw解决吧

建议你不要用".*"用"?",因为你用"*"是没有意义的,正则式中通配符是无效的,还有这条规则主要是针对yahoo1.htm、yahoo2.htm这样的文件,只能用”(\d)? “表示在yahoo后面可以是直接跟.htm,或者是跟一个一位数字再跟.htm,如果你用".*"的话就会变成yahoo后面可以跟任何位数的任何字符,很多正常内容都会被过滤

你的网站上的google广告不需要再加规则了,我置顶帖里的可以过滤


"(\/js\/|\/temp\/|\/gg\/|\/html\/|\/)"
这一段应该写成
"\/(js|temp|gg|html)\/"
这样就简单多了,其实这一段没必要加了

js文件并不是全部都是广告,所以要不要过滤要看实际情况,全都过滤掉很多网站就不正常了

过滤之后留下空白的可以用页面过滤规则去掉

TOP

用ie上http://bbs.366tian.net谈出如图广告,用tw则有时弹有时不弹(不知道是不是被阻止了)
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

TOP

原帖由 renior 于 2007-1-31 16:06 发表
用ie上http://bbs.366tian.net谈出如图广告,用tw则有时弹有时不弹(不知道是不是被阻止了)


应该过滤掉了,你用tw浏览会看到状态栏显示这个网站有过滤掉内容。

TOP

/(\.|\/|_|")(ad|adima?ge?|adgif|adgraph|adinfo|adlog|adpic|ads?file|aliunion|all4ad|allyes|banner|cpc|cpro|gga?o?|guangga?o?|mygg|newhuagg|p4p|pfp|sms|sponsor|themis|usmsweb|xc|union|unionsky|unionsys|ulinkjs|ulinkdir)(s)?(\d)*(\.|\/|_)/

这个中如何包含


*gg/*
*guangg*


这两个规则一个就是www.hanlei.cn的左边和下边的google广告,第二个就是www.sodu.org的上下白边。


不好意思,我刚刚点错了编辑,改了你的帖子,现在改回来了

[ 本帖最后由 elkay 于 2007-1-31 18:25 编辑 ]
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

[quote]/(\.|\/|_|")(ad|adima?ge?|adgif|adgraph|adinfo|adlog|adpic|ads?file|aliunion|all4ad|allyes|banner|cpc|cpro|gga?o?|guangga?o?|mygg|newhuagg|p4p|pfp|sms|sponsor|themis|usmsweb|xc|union|unionsky|unionsys|ulinkjs|ulinkdir)(s)?(\d)*(\.|\/|_)/

这个中如何包含

*gg/*
*guangg*

这两个规则一个就是www.hanlei.cn的左边和下边的google广告,第二个就是www.sodu.org的上下白边。[/quote]

已经包含了啊
gga?o?同时匹配ggao和gg

页面上留下的空白需要用页面过滤规则,下面的可以去掉网页左边的google广告空白


  1. ex0=<div.*?id="Side_GooGle.*?>(?:.|\n)*?<\/div>
  2. re0=<!--ad-->
复制代码

[ 本帖最后由 elkay 于 2007-1-31 18:28 编辑 ]

TOP

说实话,我也看起来好像是包含了,可是实际上,并没有包含。

因为如果没有*gg/*这个规则,那么www.hanlei.cn的左边的一个和下边的google广告就还会出现。
如果没有*guangg*那么www.sodu.org的上下白边就依然在,不过如果加入这个规则,则白边就立刻消失了~

可见这个正则表达式还是有不完善的地方,希望能够仔细推敲一下~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

返回列表