[color=red]//by mutalisker[/color]
[color=red]将来会有的[/color] url0=*ad*
会把一些论坛的sad.gif屏蔽掉哦 疑问很大,如果要象adblock那样基于正则屏蔽链接该如何写呢?
url0这样的方式是否只支持*?通配符而不支持正则。
ex0这样的是否只是针对Html内容?如果要过滤符合某规则链接的所有类型对象例如图片、iframe、swf,岂不是要写很长? 顺带一句,
BETA4第一版,里面的*.ad.*会将proadist之类的字符串过滤掉。 在设置的编辑控件中好像不能区分正则是不是?:sad2: Firefox的AdBlock用前后加/的方式区分正则表达式,Maxthon2则是有个单独选项。
TheWorld现在黑名单还不支持正则表达式,而“HTML过滤”这种方式书写规则太麻烦,也缺乏通用性——Firefox(AdBlock)和Maxthon2的正则表达式过滤规则可以通用,TheWorld就要全部推倒重来。 [quote]原帖由 [i]Amelia[/i] 于 2007-1-11 19:20 发表
Firefox的AdBlock用前后加/的方式区分正则表达式,Maxthon2则是有个单独选项。
TheWorld现在黑名单还不支持正则表达式,而“HTML过滤”这种方式书写规则太麻烦,也缺乏通用性——Firefox(AdBlock)和Maxthon2 ... [/quote]
是啊,有些习惯既然大家都接受了,借鉴一下也挺好的啊。
当然HTML过滤作为一种补充也是不错的,至少这种方式过滤网页内容看来也是挺强大的。 [quote]原帖由 [i]Amelia[/i] 于 2007-1-11 19:20 发表
Firefox的AdBlock用前后加/的方式区分正则表达式,Maxthon2则是有个单独选项。
TheWorld现在黑名单还不支持正则表达式,而“HTML过滤”这种方式书写规则太麻烦,也缺乏通用性——Firefox(AdBlock)和Maxthon2 ... [/quote]
还是兄弟语文好,说出了我想说的,呵呵 :sad: 确实很难,俺也不懂~ 不懂,等懂的做出来用~ 1. TW 正则的 . 不能匹配 \n 吗?
否则每次都要用 [.\n] 实在不方便. 反正 HTML 中 \n 没什么实际意义. [color=red]//by mutalisker 这个。。。。还是标准的东西不改为妙,不希望用户用之前先要读一个很长的readme才行
[/color]
2. 是否 replace 中也是使用 $1-$10 引用 () [color=red]//by mutalisker 现在就是支持的[/color]
3. ex 的最大上限是多少? [color=red]//by mutalisker,1024,不够用以后再改[/color]
4. \d \w \W \s 等这些都支持吗? [color=red]//by mutalisker,试一下就知道了,都支持的[/color]
5. 如你的 ex0=<table.*?width="25%.*?>(?:.|\n)*?[url=http://ma.baidu.com/ma/rcv/click.php(?:.|]http://ma.baidu.com/ma/rcv/click.php(?:.|[/url]\n)*?<\/table> [color=red]//by mutalisker,我写这个完全就是个说明性质的例子,只要大家明白意思就好了。不过如果有修改建议不妨提出来让我学习一下
[/color]如果一个页面中 有 <table width="25%">......<table width="25%">.....</table>.....</table> 这样的代码, 如何做到不会匹配成:
<table width="25%">......<table width="25%">.....</table>
需要严格保证匹配的 TAG 的完整.
6. 这些 ex 都是对所有网站生效的吗? match_url 是个很必要的. [color=red]//by mutalisker,以后会改进[/color]
7. 普通过滤与 HTML 过滤优先级如何? HTML 过滤优先级又如何? [color=red]//by mutalisker,目前普通过滤其实就是TW程序根据用户输入的通配符的黑白名单来自动生成了一个正则表达式。优先级方面,是先执行普通的,再执行ex的[/color]
[color=#ff0000][/color]
[color=black]smilefly 回复: 因为做了不少马桶的过滤, 对这些有些了解. 马桶中有个 Bound 参数, 可以用 $TAG(XXX) 保证匹配最内层的 <XXX.*?</XXX> 及 <XXX.*?>. 如果没有这样的限制, 过滤Table, Div什么的有时真的很容易出现误过滤. 我最希望 $TAG 再细分, 例如 $TAG1(XXX) 匹配有关闭标记的XXX元素, $TAG2(XXX)匹配无关闭标记的. 如对<div id="ad"><div></div></div>, 可以使用 $TAG1(XXX) 来匹配整个id="ad" 的 DIv 层.[/color]
[color=#000000][/color]
[color=red]//by mutalisker:,对这个$TAG1(XXX)没搞明白,这个东西用正则来写就好了,何必还需要自己另加一套规则呢?
[/color]
[color=#000000][/color] [quote]原帖由 [i]Amelia[/i] 于 2007-1-11 19:20 发表
Firefox的AdBlock用前后加/的方式区分正则表达式,Maxthon2则是有个单独选项。
TheWorld现在黑名单还不支持正则表达式,而“HTML过滤”这种方式书写规则太麻烦,也缺乏通用性——Firefox(AdBlock)和Maxthon2 ... [/quote]
我也是这个意思,希望可以做成和FF2的AdBlock相同的写法。 恩,和MT2的那个很相近,估计可以有一样的效果。。不过使用不大方便。。 严重期待黑名单~~~ 能对不同的站点制定不同的过滤规则吗? 如果对所有网站的网页都用那一套规则过滤一遍,是不是效率有点低。。。?
//by mutalisker 这个也在考虑中,要加很容易,只是在观望这个有多大的需求 忘了在哪个浏览器看到的一个功能,觉得不错。
就是屏蔽非本站的图片及flash等(如:打开[url=http://www.ioage.com]www.ioage.com[/url],但是有图片是来自163.com或其它的就屏蔽掉),这样的一般多是广告,当然白名单也是要的,也有不少论坛引用别的网站图片的。
还有一点就是,建议把过滤规则的设置写简单点,要不然就是非专业人士勿用了。
[[i] 本帖最后由 microcosm 于 2007-1-22 15:04 编辑 [/i]] 希望尽快能增强过滤功能!现在上网总是往外跳浮动广告和icast~好烦人~~ 我用2.0怎么没办法,增加黑名单啊 为了方便大家使用,能不能做一个相对通用的配置文件 ex0=<table.*?width="25%.*?>(?:.|\n)*?[url]http://ma.baidu.com/ma/rcv/click.php(?:.|[/url]\n)*?<\/table>
re0=<span style='font-size:9pt'>Filtered Ad</span>
版主啊! 第一个过滤 好像 没有过滤全 造成 tag 不全
少过滤了
<DIV id=ScriptDiv></DIV>
</td></tr></table>
还有啊!我想过滤Google 的右侧 但是
ex1=<table cellspacing=0 cellpadding=0 width=25% align=right bgcolor=#ffffff border=0>{1}.*赞助商链接{1}.*<\/table>{1}
这么也不行啊,本人初学 正则表达式!
请教了! :P 牛,太牛了。但是学起来好像很难呀! 确实难,就等现成的用:shy:
一个外行的建议
其实只要告诉我们把内容往哪里帖,或者告诉我们执行的步骤就可以了,写的那些代码,有兴趣的去研究,我是根本不想花很多时间去研究的。我到论坛来是想尽快的找到答案。至于效果,不管是专业的,还是外行,一试就清除了。
我看着帖子的内容觉得是雾里看花,我们是外行,不懂,请版主尽量将方法简化再简化。
谢了! 学习了一下。