返回列表 发帖
原帖由 jmdjy 于 2007-8-13 15:27 发表 http://bbs.ioage.com/cn/images/common/back.gif
MT的怎样强法?谁具体详细解释一下?

一直听说它强,但又不知它怎样强,闷。


比如像下图示,透过 Remove It 插件可以不需要查看页面源码便能过滤任何看得到的内容:

http://bbs.ioage.com/cn/attachment.php?aid=29521&noupdate=yes


自动生成过滤规则:

http://bbs.ioage.com/cn/attachment.php?aid=29522&noupdate=yes


另外这里的建议 Maxthon 的过滤包已经实现 http://bbs.ioage.com/cn/viewthre ... &extra=page%3D1

TOP

原帖由 elkay 于 2007-8-13 15:00 发表 http://bbs.ioage.com/cn/images/common/back.gif
为什么要跟MT一样呢?

广告过滤强不强跟规则有很大关系,楼上有人说了,MT用了所谓的增强过滤规则比tw好,难道要拿用了过滤规则的跟只用内置规则的来比?

我也可以说,TW用了好的规则,效果要比MT好

TW 的过滤缺少了 bound 的概念,在过滤时容易出错(用 proxomitron 的应该明白是什么回事)。比如怎样过滤下面红色的 js 以不影响篮色的 js:

<script>...</script>
<script>...ad.doubleclick.net...</script>

TOP

原帖由 elkay 于 2007-8-13 16:37 发表 http://bbs.ioage.com/cn/images/common/back.gif
这个问题的确是有,不过可以想办法解决的,比如你的例子可以这样解决
<script>[^<]*?doubleclick[\s\S]*?</script>


但如果 JS 含比如 if(x<y) 这个规则便会失效了。

而且这个问题在 nested tag 会更难解决,比如:

<div>...<div>...<a href=ad.doubleclick.net...>...</div>...</div>

透过 bound (基本上是一个 pre-match) 便能确保匹配对应的 tag,比如:
<div>...</div>, <div>...<div>...</div>...</div>, <div>...<div>...<div>...</div>...</div>...</div>

TOP

原帖由 elkay 于 2007-8-13 21:54 发表 http://bbs.ioage.com/cn/images/common/back.gif
这点不用担心,总是有办法解决的,我之前已经遇到好多了,最后没有解决不了的,只是有些可能需要稍微多动一些脑子

...

如果源码固定不变的确是总有办法解决的。

TOP

原帖由 needed 于 2007-8-13 23:53 发表 http://bbs.ioage.com/cn/images/common/back.gif
bound 的概念是什么 ?
  就是一个正则匹配而已。 只不过mt把它内置了。

...

bound 不是 maxthon 创的,而是借鉴老牌的 proxomitron。没有 bound 的话,在匹配不固定的源码时是没法保证能匹配到对应的 tag。而即使源码是固定的,要匹配复杂的 tag 亦会令过滤规则变得复杂,及影响通用性。

TOP

原帖由 AY 于 2007-8-14 01:02 发表 http://bbs.ioage.com/cn/images/common/back.gif

bound 不是 maxthon 创的,而是借鉴老牌的 proxomitron。没有 bound 的话,在匹配不固定的源码时是没法保证能匹配到对应的 tag。而即使源码是固定的,要匹配复杂的 tag 亦会令过滤规则变得复杂,及影响通用性。


再多举个例子说清楚一点。
我在任何网站都会过滤统计用的 js,因为这些 js 浪费 cpu,而且往往还要下载图档,影响页面加载时间。

在 proxomitron 我是用下面的过滤规则:
bound=$NEST(<script,</script>)     bound 确保只会匹配对应的 <script 及</script>
match=*(hitbox.com|qksrv.net|112.2o7.net|superstats.com|falkag.net|google-analytics.com|cyber-traffic.net|estat.com|surfaid.ihost.com|nedstat.nl|nedstatbasic.net|questionmarket.com|spylog.com|thecounter.com|survey-poll.comsageanalyst.net|hotlog.ru|addfreestats.com|bizrate.com|count-down.tv|counter.yadro.ru|extreme-dm.com|top.list.ru|count.e-city.tv|sageanalyst.net)*

在 maxthon 2.0 我可以用下面的过滤规则:
bound=<script.*?</script>     bound 确保只会匹配对应的 <script 及</script>
match=.*(hitbox.com|qksrv.net|112.2o7.net|superstats.com|falkag.net|google-analytics.com|cyber-traffic.net|estat.com|surfaid.ihost.com|nedstat.nl|nedstatbasic.net|questionmarket.com|spylog.com|thecounter.com|survey-poll.comsageanalyst.net|hotlog.ru|addfreestats.com|bizrate.com|count-down.tv|counter.yadro.ru|extreme-dm.com|top.list.ru|count.e-city.tv|sageanalyst.net).*

在 TW 要怎样写才能过滤这些统计 JS (需要包括 inline JS,即是 <script>...</script>,比如像 http://sports.espn.go.com/nba/index 的 hitbox 统计) 而不会出现我在 20楼24楼 提出的错误及失效问题? 我十分肯定没有 bound 的话是不可能做得到的。

[ 本帖最后由 AY 于 2007-8-14 15:54 编辑 ]

TOP

返回列表