为什么tw的广告过滤不能象mt一样呢？ - 2.x版本使用交流 - 旧版使用交流 - 世界之窗论坛

Rank: 12

UID: 1601
帖子: 3743
精华: 1
贡献: 11
推广: 0
有效BUG: 0
注册时间: 2005-7-6

1^# 跳转到 »

发表于 2007-8-13 16:05 | 显示全部帖子

原帖由 jmdjy 于 2007-8-13 15:27 发表 http://bbs.ioage.com/cn/images/common/back.gif
MT的怎样强法？谁具体详细解释一下？

一直听说它强，但又不知它怎样强，闷。

比如像下图示，透过 Remove It 插件可以不需要查看页面源码便能过滤任何看得到的内容：

http://bbs.ioage.com/cn/attachment.php?aid=29521&noupdate=yes

自动生成过滤规则：

http://bbs.ioage.com/cn/attachment.php?aid=29522&noupdate=yes

另外这里的建议 Maxthon 的过滤包已经实现 http://bbs.ioage.com/cn/viewthre ... &extra=page%3D1

TOP

超钻会员

Rank: 12

UID: 1601
帖子: 3743
精华: 1
贡献: 11
推广: 0
有效BUG: 0
注册时间: 2005-7-6

2^#

发表于 2007-8-13 16:17 | 显示全部帖子

原帖由 elkay 于 2007-8-13 15:00 发表 http://bbs.ioage.com/cn/images/common/back.gif
为什么要跟MT一样呢？

广告过滤强不强跟规则有很大关系，楼上有人说了，MT用了所谓的增强过滤规则比tw好，难道要拿用了过滤规则的跟只用内置规则的来比？

我也可以说，TW用了好的规则，效果要比MT好

TW 的过滤缺少了 bound 的概念，在过滤时容易出错(用 proxomitron 的应该明白是什么回事)。比如怎样过滤下面红色的 js 以不影响篮色的 js:

<script>...</script>
<script>...ad.doubleclick.net...</script>

TOP

超钻会员

Rank: 12

UID: 1601
帖子: 3743
精华: 1
贡献: 11
推广: 0
有效BUG: 0
注册时间: 2005-7-6

3^#

发表于 2007-8-13 18:07 | 显示全部帖子

原帖由 elkay 于 2007-8-13 16:37 发表 http://bbs.ioage.com/cn/images/common/back.gif
这个问题的确是有，不过可以想办法解决的，比如你的例子可以这样解决
<script>[^<]*?doubleclick[\s\S]*?</script>

但如果 JS 含比如 if(x<y) 这个规则便会失效了。

而且这个问题在 nested tag 会更难解决，比如：

<div>...<div>...<a href=ad.doubleclick.net...>...</div>...</div>

透过 bound (基本上是一个 pre-match) 便能确保匹配对应的 tag，比如:
<div>...</div>, <div>...<div>...</div>...</div>, <div>...<div>...<div>...</div>...</div>...</div>

TOP

超钻会员

Rank: 12

UID: 1601
帖子: 3743
精华: 1
贡献: 11
推广: 0
有效BUG: 0
注册时间: 2005-7-6

4^#

发表于 2007-8-14 00:12 | 显示全部帖子

原帖由 elkay 于 2007-8-13 21:54 发表 http://bbs.ioage.com/cn/images/common/back.gif
这点不用担心，总是有办法解决的，我之前已经遇到好多了，最后没有解决不了的，只是有些可能需要稍微多动一些脑子

...

如果源码固定不变的确是总有办法解决的。

TOP

超钻会员

Rank: 12

UID: 1601
帖子: 3743
精华: 1
贡献: 11
推广: 0
有效BUG: 0
注册时间: 2005-7-6

5^#

发表于 2007-8-14 01:02 | 显示全部帖子

原帖由 needed 于 2007-8-13 23:53 发表 http://bbs.ioage.com/cn/images/common/back.gif
bound 的概念是什么？
就是一个正则匹配而已。只不过mt把它内置了。

...

bound 不是 maxthon 创的，而是借鉴老牌的 proxomitron。没有 bound 的话，在匹配不固定的源码时是没法保证能匹配到对应的 tag。而即使源码是固定的，要匹配复杂的 tag 亦会令过滤规则变得复杂，及影响通用性。

TOP

超钻会员

Rank: 12

UID: 1601
帖子: 3743
精华: 1
贡献: 11
推广: 0
有效BUG: 0
注册时间: 2005-7-6

6^#

发表于 2007-8-14 12:10 | 显示全部帖子

原帖由 AY 于 2007-8-14 01:02 发表 http://bbs.ioage.com/cn/images/common/back.gif

bound 不是 maxthon 创的，而是借鉴老牌的 proxomitron。没有 bound 的话，在匹配不固定的源码时是没法保证能匹配到对应的 tag。而即使源码是固定的，要匹配复杂的 tag 亦会令过滤规则变得复杂，及影响通用性。

TOP

返回列表

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]