返回列表 发帖
记数器匹配黑名单,不是从记数器本身的技术实现或是功能上说的,而是说的命中效率(就像输入法的字词排序一样),规率情况下自然很好,可很多时候并非是规率的,当然 zlowly 显然已经为此提到建议,就是阀值设置。

而正则表达式,我大致理解的好比是一个 IF 语句的嵌套,如果第一个匹配了就不会进行以下的运算,假如常规的黑名单也是匹配后不会再进行其它的匹配,那么两者的区别可能就剩下眼见条目多少了,不知理解是否有误。

TOP

正是由于没有万能的过滤库,所以也从一个侧面说明,过滤系统总是可以改进得更好的。
花不花资源的问题,我从starsoft 的帖子里并没看出增加计数器功能相关内容,他的贴子论点是规则过多会消耗很多资源,这个其实很显而易见,所以我也前也大力推荐应该使用正则表达式来减少规则数目。
计数器只是很简单的增量计数,在任何编程语言里都应该属于最低负荷的操作,这和需要算法实现的规则匹配完全不是一个数量级。虽然我的没做过浏览器的开发,但是以我经验相信技术上和复杂度上应该是很低的。

至于说很少用到的规则并不等于用不到,可以通过阀值设置,让用户自己确定。例如设定过去3个月都没有用到的规则自动失效。而且还可以强制永久生效,满足所有要求。

过滤库的概念并不新鲜,Firefox的就有插件自动更新Adblock的规则,但是过滤库通常都是包含许多人的规则,他们访问的网站不一定是我们访问的网站,就会有许多无用的规则,影响效率。对于很多喜欢自力更生的人,总是希望通过自己努力实现符合自己要求的更高效率的。

[ 本帖最后由 zlowly 于 2006-5-10 02:57 PM 编辑 ]

TOP

讨论的好不热闹,黑名单记数排序法以及过滤库虽是比较好的,可总归有其缺点,这点用输入法做比喻就很能说明问题,就像广告不可能大部分时间都是规率的一样,用户的使用有时也是捉摸不定的,从用户而非技术的角度来说,用户可能想几乎任何时候这种广告功能都应是有效率、不卡、简便的。

过滤库的作用可能更多的是提供给用户的一种参考,上网习惯和过滤要求的不同也注定决定了没有万能的过滤库。

TOP

最简单的方法..装个admuncher....一切都清爽了...哈哈

TOP

原帖由 无边无际 于 2006-5-10 11:43 AM 发表


不觉得麻烦么?如果有十条岂不询问十次?也许我理解错了你的意思


不用啊,做个下拉选择,只要第一次访问该网站是选一次就行

TOP

原帖由 一箱 于 2006-5-10 11:25 AM 发表
有人注意过OPERA的过滤功能吗?选择一下的话,那才叫干脆利落.


Opera 9.0的过滤方便是很方便,但并不强大,很多东西还是没法过滤的

FF的ADBlock Plus+RIP+Greasemonkey和MT 2.0的AD Hunter都能做到网页全文过滤和内容替换,这点Opera还不行。

ps:“内容替换”最常见的用途就是修复google的网页快照^^

TOP

原帖由 linser 于 2006-5-10 11:22 发表


多个过滤设置的问题很好解决

遇到多个过滤设置时,可以在浏览器窗口上放置一个提示条(就像IE6 SP2的弹出窗口拦截提示一样),让用户选择一个,或者让用户自定义,如果可能的话,最好有专人定期维护这个[c ...


不觉得麻烦么?如果有十条岂不询问十次?也许我理解错了你的意思
行云流水兮  用心无多  求大道以礼兵兮  凌万物而超脱



关于TheWorld2.x功能的全面介绍请参考=世界之窗使用手册=

TOP

有人注意过OPERA的过滤功能吗?选择一下的话,那才叫干脆利落.

TOP

原帖由 无边无际 于 2006-5-10 10:40 AM 发表


花不花资源试了你就知道,看看 starsoft 的帖子分析得很详细
http://bbs.ioage.com/viewthread. ... hlight=%C3%FB%B5%A5

要不试试把这里13楼的有效名单(近900条 ...


多个过滤设置的问题很好解决

遇到多个过滤设置时,可以在浏览器窗口上放置一个提示条(就像IE6 SP2的弹出窗口拦截提示一样),让用户选择一个,或者让用户自定义,如果可能的话,最好有专人定期维护这个过滤库

或者也可以将过滤库作为一种选择,完全让用户来决定是否使用。

TOP

原帖由 zlowly 于 2006-5-10 02:50 发表
1、个人认为,对过滤项目计数应该不会增加负担,也就是在规则的属性里增加个计数,过滤成功后递增计数,每次或定期甚至只是关闭浏览器时将计数保存到文件,看不出会花费什么资源。
...


花不花资源试了你就知道,看看 starsoft 的帖子分析得很详细
http://bbs.ioage.com/viewthread. ... hlight=%C3%FB%B5%A5

要不试试把这里13楼的有效名单(近900条)加到你的黑名单,打开网页一定卡。
http://bbs.ioage.com/viewthread. ... ge=1&highlight=

原帖由 linser 于 2006-5-10 08:49 发表

机制改变了就自己修改过滤规则啊。

MT2.0的广告过滤是可以指定为某个网站有效或者全部网站有效的。

我的想法是分离从来,过滤自定义更强些。“过滤规则分为网站私有和公有”这个主意不错

做到像病毒库那样更新很不好,因为很多人就会下载到很多自己从来不要的规则,无故增加负担(虽然说是私名单)。比如:新浪网

有的人是:*.*f     有的是: *.gif          有的是  *.swf
如果都上传了又下载更新了,那他们就得到,三条    :*.*f   ,  *.gif   ,   *.swf
那当下次访问sina网浏览器可能要过滤三次
行云流水兮  用心无多  求大道以礼兵兮  凌万物而超脱



关于TheWorld2.x功能的全面介绍请参考=世界之窗使用手册=

TOP

原帖由 linser 于 2006-5-10 09:03 AM 发表
就像病毒库一样


好前卫的想法...
...
偶看着就好了

TOP

用计数来判断规则是否有效不是个好办法,很少用到的规则并不等于用不到。

加快过滤速度的最好办法是设置一个过滤cache,首次访问时把所有过滤规则匹配一次,然后把用到的规则存入cache,以后在此访问就直接从cache读取规则,除非用户指定刷新过滤cache,不过这也有个问题,如果网站经常改变广告的来源或者每个页面都有不同的广告来源就效果不大了。

还有个办法是将过滤规则分为网站私有和公有,公有规则对所有网站有效,而私有规则只针对某个网站有效,很多时候用户添加的规则都是针对某个网站的,这样可以大幅度减少需要匹配的规则数量。

如果有服务器支持的话,这些私有过滤规则可以让用户提交到网上,并且浏览器定期下载更新,就像病毒库一样。

[ 本帖最后由 linser 于 2006-5-10 09:16 AM 编辑 ]

TOP

返回列表