- UID
- 3498
- 帖子
- 190
- 精华
- 0
- 贡献
- 0
- 推广
- 0
- 有效BUG
- 0
- 注册时间
- 2005-10-11
|
starsoft 的贴子我也看过。
他的原话是这样的:
理由如下:我没看过TW黑名单的源代码但是无非是每个链接请求都会判断是不是黑名单里的.也就是要一一比对黑名单里的全部内容.如果黑名单一大,一个网页有100个地址,你有30条,就要比3000次.如果黑名单少,效率就高,如果一条地址命中黑名单的规则,TW相信一定会去找白名单,是不是会取消过滤.这样就只对可疑的地址作了比对.而不是在第一关就详细的比对.
实例: 甲设置:黑名单30条 白名单:10条
乙设置:黑名单10条 白名单:30条
甲乙的设置都是共40条规则
假设网页有一100个地址(URL).其中有5条广告URL.
极坏的情况(黑白名单最后一条规则才命中):
甲设置:比对次数是:100(注URL)*30(黑名单条数)+5(可疑的广告URL)*10(白名单规则)=3050
乙设置:比对次数是:100*10+5*30=1150
极好的情况(黑白名单第一条规则就命中):
甲:100*1+5*1=105次 乙:100*1+5*1=105次
次好情况甲(第一条规则命中黑名单,但最后一条白名单命中)
甲:100*1+5*10=150 乙:100*1+5*30=250
次好情况乙(最后一条规则命中黑名单,但第一条白名单就命中)
甲:100*30+5*1=3005 乙:100*10+5*1=1005
其他情况就不好说了
我仔细看过,我觉得情况不应该这样考虑:
上面的例子;网页中100个地址。
甲30条黑名单过滤后,剩5条可疑地址。
乙10条黑名单过滤后,怎么可能也剩5条可疑地址?可能剩8条,也可能剩10条,还可能剩……
所有上面公式是不成立的。
在我看来白名单多还是黑名单多,二者并没很重要的区别,区别在于你所察看的网页。 |
|