返回列表 发帖
*id=*
这条太过了点。
我知道好多宽带电影,在线播放都用这个形式的,我们地区的在线电影就是。(地址不贴了,根据IP地址判断,其他地方没法上的)

TOP

IT168首页。
这个广告在“/adshow.…………”
按理说“*/ad*”可以把它过滤,可是白名单的“*show*”又让它显示。
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

TOP

starsoft 的贴子我也看过。
他的原话是这样的:

  理由如下:我没看过TW黑名单的源代码但是无非是每个链接请求都会判断是不是黑名单里的.也就是要一一比对黑名单里的全部内容.如果黑名单一大,一个网页有100个地址,你有30条,就要比3000次.如果黑名单少,效率就高,如果一条地址命中黑名单的规则,TW相信一定会去找白名单,是不是会取消过滤.这样就只对可疑的地址作了比对.而不是在第一关就详细的比对.

    实例: 甲设置:黑名单30条  白名单:10条
            乙设置:黑名单10条  白名单:30条
            甲乙的设置都是共40条规则
            假设网页有一100个地址(URL).其中有5条广告URL.
      极坏的情况(黑白名单最后一条规则才命中):
           甲设置:比对次数是:100(注URL)*30(黑名单条数)+5(可疑的广告URL)*10(白名单规则)=3050
           乙设置:比对次数是:100*10+5*30=1150
      极好的情况(黑白名单第一条规则就命中):
            甲:100*1+5*1=105次           乙:100*1+5*1=105次
      次好情况甲(第一条规则命中黑名单,但最后一条白名单命中)
           甲:100*1+5*10=150         乙:100*1+5*30=250
      次好情况乙(最后一条规则命中黑名单,但第一条白名单就命中)
           甲:100*30+5*1=3005        乙:100*10+5*1=1005
      其他情况就不好说了


我仔细看过,我觉得情况不应该这样考虑:
上面的例子;网页中100个地址。
                        甲30条黑名单过滤后,剩5条可疑地址。
                        乙10条黑名单过滤后,怎么可能也剩5条可疑地址?可能剩8条,也可能剩10条,还可能剩……
            所有上面公式是不成立的。
在我看来白名单多还是黑名单多,二者并没很重要的区别,区别在于你所察看的网页。

TOP

原帖由 三月飞絮 于 2005-12-18 04:37 PM 发表
To  zhq74:
starsoft说的5条广告URL不是指绝对的广告地址,而是被黑名单命中的疑似广告地址。

假设情况;30条黑名单疑5条,10条黑名单疑的肯定不至5条。黑名单越少,打击面越广,白名单判断得越多。
如果黑名单是   100×30   剩余5     5×10
那么白名单是   100×10   剩余?  ?×30  (?是>5的任何数)

我的意思是他那公式是错的
甲设置:比对次数是:100(注URL)*30(黑名单条数)+5(可疑的广告URL)*10(白名单规则)=3050
乙设置:比对次数是:100*10+5*30=1150


[ 本帖最后由 zhq74 于 2005-12-18 05:13 PM 编辑 ]

TOP

所以我真正的意思是:要达到效果,用白名单附以黑名单或用黑名单附以白名单,都是一样的。并不存在谁效率更高。(以G计的CPU计算这些算不了什么)
黑名单用起来更直接。
白名单用起来脑子还要转一下。

TOP

假设某论坛广告;
论坛地址://bbs.xxxx.com   广告地址//bbs.xxxx.com/ads/001.gif ~ 009.gif
黑名单中有 “*/ad*” 此处9个广告001至009应该被屏蔽,但白名单豁免了 “*bbs*” ,白名单权限大于黑名单;所以广告都得到豁免。
还有如*soft*和*view*都会豁免一些广告。

(以上例子是假设的。三月的帖子都很有建设性的,所以我都认真看后测试的,你可不要嫌我烦!)

TOP

原帖由 三月飞絮 于 2005-12-19 01:00 AM 发表

但现在还有个问题:当黑名单条数与白名单的条数总和相等时,到底应该偏向于黑名单呢还是偏向于白名单(也就是“30黑+10白”与“10黑+30白”到底哪个效率高?)
zhq74说的很有道理,在以G计的CPU支持下,这点运算确实不能算什么。不过我还是想在黑白名单中体现出效率,哪怕只有0.00……001s!

理论上二种情况的黑+白数量应该相等,但实际情况不太可能。所以效率也无法比较。
按照S兄的思路“广杀精免”,我觉得黑白名单很难设;
经常上的几个网站应该没问题,但是所有网站不可能都是很有规律的。白名单太精确,上陌生网站就容易误杀(因为广杀)。白名单一多,漏杀就多(因为白名单权限大于黑名单)。
如果按照另一种思路“精杀精免”;
黑名单设置稍精细一点,误杀的几率就大大减少。白名单只要三四条用来以防万一。这样就杀除了大多数广告,经常上的网站有几个漏杀可以单独添加。

TOP

返回列表