返回列表 发帖
假设某论坛广告;
论坛地址://bbs.xxxx.com   广告地址//bbs.xxxx.com/ads/001.gif ~ 009.gif
黑名单中有 “*/ad*” 此处9个广告001至009应该被屏蔽,但白名单豁免了 “*bbs*” ,白名单权限大于黑名单;所以广告都得到豁免。
还有如*soft*和*view*都会豁免一些广告。

(以上例子是假设的。三月的帖子都很有建设性的,所以我都认真看后测试的,你可不要嫌我烦!)

TOP

原帖由 zhq74 于 2005-12-18 04:04 PM 发表
starsoft 的贴子我也看过。
他的原话是这样的:

  理由如下:我没看过TW黑名单的源代码但是无非是每个链接请求都会判断是不是黑名单里的.也就是要一一比对黑名单里的全部内容.如果黑名单一大,一个网页有100 ...



说得好,的确我的验证方法是错误的,但是如果建立在两个前提下,个人感觉(还没想到如何验证)我的观点应该还是对的。
前提1:广告比正常内容少。
前提2:广告是有规律的。

不过,我认为实际应用来说,我说的大而概的程度是一个不好设的程度。个人觉得"ID="的确是该舍去,太概了。

希望大家多探讨,研究
WIN7.PRO.SP1+全补丁+IE9,TW最新版,一般不乱说!

TOP

原帖由 zhq74 于 2005-12-18 09:40 PM 发表
黑名单中有 “*/ad*” 此处9个广告001至009应该被屏蔽,但白名单豁免了 “*bbs*” ,白名单权限大于黑名单;所以广告都得到豁免。
还有如*soft*和*view*都会豁免一些广告。

论坛中的广告被忽略这个问题我是考虑到的,如中国剑盟论坛和juju猫宽带宝藏(http://www.jujumao.com/)都有广告,但为了能正常浏览论坛也只能放行它们了。

你可不要嫌我烦

有人这么认真地与我探讨问题,高兴还来不及呢,又怎么会嫌你烦呢?  ^_^

*id=*   -__-!基本上用白名单来修是不大可能了

其实我精选出来的那些白名单对*id=*的修复还是可以的,不过是得不偿失啊!!!!

个人觉得"ID="的确是该舍去,太概了

舍去了*id=*,这份黑白名单方案也就失去意义了。我观察了很多广告媒体的网站,它们给出的广告连接共有的字符就是“id”,所以我才想着是否可以利用*id=*再加白名单修正的方法来设置过滤条件。

给出的这份草案虽然自己已经测试过一段时间,但毕竟我个人浏览测试的页面还相对比较少所以遇到的问题也相对比较少。呵呵,还是群众的力量伟大啊!!
再次感谢各位的支持,现已基本得出结论:该份黑白名单方案效果不佳,停止测试。

过段时间我再拟定份新的方案,这次不再一味地追求黑名单的精简而放纵白名单的庞大。
但现在还有个问题:当黑名单条数与白名单的条数总和相等时,到底应该偏向于黑名单呢还是偏向于白名单(也就是“30黑+10白”与“10黑+30白”到底哪个效率高?)
zhq74说的很有道理,在以G计的CPU支持下,这点运算确实不能算什么。不过我还是想在黑白名单中体现出效率,哪怕只有0.00……001s!

TOP

原帖由 三月飞絮 于 2005-12-19 01:00 AM 发表

但现在还有个问题:当黑名单条数与白名单的条数总和相等时,到底应该偏向于黑名单呢还是偏向于白名单(也就是“30黑+10白”与“10黑+30白”到底哪个效率高?)
zhq74说的很有道理,在以G计的CPU支持下,这点运算确实不能算什么。不过我还是想在黑白名单中体现出效率,哪怕只有0.00……001s!

理论上二种情况的黑+白数量应该相等,但实际情况不太可能。所以效率也无法比较。
按照S兄的思路“广杀精免”,我觉得黑白名单很难设;
经常上的几个网站应该没问题,但是所有网站不可能都是很有规律的。白名单太精确,上陌生网站就容易误杀(因为广杀)。白名单一多,漏杀就多(因为白名单权限大于黑名单)。
如果按照另一种思路“精杀精免”;
黑名单设置稍精细一点,误杀的几率就大大减少。白名单只要三四条用来以防万一。这样就杀除了大多数广告,经常上的网站有几个漏杀可以单独添加。

TOP

返回列表