- UID
- 795
- 帖子
- 2279
- 精华
- 2
- 贡献
- 0
- 推广
- 0
- 有效BUG
- 0
- 注册时间
- 2005-4-16
|
最近也在想这个问题,也和一些写程序的朋友聊过.也没有什么更清晰的想法,也没太注意广告的特征,我还是想说广告是有比较清晰特征的(如果没有特征便起不到广告的效果),关键是这个规则的制定.
基于关键字的也是很反反广告的,只是人都有个惰性,没有人那样故意为难我们,但难保以后不会出现什么广告发布的方式,出现变化URL的.
目前,我考虑这个,考虑性能不是太多,当然我也不是完全没有.
和朋友们聊天,提出过大黑名单,但是使用高速的查找方式(不是一一比对,比如说哈希),我数据结构学得不好,我不太倾向这种方式.但是这了是个思路,上面和以前提的关键字优先规则也是这个思路的.
基于关键字的,补充所有楼上的一些想法,我提出一个补充方案:
1.快速添加广告进黑名单.
以前我不支持,是因为这会导致过大的黑名单,但是很多朋友都想要,我想也是可以的.关键是如何能比较智能的维护这个表,而不至于失控.因此要加入以下的机制.
2.黑名单自我维护
实现以下功能
1)对于长久没有匹配过的关键字,进行自我清除. 2)对于匹配得高的关键字优先比对.
因此需要统计关键字的命中次数,每命中一次计数加1,总规则个数做限制,满了后,加新的,淘汰末位N个关键字.并且可以设置低于多少的命中次数的不做匹配,可以自动清除,或者留着观察(用来调设置时,这些可以再准予匹配)
上面的想法是,为了实现方便添加广告,而又规避这个功能的消极影响,基本能做到零维护.
[ 本帖最后由 starsoft 于 2006-3-8 04:59 PM 编辑 ] |
|