返回列表 发帖
我建议,要在自动判断广告上多下功夫,还是要创新.

拦飘广告是TW非常棒的地方,因为它在判断广告上做好了.其实广告是有特征的,不一定要基于关键字.

我以前提出过一个思路.比如:

下载一个图像文件,请求时读到文件尺寸信息.这个信息,这个图像有多大,它的长宽比是多少,就可以是智能判断的依据,一般而言,正常的内容图像也就是4:3或3:4,通常较大,宽过250像素,而一个广告长宽比会达到8:1甚至更高.

所以智能的判断广告,不一定非要基于URL关键字过滤,希望TW能继续努力创新

刚才网络不好,一会儿TW假死了两次,并且没活回来,我给了时间希望TW能加强网络环境不好时的健壮度
WIN7.PRO.SP1+全补丁+IE9,TW最新版,一般不乱说!

TOP

做得好,不会有问题的,CPU要占点,没有BUG是不会假死的,不是所有的图都要判断,比如说一些非常小尺寸的,通常都是用来装饰的,比如表格的圆角.判断只针对大于一定数值的图像

而且不用读完整个图像,我觉得应该只读一个文件头就可以了,一般图像文件的文件头里应该就会有尺寸等信息.

我觉得更智能是发展的方向,而且软件也要跟上硬件的发展,当然也要在功能人性上做出平衡,但不能一味的省,有时省过了,对硬件是一种浪费.

创新是无论如何是重要的,即使现在不能实现,也应该多研究,也要有储备.机会来临时,才可以后来居上.

这个系列的贴子,楼主是用心了的,最近都不是很顺,难得静下来看看.

欢迎继续探讨^_^
WIN7.PRO.SP1+全补丁+IE9,TW最新版,一般不乱说!

TOP

最近也在想这个问题,也和一些写程序的朋友聊过.也没有什么更清晰的想法,也没太注意广告的特征,我还是想说广告是有比较清晰特征的(如果没有特征便起不到广告的效果),关键是这个规则的制定.

基于关键字的也是很反反广告的,只是人都有个惰性,没有人那样故意为难我们,但难保以后不会出现什么广告发布的方式,出现变化URL的.

目前,我考虑这个,考虑性能不是太多,当然我也不是完全没有.

和朋友们聊天,提出过大黑名单,但是使用高速的查找方式(不是一一比对,比如说哈希),我数据结构学得不好,我不太倾向这种方式.但是这了是个思路,上面和以前提的关键字优先规则也是这个思路的.

基于关键字的,补充所有楼上的一些想法,我提出一个补充方案:

1.快速添加广告进黑名单.

    以前我不支持,是因为这会导致过大的黑名单,但是很多朋友都想要,我想也是可以的.关键是如何能比较智能的维护这个表,而不至于失控.因此要加入以下的机制.

2.黑名单自我维护

   实现以下功能

   1)对于长久没有匹配过的关键字,进行自我清除.    2)对于匹配得高的关键字优先比对.

   因此需要统计关键字的命中次数,每命中一次计数加1,总规则个数做限制,满了后,加新的,淘汰末位N个关键字.并且可以设置低于多少的命中次数的不做匹配,可以自动清除,或者留着观察(用来调设置时,这些可以再准予匹配)


上面的想法是,为了实现方便添加广告,而又规避这个功能的消极影响,基本能做到零维护.

[ 本帖最后由 starsoft 于 2006-3-8 04:59 PM 编辑 ]
WIN7.PRO.SP1+全补丁+IE9,TW最新版,一般不乱说!

TOP

返回列表