Board logo

标题: 卓越浏览∽汇聚妙想 Ⅲ 广告过滤> [打印本页]

作者: Aycox    时间: 2006-1-16 15:43     标题: 卓越浏览∽汇聚妙想 Ⅲ 广告过滤>

全文:Ⅰ 收藏夹>Ⅱ 状态栏>Ⅲ 广告过滤>Ⅳ 插件>Ⅴ 标签栏>Ⅵ 界面>Ⅶ 功能设置 ■

声明:一份思考,十分辛苦,百分原创,千万记住要跟贴莫要转贴。

这里汇集了本人平时的一些思考,虽是基于个人所知所用,却尽可能以更广的角度来思考,期望能提供一丝参考或一份灵感,同时更希望大家集思广益,共同打造出真正有价值的建议,为我们心中的下一个TW精品献出薄力。为保护大家的眼睛以及响应群众呼声,特将超长篇一分为N,敬请关注!

1,请将全系列联系起来并以下述视角看贴,你想到的就是我要说的。
2,用户有没有需求不是关键,关键是看你能提供怎样的需求。
3,浏览器的主旨是浏览,让一切功能都为此服务,只有想不到没有做不到。
4,不管作何看法或实际走不走斑马线,都不代表世上不应有人行横道。
5,更好的软件永远只可能是下一个,而最适合自己的也许就在眼前。
6,建议不都是并行的,而是可以综合利用的,在此仅是罗列出来。


┈┈ 等等,请君喝茶!┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈


【广告过滤】

1,黑白名单项目。
想法1:应该每项内容可选,即在每个名单项目前有复选框,选中的才有效,这样的灵活度就更高,不必临时删除某一项,后来又来添加。
想法2:可以为黑白名单设置注释,从而大大提高用户的可操作性。

2,黑白名单过滤
目前的黑白名单过滤针对面太广,而名单的组成也有其范围,如果名单太多就肯定影响到正常浏览速度。我们不能为了一个网站而去检测所有网址,也没有必要所有网站使用同样的标准。
想法1:将黑白名单设为三个过滤等级,制作时可以为名单项按常用度、杀伤范围、针对性等属性来划分,最高级检测所有名单,最低级仅仅检测有通用性的名单。而现在要想控制拦截范围只能手动删除一些,然后需要时再加进去。
想法2:设立网站专有名单,即某几个名单只用于某类特征的网站或地址类型,这时只需检测一次而无需将其附属的每个项目都检测,从而我们就可以放心大胆的将某些常用网址过滤得干干净净而无需担心这些只用于特定网站的名单用到其它网址了。
想法3:过滤掉的内容最好有一个列表,比如当前页面过滤掉的脚本有哪些。
想法4:如果有可能,最好能过滤内嵌脚本和其中的网址,甚至包含过滤Cookies。
想法5:如果本系列收藏夹章节中相关想法可行,甚至可以为每个收藏夹地址设置拦截级别(执行此功能时只是按需读取,操作和数据在收藏夹中)。

3,广告级别
有些浏览器已经有了象初中高级那样的广告级别制,不仅直观且更适合新手使用,而其最大的好处是不必经常去开关几个广告选项,因为一个标准不可能适应所有情况,因而与其让用户根据网速和心情随时调整,不如预设几个级别。但是市面上的预设是程序自带的,无法适应不同用户需求,因此用户应该可以自定级别。
简单的说就是类似IE安全选项的模式,只是不可能那么繁杂,就相当于用户可以据自身喜好设置几种配置,在需要时只需执行切换这一个操作就可将该选的该去掉的广告选项一遍操作,当然如果你很勤快或不会用,那么你还是可以一个个调整的或用默认的。(还可做成上一条第5点)


┈┈ 想想,有空回贴!┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈


1,本系列未提及的功能组件,如也能有一些灵感的话,将会续写下去。
2,希望大家将自己的想法补充进来,无论是原创的还是其它浏览器可借鉴的亮点。
3,未完待续,敬请关注!

全文:Ⅰ 收藏夹>Ⅱ 状态栏>Ⅲ 广告过滤>Ⅳ 插件>Ⅴ 标签栏>Ⅵ 界面>Ⅶ 功能设置 ■

[ 本帖最后由 Aycox 于 2006-1-23 03:29 AM 编辑 ]
作者: 无边无际    时间: 2006-1-16 15:47

1,黑白名单项目。
想法1:应该每项内容可选,即在每个名单项目前有复选框,

非常好的主意,像outlook里的邮件规则一样,可以启用,关闭,删除。
我补充一下:


广告过滤不必过分去智能化判断,程序怎么说也是无辨别思想的东西,还是能让多用户方便更改添加就可以了。

或者分离,支持插件来处理。

[ 本帖最后由 iceriver_final 于 2006-2-28 09:54 AM 编辑 ]
作者: 小絮    时间: 2006-1-16 17:21

黑名单过滤中我补充一点:增加过滤条件的自定义排序,将杀伤范围大的黑名单放最前面,可以提高效率。
作者: red-M    时间: 2006-1-16 18:00

打这么多字也得花很多时间啊,我收藏下来慢慢研究。。。
作者: Aycox    时间: 2006-1-17 00:37

原帖由 red-M 于 2006-1-16 18:00 发表
打这么多字也得花很多时间啊,我收藏下来慢慢研究。。。


打字都无所谓了,关键是要想,不过很多是平时都写好的,零星的,整理起来较麻烦
作者: hayem    时间: 2006-1-18 20:02

TW的自身广告过滤已经非常好了,还没有发现不可以接受的广告弹出现象,真不明白各位是怎么遇到那么多的广告,人才啊,就是不一样,连弹出广告都那么牛
作者: Aycox    时间: 2006-1-19 01:11

原帖由 hayem 于 2006-1-18 20:02 发表
TW的自身广告过滤已经非常好了,还没有发现不可以接受的广告弹出现象,真不明白各位是怎么遇到那么多的广告,人才啊,就是不一样,连弹出广告都那么牛


首先谢谢回复!讨论广告或为广告过滤提供建议,并非自己碰到的广告牛,当然人也不牛。

我真的不想发贴发的这么长篇大论,但为免不必要的误解和做出解释,还是尽可能写短一些,但是还是太多了只有分贴发,至于每一篇每一条每一点,我想能解释能额外说明的都说了,包括想法背景、视角、适应情况、解决方案、易用性、可能影响、缺点避免、应用范围等等,只要是能仔细连贯地看完一篇全文或有可能全系列都看完的,相信都能理解我所要说的内容和目的。

谢谢认真看过此系列贴子的朋友,我万分欢迎大家探讨,但是请首先连贯地看一遍,谢谢!

作者: 就爱杀猪    时间: 2006-2-21 20:33

由于是楼主比较短的帖子,所以破例看了2便。广告级别是一种简单易行的方案,特别关注。
作者: starsoft    时间: 2006-2-27 23:08

我建议,要在自动判断广告上多下功夫,还是要创新.

拦飘广告是TW非常棒的地方,因为它在判断广告上做好了.其实广告是有特征的,不一定要基于关键字.

我以前提出过一个思路.比如:

下载一个图像文件,请求时读到文件尺寸信息.这个信息,这个图像有多大,它的长宽比是多少,就可以是智能判断的依据,一般而言,正常的内容图像也就是4:3或3:4,通常较大,宽过250像素,而一个广告长宽比会达到8:1甚至更高.

所以智能的判断广告,不一定非要基于URL关键字过滤,希望TW能继续努力创新

刚才网络不好,一会儿TW假死了两次,并且没活回来,我给了时间希望TW能加强网络环境不好时的健壮度
作者: 无边无际    时间: 2006-2-28 09:47

楼上的思路会使TW假死更厉害,一个页面十几个图,而打开这个页面就要先读尺寸,再拿这些数据去和过滤条件匹配,要计算很多次,这样严重影响速度,不划算。
作者: mutalisker    时间: 2006-2-28 11:22

关于广告拦截增强的部分,我觉得还是应该重点放在能否智能的判断上,Aycox说的几种方法是将传统的黑名单发挥到及至的一种想法,但对大多数普通用户来说这些对改进他们的浏览体验是意义不大的。所以能不能想出一些有突破的想法才是关键。一直在想。。。头都破了。。。
作者: starsoft    时间: 2006-2-28 23:42

做得好,不会有问题的,CPU要占点,没有BUG是不会假死的,不是所有的图都要判断,比如说一些非常小尺寸的,通常都是用来装饰的,比如表格的圆角.判断只针对大于一定数值的图像

而且不用读完整个图像,我觉得应该只读一个文件头就可以了,一般图像文件的文件头里应该就会有尺寸等信息.

我觉得更智能是发展的方向,而且软件也要跟上硬件的发展,当然也要在功能人性上做出平衡,但不能一味的省,有时省过了,对硬件是一种浪费.

创新是无论如何是重要的,即使现在不能实现,也应该多研究,也要有储备.机会来临时,才可以后来居上.

这个系列的贴子,楼主是用心了的,最近都不是很顺,难得静下来看看.

欢迎继续探讨^_^
作者: Aycox    时间: 2006-3-1 01:20

分析图片大小特征,从想法来说是好的,从实用来说就不是很好:
1,广告图片(或Flash等)虽然大小是有一些规律,但不足以作为判断依据,其误判率绝对要较之黑名单要高;
2,广告样式的不可确定性(或称变化性);
3,获取文件大小与当前传统的黑名单相比并没有速度优势;黑名单多了都会影响速度,何况这样呢;
4,嵌入页面框架中的广告相对来说应该说是“正常”广告,比如横幅广告,一般的广告根本就不必大动脑筋,相反如何最快最有效的过滤一些难办的烦恼的广告才是需要思考的,图片广告相对来说只是很多烦人广告中的一种而已;
5,最普遍的例子就是论坛图像和签名有时是无法根据大小来区分的。

管理员说了,需要能想出一些有突破的想法才是关键,象拦截浮动广告和弹出窗口都是在底层进行的,但正是由于广告使用的技术(或伪装)与正常内容有时无法分辨,所以就有了误拦和兼容之说,况且广告作者也只会千方百计让观众看广告,加之千个网站千个样,要有突破性的想法,我非专业人士是无能为力了。

欢迎和感谢 starsoft 探讨这个问题,你后几句话说的不错。
作者: 无边无际    时间: 2006-3-1 01:25

原帖由 Aycox 于 2006-3-1 01:20 发表
... 欢迎和感谢 starsoft 探讨这个问题,你后几句话说的不错。


难道前几句话说的有错?!
作者: starsoft    时间: 2006-3-7 13:14

最近也在想这个问题,也和一些写程序的朋友聊过.也没有什么更清晰的想法,也没太注意广告的特征,我还是想说广告是有比较清晰特征的(如果没有特征便起不到广告的效果),关键是这个规则的制定.

基于关键字的也是很反反广告的,只是人都有个惰性,没有人那样故意为难我们,但难保以后不会出现什么广告发布的方式,出现变化URL的.

目前,我考虑这个,考虑性能不是太多,当然我也不是完全没有.

和朋友们聊天,提出过大黑名单,但是使用高速的查找方式(不是一一比对,比如说哈希),我数据结构学得不好,我不太倾向这种方式.但是这了是个思路,上面和以前提的关键字优先规则也是这个思路的.

基于关键字的,补充所有楼上的一些想法,我提出一个补充方案:

1.快速添加广告进黑名单.

    以前我不支持,是因为这会导致过大的黑名单,但是很多朋友都想要,我想也是可以的.关键是如何能比较智能的维护这个表,而不至于失控.因此要加入以下的机制.

2.黑名单自我维护

   实现以下功能

   1)对于长久没有匹配过的关键字,进行自我清除.    2)对于匹配得高的关键字优先比对.

   因此需要统计关键字的命中次数,每命中一次计数加1,总规则个数做限制,满了后,加新的,淘汰末位N个关键字.并且可以设置低于多少的命中次数的不做匹配,可以自动清除,或者留着观察(用来调设置时,这些可以再准予匹配)


上面的想法是,为了实现方便添加广告,而又规避这个功能的消极影响,基本能做到零维护.

[ 本帖最后由 starsoft 于 2006-3-8 04:59 PM 编辑 ]
作者: 无边无际    时间: 2006-3-7 15:31

不错,细读三遍,愈加佩服starsoft ^


你变,我也变。打破常规,别出心裁~
心下不得不服气!
作者: 9wis    时间: 2006-4-26 23:06

好啊,这个版块才是高手多啊,学到不少,谢谢了啊
我会常来的
我也是天天来,
呵呵
作者: 319702aa    时间: 2007-4-25 05:18

顶LZ!
我很赞同你的建议,非常感谢你说出了我的心声。
使用3年TW,最近非常烦sina的漂浮广告,因为不加载任何黑名单的TW对它没有任何免疫拦截能力,苦恼!
短期试用了FF2.0,MT2.0。FF的过滤插件,MT的预置广告过滤+黑名单对sina的漂浮广告过滤效果都很不错。我就非常期待TW2.0也能做到这样。虽然我也是计算机专业的,但不可否认,我对黑名单的制定非常懒惰。。自身现在也没有自己制作的能力,。。只希望可以简简单单的用上能很好过滤掉烦人的广告的TW。我喜欢它!
再次谢谢LZ。
作者: 混神    时间: 2007-4-25 06:01

头脑发昏,什么也记不住了,回头仔细瞧瞧了~
作者: ciwei    时间: 2007-4-25 08:07

我知道软件功能越多,问题越多

加入广告级别的话,TW出问题的几率就增大,而且过滤广告会不会是发展主流,值不值得开发组花时间精力?
作者: elkay    时间: 2007-4-25 14:53

我建议先要找一些志愿者给一段时间来收集网络上的广告,时间不能太短,不然范围就太窄了,然后在分析收集到的广告从中提取出一批非常常见的广告作为tw的默认黑名单。志愿者必须要在平时就有不固定浏览某些网站的习惯,不然找来找去都是哪几个网站
作者: renior    时间: 2007-4-25 21:50

想法不错,不过太长了,没看完
作者: abswin    时间: 2007-4-25 22:49

我现在是用人脑过滤了,不飘不闪的广告是可以接受的。
如连文本都过滤了,网页也不好看。
作者: miami    时间: 2007-4-26 22:06

咋越看越觉得剽窃了咱的想法哇.......
恩,楼主一代聪明人物,应该是原创
作者: pigge    时间: 2007-9-10 09:07

偶然间搜到这个帖子,有一种“惊艳”的感觉,很佩服lz的创意和想法,同时也感到有些遗憾,没想到1年前提出来的想法,直至今天还没实现……开发组任重道远啊
作者: tabris    时间: 2007-9-10 10:54

不少人说要只能判断 我就怕只能以后又有人说tw费cpu了
作者: daoshan    时间: 2007-9-10 14:41

先占个位子,等会再看啊
作者: 鲁速    时间: 2007-9-11 23:14

黑白名单过滤我一直没使用,不过支持这样的改进与思考。
作者: xuyong    时间: 2007-9-13 11:07

LZ的建议有一定可行性,毕竟软件再怎么智能也不可能达到人的高度。
一、弹出式广告的拦截
目前弹出式广告的拦截还是基于黑名单式的,需要消耗很多的CPU资源。
建议在浏览网页的时候,弹出广告一律屏蔽掉,甚至不要下载弹出广告上的资源,节省CPU执行效率,如果该页面有弹出广告,做个提示就可以了,由用户来决定是否打开,当然加入白名单的例外。
二、页面浮动广告
这类广告通过黑名单特征串来屏蔽,然后辅以跟特定网站相关的特征串来屏蔽




欢迎光临 世界之窗论坛 (http://bbs.theworld.cn/) Powered by Discuz! 7.2