附录 1 :过滤真的那么难么?
自从过滤扩展发布以来,自己尝试写规则的朋友越来越多了,最近有几个朋友问我,为什么按照教程贴里的方式无法过滤,或者找不到教程贴里的内容,后来我去看了他们要过滤的网站,其实是可以过滤的,问题就在于这些网站跟教程贴提供的不一样,这里我就稍微说一下过滤需要注意的问题
现在很多网站的页面都是DIV+CSS的,而教程贴里用的示例就是本论坛,也是这样,只要找到需要过滤的内容对应的div即可,问题是还有其他的广告并不是在div里的,有的是javascript脚本,有的是图片,这些都不能用div来搜索,需要换成对应的tag,比如script等等,而教程贴里提供的只是一个简单的示例,并不是一个固定的格式,不是说所有的网站都可以套用这个就能完成的,网站页面变化多端,不同的页面要用不同的方法,但是基本步骤都一样的,教程贴里提供的示例也就是给大家参考的一个基本步骤,在遇到其他情况下需要融会贯通。
tw3的过滤规则相比tw2简单,简单在不需要正则表达式基础,但是依然需要html语法基础,因为必须要清楚的知道需要过滤的内容在哪里才能在规则里写出来,好在html不需要怎么学习,多看几个页面源代码就能了解的差不多了,很多人会产生一个误解,有html基础并不是说你要非常了解或者说能自由运用,过滤功能所要求的html基础仅仅是要求对html有最基本的了解就可以了,所以不要被这些繁琐的语法吓倒,因为我们要做的不是写一个网站,而仅仅是过滤某个页面上的一小段内容而已。而过滤规则本身所使用的xml直接忽略就可以了,写规则的时候复制现成的参数拼接一下就行了。
小结:
1. 过滤不在乎你的知识多么丰富(什么正则表达式啊,html语法啊,这些都无所谓),在乎的是你的想法,只要你想到了方法就完成了过滤的绝大部分,因为这些知识都是死的,需要用的时候再去查也来得及
2. 千万不要被复杂html和xml语法吓倒,因为我们不需要非常熟悉这些,只要稍微了解就可以了,就向上面说的,需要用的时候再去查也来得及,毕竟都是死的
~~~~~以上内容写于 2009.12.28 | 未完待续~~~~~ |