标题:
[TheWorld 3]
有人进来教一下怎么屏蔽TABLE吗?
[打印本页]
作者:
zoemike
时间:
2010-3-30 20:04
标题:
有人进来教一下怎么屏蔽TABLE吗?
比如屏蔽
<table border="0"><tr height="250">
<td width="300">
<fieldset style='width:255;height:255;border:1px dashed #a6ccf9'> </fieldset>
</td>
<td width="300">
<fieldset style='width:255;height:255;border:1px dashed #a6ccf9'> </fieldset>
</td>
</tr>
</table>
这段,要怎么写?
作者:
jym2005
时间:
2010-3-30 20:37
提示:
作者被禁止或删除 内容自动屏蔽
作者:
zoemike
时间:
2010-3-30 22:36
谢谢啊,不过那个网页好像还有其他地方有border="0 这样导致把其他的也屏蔽了。
作者:
zoemike
时间:
2010-3-30 22:47
2#
jym2005
http://paoshu8.com/Html/Book/7/7731/2423574.shtm
比如这个网址,下面是我写的代码
<rule>
<name>泡书8</name>
<domains>
<domain>
<include>
<![CDATA[*paoshu8.com*]]>
</include>
</domain>
</domains>
<pattern type="1">
<targets>
<param>
<![CDATA[script]]>
</param>
</targets>
<pattern type="3">
<targets>
<param>
<![CDATA[http]]>
</param>
<replace>
<![CDATA[ ]]>
</replace>
</targets>
</pattern>
</pattern>
</rule>
复制代码
然后去掉一些广告之后,变成了
下载
(24.6 KB)
2010-3-30 22:47
,
如果加上你帮我写的TABLE代码的话,就会变成
下载
(13.31 KB)
2010-3-30 22:47
。
上面的内容也不见了。。
知道怎么回事么?
图片附件:
未命名.jpg
(2010-3-30 22:47, 24.6 KB) / 下载次数 2085
http://bbs.theworld.cn/attachment.php?aid=92788&k=dd69a7591d1468d44d3bb99ce990c6c3&t=1732598129&sid=Ws0cWh
图片附件:
未命名3.jpg
(2010-3-30 22:47, 13.31 KB) / 下载次数 2045
http://bbs.theworld.cn/attachment.php?aid=92789&k=77e4c99321e97a8b0ac915a7141aa8ac&t=1732598129&sid=Ws0cWh
作者:
zoemike
时间:
2010-3-30 23:07
本帖最后由 zoemike 于 2010-3-30 23:15 编辑
行了。。。自己研究搞定了。。
不过还是谢谢二楼的启示
<rule>
<name>泡书8</name>
<domains>
<domain>
<include>
<![CDATA[*paoshu8.com*]]>
</include>
</domain>
</domains>
<pattern type="1">
<targets>
<param>
<![CDATA[script]]>
</param>
<paramex>
<![CDATA[http]]>
</paramex>
<replace>
<![CDATA[ ]]>
</replace>
</targets>
</pattern>
<pattern type="1">
<targets>
<param>
<![CDATA[iframe]]>
</param>
<paramex>
<![CDATA[baidu]]>
</paramex>
<replace>
<![CDATA[ ]]>
</replace>
</targets>
</pattern>
<pattern type="1">
<targets>
<param>
<![CDATA[table]]>
</param>
<paramex>
<![CDATA[border="0" height="90"]]>
</paramex>
<replace>
<![CDATA[ ]]>
</replace>
</targets>
</pattern>
<pattern type="1">
<targets>
<param>
<![CDATA[tr]]>
</param>
<paramex>
<![CDATA[height="250"]]>
</paramex>
<replace>
<![CDATA[ ]]>
</replace>
</targets>
</pattern>
</rule>
复制代码
作者:
小絮
时间:
2010-3-31 00:23
单纯从这个页面来说,先过滤属性为“border="0"”的table,再过滤属性为“google”或(属性为“http”)的script,就可以得到很好的过滤效果。代码如下:
<rule>
<name>demo</name>
<domains>
<domain>
<include>
<![CDATA[*paoshu8.com*]]>
</include>
</domain>
</domains>
<pattern type="1">
<targets>
<enable><![CDATA[1]]></enable>
<param>
<![CDATA[table]]>
</param>
<paramex>
<![CDATA[border="0"]]>
</paramex>
<replace>
<![CDATA[<!-- blocked by 33 -->]]>
</replace>
</targets>
</pattern>
<pattern type="1">
<targets>
<enable><![CDATA[1]]></enable>
<param>
<![CDATA[SCRIPT]]>
</param>
<paramex>
<![CDATA[google]]>
</paramex>
<replace>
<![CDATA[<!-- blocked by 33 -->]]>
</replace>
</targets>
</pattern>
</rule>
复制代码
作者:
小絮
时间:
2010-3-31 00:35
其实这个页面的广告主要由三类脚本产生,1、google广告,特征词为“google”或“_ads”;2、百度广告脚本,特征词为“baidu”或“crop”;3、本站广告脚本,特征词为“gg”。其中百度和本站的广告脚本包含在table框里面,所以将整个table过滤掉后就不需要再查找这两个脚本了。
楼主的所用规则的含义是:从“<script”开始到“</script>”结束,只要中间含有“http”字符串的一律过滤掉。杀伤范围太大了,而且效率也不是很高。
paramex是后来加上的参数,含义是:在指定元素属性中查找特征词。
若楼主将你过滤script元素的规则改成使用paramex辅助,则是仅仅在<script .......>中查找“http”,在该页面中就不会产生误过滤了。
作者:
zoemike
时间:
2010-3-31 19:16
7#
小絮
谢谢你耐心的教导。我不是很明白<enable><![CDATA[1]]></enable>
这个的作用,是不是就是你后面提到的仅仅在<script>中查到http字符串?
因为我是临时看那个广告过滤教程做的,很多地方都不懂,希望能得到解答。
另外我想问一下,在哪里可以看到比较完整的人性化的教程?(那个TW3的教程后面的TYPE真的看不懂什么意思)
作者:
jym2005
时间:
2010-3-31 19:47
提示:
作者被禁止或删除 内容自动屏蔽
作者:
小絮
时间:
2010-4-1 12:54
http://bbs.ioage.com/cn/thread-122642-1-1.html
这是e版写的教程,比较详细。如果您有兴趣研究广告过滤,可以加入这个过滤讨论QQ群:2518335
欢迎光临 世界之窗论坛 (http://bbs.theworld.cn/)
Powered by Discuz! 7.2