返回列表 发帖
原帖由 xwhyc 于 2007-2-13 21:50 发表
看来你还是不懂我的意思,比如在网页http://www.ioage.com/hl/cn/h2.htm#1中查看那个图片地址是,在2.0中想过滤那个图片,你用*/hl/*、*/cn/*、*/images/*黑名单是 ...


我不是说了嘛,不管是相对地址还是绝对地址,只要匹配到黑名单中的关键词就会过滤,就如这个图片为例子,过滤掉并不是因为它所在的目录,而是因为它的文件名是gg_cn.gif,它所在的地址是images/gg_cn.gif,已经符合规则中/gg_这样的情况,所以就会被过滤掉,看来你还没搞清楚过滤机制的原理

TOP

看来你还是不懂我的意思,比如在网页http://www.ioage.com/hl/cn/h2.htm#1中查看那个图片地址是http://www.ioage.com/hl/cn/images/gg_cn.gif,在2.0中想过滤那个图片,你用*/hl/*、*/cn/*、*/images/*黑名单是无法过滤掉那个图片的,就因为网页源代码中src="images/gg_cn.gif",而不是src="http://www.ioage.com/hl/cn/images/gg_cn.gif",所以过滤不了,在1.3x不存在这个问题,是可以过滤的。

TOP

原帖由 xwhyc 于 2007-2-13 17:37 发表

我说的意思是现在的过滤规则是只过滤页面源代码src="******",但是src="******"中*****好多都是相对地址,黑名单匹配好多就不起作用了

相对地址也是可以过滤的,比如/ad/,不管你是src="ad/1.gif"还是src=http://www.123.com/ad/1.gif"都是可以匹配到的,这点不用担心

原帖由 杀手在线 于 2007-2-13 18:12 发表
楼主:对于新用户,特别是直接从2.0版本开始用的新用户来说,你的置顶贴后面针对新浪、网易等这样的“页面内元素过滤”的规则应该说得更清楚点,建议你再去编辑一下。
比如说新浪的:sina.com 新浪网
ex1=< ...

我有连接到置顶的专门的帖子啊,那个帖子有详细的介绍所以我就没有写了,看来我还是去稍微注释一下吧,谢谢你的提醒,呵呵
关于btchina的规则会影响其他网站目前没有好的办法解决,因为现在还不支持网址匹配,所以难免会有这样的情况出现,等以后的版本页面过滤有了网址匹配就不会了

[ 本帖最后由 elkay 于 2007-2-13 18:23 编辑 ]

TOP

楼主:对于新用户,特别是直接从2.0版本开始用的新用户来说,你的置顶贴后面针对新浪、网易等这样的“页面内元素过滤”的规则应该说得更清楚点,建议你再去编辑一下。
比如说新浪的:sina.com 新浪网
ex1=<!--企业服务文字广告开始-->(?:.|\n)*?<!--正文结束-->
re1=</table><!--ad-->
ex1=<td.*?width="612".*?>
re1=<td width="99%" valign="top" class="lc_blue">

这些ex和re的,是得去手动在ini文件里面添加的啊,如果直接复制粘贴到2.0的自定义的窗口中,程序会自动给其加上url=于其前面啊
另外,还要告知,这个得更改编号。用了新浪的这个,再用网易的话,网易的就不能用ex0、re0和ex1、re1了,得分别用**2和**3了啊。
其实我不怎么懂正则,稍微懂一点网页,这些都是我一点点测试出来的,不知道对不对。一个新手估计就更不会用了。我也是看了你后来发的一个赞扬TW的过滤规则的那个帖子,以新浪为例,赞TW不仅过滤了,还可以更改网页布局,使得广告不但去除了,而且不留空白,更加美观。我是看了那个帖子才慢慢试出来的,试了N遍,才知道————哦,原来是不能直接添加在设置的框里面,要去手工编辑ini文件,还得改前缀的编号(呵呵,还是下载了你在那里面给一个用户作“单独辅导”的ini文件的该段代,仔细比对之下才知道的,该用户估计就是和我差不多,也没改编号,可见,这是个带有一定普遍性的问题)。哦,还要提示大家一下,测试的时候,打开同一个页面的时候,最好ctrl+f5键强制性的刷新一下,不然浏览器会直接调用缓存里面的上一次打开的页面,你会以为过滤规则没起作用的。。。

哦,还有,那个btchina的,似乎有点问题。btchina倒是没怎么过滤掉,绿软的页面却被过滤得一塌糊涂。有空您测测,不然可能就是我的RPWT了,嘎嘎

还是要多谢您


[ 本帖最后由 杀手在线 于 2007-2-14 02:38 编辑 ]
浪子走天涯……
天涯又在哪里……

TOP

原帖由 elkay 于 2007-2-13 17:29 发表



按理说直接加上@@gg_cn.gif应该就可以了

我说的意思是现在的过滤规则是只过滤页面源代码src="******",但是src="******"中*****好多都是相对地址,黑名单匹配好多就不起作用了

TOP

原帖由 xwhyc 于 2007-2-13 17:25 发表


----------------
看看源代码,你就知道为什么没用,HTML过滤功能难道就是src="****"中的匹配,怪不得好多黑名单都不起作用,那个图片地址是screen.width*0.7) {this.resized=true; this.width=screen.width*0.7; this.alt='Click here to open new window\nCTRL+Mouse wheel to zoom in/out';}"    alt="" />,@@*/ ...



按理说直接加上@@gg_cn.gif应该就可以了

TOP

原帖由 mbllokmb 于 2007-2-13 17:24 发表
有个强列的要求 你能不能把 现在 更新和以前的起一写在一个篮中 这样用起来很方便


一般来说我只推荐使用最上面的那3条独立的规则,下面的就根据自己的实际情况选择使用,没必要全加上,规则越多越容易出问题啊

TOP

原帖由 jym2005 于 2007-2-13 16:17 发表


发帖前就4过了。。。问题是我+了@@*ioage.com*也没用。。


----------------
看看源代码,你就知道为什么没用,HTML过滤功能难道就是src="****"中的匹配,怪不得好多黑名单都不起作用,那个图片地址是http://www.ioage.com/hl/cn/images/gg_cn.gif,@@*/hl/*,@@*/cn/*,@@*/images/*都不起作用,因为src="images/gg_cn.gif",@@*images*、@@images*都是可以的,变态是只能加一条白名单,多于一条白名单就不起作用了,只好用正则
源代码
<html>
<HEAD><TITLE>
网站别名-帮助</TITLE>

<META http-equiv=Content-Type content="text/html; charset=gb2312">

<STYLE type=text/css>TD {

        FONT-SIZE: 14px; LINE-HEIGHT: 150%

}

.t12 {

        FONT-SIZE: 12px; LINE-HEIGHT: 150%

}

.t16 {

        FONT-WEIGHT: bold; FONT-SIZE: 16px; LINE-HEIGHT: 150%

}

</STYLE>

</HEAD>

<BODY leftMargin=0 topMargin=0 marginheight="0" marginwidth="0">

<TABLE height="100%" cellSpacing=0 cellPadding=0 width="100%" border=0>

<TBODY>

<TR>

<TD height=48>

<TABLE height=48 cellSpacing=0 cellPadding=0 width="100%" border=0>

<TBODY>

<TR>

<TD width=309 background=images/sztop.gif>

<DIV align=left>  <STRONG><FONT color=#ffffff><SPAN class=t14>世界之窗选项帮助</SPAN></FONT></STRONG></DIV></TD>

<TD background=images/sztop2.gif>  </TD></TR></TBODY></TABLE></TD></TR>

<TR>

<TD vAlign=top>

<TABLE width="100%">

<TBODY>

<TR>

<TD width=20> </TD>

<TD> </TD></TR>

<TR>

<TD> </TD>

<TD class=t16>网站别名</TD></TR></TBODY></TABLE>

<TABLE width="90%">

<TBODY>

<TR>

<TD width=40> </TD>

<TD vAlign=top>

<P>网站别名:<BR>在地址栏中输入快捷词,可以访问它对应的网址,这样常用的网站就不用输入全称了。 <BR>例如:自定义快捷词gg,对应网址www.google.com,以后可以在地址栏输入gg来访问www.google.com</P>

<P><IMG height=383 src="images/gg_cn.gif" width=616> </P>

<P><FONT color=#ff6600>注意:每个“快捷网址健”和“网站别名”可以同时对应多个地址,之间可以用分号(;)分隔开。</FONT></P>

<P></P></TD></TR></TBODY></TABLE></TD></TR>

<TR>

<TD> </TD></TR>

<TR>

<TD bgColor=#f0f0f0 height=40>

<DIV class=t12 align=center><A href="http://www.ioage.com/cnnew/index.htm" target=_blank>世界之窗网站</A></DIV></TD></TR></TBODY></TABLE></BODY>
</html>

TOP

有个强列的要求 你能不能把 现在 更新和以前的起一写在一个篮中 这样用起来很方便

TOP

过滤规则所牺牲的速度应该是感觉不出来的,可能有其他的原因

TOP

提示: 作者被禁止或删除 内容自动屏蔽

TOP

过滤规则多了 真的很卡

TOP

返回列表