返回列表 发帖
非常感谢楼主的共享规则,顺带问个网站怎么广告过滤

链接如http://www.86zw.com/Html/Book/16/2059/476349.shtml   右面的部分,怎么用页面元素过滤呢

谢谢了

TOP

原帖由 elkay 于 2007-2-13 01:54 发表


页面规则如下,去掉右边的广告,去掉正文开头和结尾部分的广告文字,拉伸页面到全屏


ex0=<td width=220.*?>(?:.|\n)*?<\/td>
re0=<!--ad-->
ex1=<table (bgcolor|width)=( ...


收到,非常感谢

TOP

btchina的过滤可以更彻底些么?谢谢

http://xs413.xs.to/xs413/07121/btchina-gl.JPG

TOP

关于广告过滤-页面过滤-页面替换,替换串中是否可使用通配符?


比如,我想把类似"http://www.86zw.com/Book/2059.aspx"替换成类似"http://www.86zw.com/Html/Book/16/2059/List.shtml"

2059 应该是属于变量吧

那么,我该如何替换呢?

我记得在WORD这类的文档处理软件中,在替换栏有类似代表查找结果的通配符号,不知目前TW过滤能否实现?

TOP

一个不知能否实现的想法,譬如http://www.86zw.com/Html/Book/19/2944/List.shtml这个小说网页目录.

在第一卷"分卷阅读"http://www.86zw.com/Book/B2944N14739.aspx这个网页里,

我想过滤三十章以前的小说内容,网页打开后只显示三十章以后的内容,(因为有的小说字数很多,而分卷阅读的话,看过的小说也会被下载,如果看过的部分很多的话,那么会浪费好多时间.....)

不知道这个想法能否实现,还有,页面过滤是否减轻了下载量?还是下载后重新过滤?


顺便问句,有谁知道达到这个目的的其他类似方法么?

TOP

可是我前三十章看过了....那么多字有时甚至是图片,都要等待好久....

所以,我宁愿每次改下规则....

TOP

呵.如果没法实现的话就算了^^
我其实是喜欢全文阅读,然后保存在本地硬盘,甚至改成手机电子书格式用的.

目前我都只能是全文下载了,然后再删除.

若是碰到都是VIP图片的,我就关闭图片显示后,打开网页,然后批量下载对应的图片.

总之,很曲线的完成....

TOP

嗯,目前仅此了,其实,之前给的那个网址还可以的

像这个http://www.86zw.com/Html/Book/16/2059/List.shtml

一个分卷阅读,可就得下载n久,

幸好,这种情况我很少用到^^

TOP

http://so.xunlei.com/search?sear ... restype=-1&id=1


迅雷的,能否干掉那些画圈的地方啊,我无法保存网页更研究不出规则,只得求助了
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们

TOP

原帖由 elkay 于 2007-5-17 19:10 发表 http://bbs.ioage.com/images/common/back.gif
图中有好多不是广告啊,比如顶部的搜索框,你都要过滤?


^^,有了TW,那搜索框不要也罢^^

总之,能干掉几个是几个,

有时我也在想,将来可否出现这样的过滤规则,即"除了需要的地方,其他的都过滤"....

TOP

原帖由 elkay 于 2007-5-17 19:26 发表 http://bbs.ioage.com/images/common/back.gif



去掉右边广告,和页面上部的文字广告吧,其他的就算了,都是正规的内容,一来去掉这些规则要好几条,二来也给人留点面子吧,不是广告的就算了

#exd#*.xunlei.com*#loadScript\("http://biz5.sandai ...



嘎嘎 ,漂亮,收下了

另:现在的这个帖子37页,好像不都在置顶里面吧,私下有心全部收藏,做到一半发现好些规则经过了不断修改的,无法判断有用呢,遂放弃....

TOP

返回列表