- UID
- 1110
- 帖子
- 2787
- 精华
- 3
- 贡献
- 20
- 推广
- 0
- 有效BUG
- 0
- 注册时间
- 2005-5-26
|
看了一下,应该是匹配内容过长造成的,这种情况下可以尝试将要过滤的内容分成几段来过滤。
依你提供的页面为例,需要过滤的部份是如下的一段:
- <table border="0" cellpadding="0" style="border-collapse: collapse" width="100%">
- ......
- </table>
复制代码
整个table内容过长,所以你开始的规则没有效果,我稍微看了一下,table中存在大量的类似这样的内容:- <div class=divindex><span class=fr style='text-align:left'>【披着毛皮的狼】</span>[<a href='thread.php?fid=74'><b> ◎ - 电脑学堂</b></a>]<a href='read.php?tid=34953' title='标 题:最老的86版五笔安装软件
- 作 者:披着毛皮的狼
- 回 复:0
- 点 击:7
- 回复时间:2009-01-04 20:16
- 最后回复:披着毛皮的狼'>最老的86版五笔安装软件</a></div>
- <div class=divindex><span class=fr style='text-align:left'>【小破孩】</span>[<a href='thread.php?fid=43'><b>◎ - 疯狂灌水 </b></a>]<a href='read.php?tid=34952' title='标 题:高房价作祟 楼市新政未根本改变交易乏振局面
- 作 者:小破孩
- 回 复:0
- 点 击:9
- 回复时间:2009-01-04 20:14
- 最后回复:小破孩'>高房价作祟 楼市新政未根本改变交易乏振局 ..</a></div>
- <div class=divindex><span class=fr style='text-align:left'>【披着毛皮的狼】</span>[<a href='thread.php?fid=74'><b> ◎ - 电脑学堂</b></a>]<a href='read.php?tid=34951' title='标 题:方便朋友们下载的:360安全卫士(可及时升级)
- 作 者:披着毛皮的狼
- 回 复:0
- 点 击:8
- 回复时间:2009-01-04 20:12
- 最后回复:披着毛皮的狼'>方便朋友们下载的:360安全卫士(可及时升级)</a></div>
- <div class=divindex><span class=fr style='text-align:left'>【小破孩】</span>[<a href='thread.php?fid=43'><b>◎ - 疯狂灌水 </b></a>]<a href='read.php?tid=34950' title='标 题:郑州市规划局19名班子成员网上“晒”述职报告
- 作 者:小破孩
- 回 复:0
- 点 击:10
- 回复时间:2009-01-04 20:06
- 最后回复:小破孩'>郑州市规划局19名班子成员网上“晒”述职 ..</a></div>
复制代码
很明显可以看到有如下内容是不断重复的:
- <div class=divindex>
- ...
- </div>
复制代码
所以,可以先用规则把这部份过滤掉,这样剩下的table内容就不会太长了,再用另外一条规则过滤这个table就行了
注:过滤规则是有先后顺序的,一定要按照需要过滤的内容的先后排序,不然会有问题 |
|