返回列表 发帖

求助:A过滤 + B页面,必死……

A过滤为 #exd#*macd.cn*#<TR.*?altbg2.*?>(?:.|\n)*?<\/TR>###<!--Ad blocked by TheWorld2-->
B页面为 http://bbs.macd.cn/thread-1130543-15-1.html

只要使用这个过滤进入该页面,CPU占用立刻飚到百分之百;奇怪的是,该帖的其他页(如http://bbs.macd.cn/thread-1130543-4-1.html)却不会出现这个问题。

恳请高手帮忙!

另外,若有可能,还请高手制作该页面的完整广告过滤,之前E版帮做了一个,但过滤得还不是很干净。如下:
#exd#*macd.cn*#<DIV.*?MACDStocksbannerStocks.*?>(?:.|\n)*?<\/DIV>###<!--Ad blocked by TheWorld2-->
#exd#*macd.cn*#<TR.*?altbg2.*?>(?:.|\n)*?<\/TR>###<!--Ad blocked by TheWorld2-->

原帖由 Aycox 于 2007-5-1 22:57 发表 http://bbs.ioage.com/images/common/back.gif
那个论坛一楼的用这个试试
#exd#*.macd.cn*#]*?width="506[^>]*?>[\s\S]*?###


有效!非常感谢楼上几位的帮助!!

TOP

7楼A版的就可以,呵呵

TOP

那个论坛一楼的用这个试试
#exd#*.macd.cn*#<TABLE[^>]*?width="506[^>]*?>[\s\S]*?<\/TABLE>###<!--Ad blocked by TheWorld2-->

TOP

谢谢e版!
一楼的那个有效,已经不会死了。
但三楼的这个没效果……能不能麻烦你帮忙把这个页面的源代码再分析一下。主要的广告有三块,其中两块已经可以过滤掉了,但每页一楼的那块还不行。
谢谢!
页面为http://bbs.macd.cn/thread-1130543-14-1.html

TOP

回复 #3 Surreal 的帖子

这个的话只要过滤掉里面的js脚本就可以了。
下面的是匹配页面中的js脚本
  1. <SCRIPT[\s\S]*?cpro[\s\S]*?<\/SCRIPT>
复制代码


本地测试通过

TOP

一楼的改成下面的试试看
  1. #exd#*macd.cn*#<TR[^>]*?altbg2[^>]*?>[\s\S]*?<\/TR>###<!--Ad blocked by TheWorld2-->
复制代码

TOP

多谢指点!
另外请教一个问题,下面这段代码想过滤掉,正则式应怎么写呢?
  1. <TD bgColor=#ffffff height=72><A
  2.                   href="http://www.mgforex.com/adlink.asp?ad=link-2&amp;ref=macd&amp;sec=demorequest&amp;lang=chs"
  3.                   target=blank><FONT
  4.                   color=red><B>免费模拟帐户,供您永久使用 MG金融集团,美国注册外汇经纪商</B></FONT></A>
  5.                   <BR><BR><A href="http://www.macd.cn/" target=blank><FONT
  6.                   color=blue><B>〖MACD即时消息搜索引擎全新推出〗查询个股即时发生的消息</B></FONT></A> <A
  7.                   href="http://bbs.macd.cn/forumdisplay.php?fid=83"
  8.                   target=blank><FONT color=blue><B>〖到这里提意见建议〗</B></FONT></A>
  9.                   <BR><IMG src="欧奈尔选股法100只牛股纵览_files/download.gif">
  10.                   <SCRIPT type=text/javascript>
  11. var arrBaiduCproConfig=new Array();
  12. arrBaiduCproConfig['uid'] =56689;
  13. arrBaiduCproConfig['n'] ='coolsun1858cpr';
  14. arrBaiduCproConfig['tm'] =20;
  15. arrBaiduCproConfig['cm'] =76;
  16. arrBaiduCproConfig['um'] =26;
  17. arrBaiduCproConfig['w'] =506;
  18. arrBaiduCproConfig['h'] =78;
  19. arrBaiduCproConfig['wn'] =1;
  20. arrBaiduCproConfig['hn'] =1;
  21. arrBaiduCproConfig['ta'] ='right';
  22. arrBaiduCproConfig['tl'] ='bottom';
  23. arrBaiduCproConfig['bu'] =0;
  24. arrBaiduCproConfig['bd'] ='#FFFFFF';
  25. arrBaiduCproConfig['bg'] ='#FFFFFF';
  26. arrBaiduCproConfig['tt'] ='#5C579E';
  27. arrBaiduCproConfig['ct'] ='#000000';
  28. arrBaiduCproConfig['url'] ='#666666';
  29. arrBaiduCproConfig['bdl'] ='#FFFFFF';
  30. arrBaiduCproConfig['rad'] =1;
  31.   </SCRIPT>
  32.                   <SCRIPT type=text/javascript>
  33. <!--
  34. document.write(baiduCproIFrame());
  35. -->
  36.   </SCRIPT>
  37.                    </TD></TR>
  38.               <TR>
  39.                 <TD>
  40.                   <SCRIPT type=text/javascript>
  41. cpro_client='coolsun1858cpr';
  42. cpro_cbd='#E0E4F3';
  43. cpro_cbg='#79829E';
  44. cpro_ctitle='#FFFFFF';
  45. cpro_clink='#444444';
  46. cpro_w=468;
  47. cpro_h=15;
  48. cpro_template='tlink_default_468_15';
  49. </SCRIPT>
  50.                 </TD>
复制代码

TOP

用正则编写过滤项的时候,是有可能出现这个情况的,罪魁祸首应该是.*?, 这个东西是要慎用的,很容易出现循环嵌套

在尽可能的情况下不要用.*这种方式,可以使用别的替代品,比如[^>]*等
遇到崩溃假死或者感觉速度慢或者其他问题的朋友可以先试试使用TW3
TheWorld we explore the world.

TOP

返回列表