返回列表 发帖
还有这个,也不知道是如何给过滤掉的。

虽然是个小问题,不过还是提出来~
附件: 您需要登录才可以下载或查看附件。没有帐号?加入 我们
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

啊,对了,这个是需要COOKIE的,你可能不能登录。

我把源文件弄下来你给看看。

<html>
<head>
<meta http-equiv="Content-Type" c>
<meta name="WRITER" c>
<title>签到册·爬爬大陆</title>
<style>
A:visited {FONT-SIZE: 12px; COLOR: #444444; TEXT-DECORATION: none }
A:link { FONT-SIZE: 12px; COLOR: #444444; TEXT-DECORATION: none }
A:hover { FONT-SIZE: 12px; COLOR: #444444; TEXT-DECORATION: underline }
A.k1:visited {FONT-SIZE: 12px; COLOR: #444444; TEXT-DECORATION: none }
A.k1:link { FONT-SIZE: 12px; COLOR: #444444; TEXT-DECORATION: none }
A.k1:hover { FONT-SIZE: 12px; COLOR: #444444; TEXT-DECORATION: underline }
.title2 {FONT-SIZE: 16px; FONT-FAMILY: "黑体"; COLOR: #000000;}
table {FONT-SIZE: 12px; COLOR: #000000;}
INPUT{BORDER-TOP-WIDTH: 1px; PADDING-RIGHT: 1px; PADDING-LEFT: 1px; BORDER-LEFT-WIDTH: 1px; FONT-SIZE: 9pt; BORDER-LEFT-COLOR: #cccccc; BORDER-BOTTOM-WIDTH: 1px; BORDER-BOTTOM-COLOR: #cccccc; PADDING-BOTTOM: 1px; BORDER-TOP-COLOR: #cccccc; PADDING-TOP: 1px; HEIGHT: 18px; BORDER-RIGHT-WIDTH: 1px; BORDER-RIGHT-COLOR: #cccccc; background-color: #E6FFFF}
select {border-width: 1; border-color: #000000; background-color: #FFFFFF; font-family: 宋体; font-size: 9pt; font-style: bold;}
</style>
</head>
<body bottomMargin=2 leftMargin=0 topMargin=0 rightMargin=0>
<center>
<table border="0" width="760" cellspacing="0" cellpadding="0">
  <tr><td width="20%"><a href="http://our.3320.net/papaland/index.php"><img border="0" src="http://www.3320.net/images/landaid/landlogo3.jpg" width="160" height="20"></a></td>
  <td width="80%" align="right">
  <a href="http://our.3320.net/papaland/index.php?s=&act=SF&f=49">爬爬议会</a>
  </td></tr>
  <tr><td width="100%" colspan="2" height=1 bgcolor="#CDD0FC"></td></tr>
</table>
<table border="0" width="760" cellspacing="0" cellpadding="0">
<tr><td width="100%" height=90 align=center>
<!-- <SCRIPT LANGUAGE='JavaScript1.1' SRC='http://smarttrade.allyes.com/main/adfshow?user=1|2205|75865&db=smarttrade&border=0&local=yes&js=ie'></SCRIPT>
<br>每日一点,谢谢支持 -->
</td></tr>
</table>
<table border="0" width="760" cellspacing="0" cellpadding="0">
  <tr>
    <td width="162"><img border="0" src="/images/landaid/landqd1.gif" width="162" height=28></td>
    <td width="593" height=26 align=right valign=bottom>
     </td>
  </tr>
</table>
<table border="1" width="760" cellspacing="0" cellpadding="0" height="360" style="BORDER-COLLAPSE: collapse" borderColor=#D0D6FC>
  <tr><td width="100%">
<table border="0" width="100%" cellspacing="0" cellpadding="0" height="100%">
   <tr>
   <td width="160" bgcolor="#E8FFFF" valign="top">
   <table border="0" width="100%" cellspacing="3" cellpadding="3">
    <tr><td width="100%" height="360" align=center>
    </td></tr>
   </table>
   </td>
   <td width="1" bgcolor="#D0D6FC"></td>
   <td width="330" bgcolor="#FFFFFF" align="center" valign="top">
   <!-- 操作区 -->
   <table border="0" width="90%" cellspacing="0" cellpadding="0">
    <tr><td width="100%" height="20"></td></tr>
    <tr><td width="100%" height="1" bgcolor="#00BDBD"></td></tr>
    <tr><td width="100%" height="18" bgcolor="#00BDBD">
      <font color='#FFFFFF' face='Wingdings' size='1'>v</font> <font color='#FFFFFF'><b>混神</b>,这是您的签到记录。 </font>
     </td></tr>
    <tr><td width="100%" height="1" bgcolor="#008A8A"></td></tr>
    <tr><td width="100%" height="60" align="center" bgcolor="#F5F5F5" valign=top>
     <table border="0" width="100%" cellspacing="0" cellpadding="1" height="20">
     <tr><td width="100%" height="4" bgcolor=#F6F6F6 colspan="3"></td></tr>
   <tr><td width="100%" height="2" bgcolor=#E6E6E6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#E6E6E6>·</td>
    <td width="20%" bgcolor=#E6E6E6>2007-2-10</td>
    <td width="47%" bgcolor=#E6E6E6 align="right">59.48.145.94 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#F6F6F6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#F6F6F6>·</td>
    <td width="20%" bgcolor=#F6F6F6>2007-2-9</td>
    <td width="47%" bgcolor=#F6F6F6 align="right">59.48.144.14 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#E6E6E6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#E6E6E6>·</td>
    <td width="20%" bgcolor=#E6E6E6>2007-2-8</td>
    <td width="47%" bgcolor=#E6E6E6 align="right">59.48.147.122 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#F6F6F6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#F6F6F6>·</td>
    <td width="20%" bgcolor=#F6F6F6>2007-2-7</td>
    <td width="47%" bgcolor=#F6F6F6 align="right">59.48.151.146 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#E6E6E6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#E6E6E6>·</td>
    <td width="20%" bgcolor=#E6E6E6>2007-2-6</td>
    <td width="47%" bgcolor=#E6E6E6 align="right">59.48.151.209 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#F6F6F6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#F6F6F6>·</td>
    <td width="20%" bgcolor=#F6F6F6>2007-2-5</td>
    <td width="47%" bgcolor=#F6F6F6 align="right">59.48.151.209 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#E6E6E6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#E6E6E6>·</td>
    <td width="20%" bgcolor=#E6E6E6>2007-2-4</td>
    <td width="47%" bgcolor=#E6E6E6 align="right">59.48.144.158 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#F6F6F6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#F6F6F6>·</td>
    <td width="20%" bgcolor=#F6F6F6>2007-2-3</td>
    <td width="47%" bgcolor=#F6F6F6 align="right">59.48.147.240 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#E6E6E6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#E6E6E6>·</td>
    <td width="20%" bgcolor=#E6E6E6>2007-2-2</td>
    <td width="47%" bgcolor=#E6E6E6 align="right">59.48.145.155 </td>
   </tr>   <tr><td width="100%" height="2" bgcolor=#F6F6F6 colspan="3"></td></tr>
   <tr>
    <td width="3%" height="18" bgcolor=#F6F6F6>·</td>
    <td width="20%" bgcolor=#F6F6F6>2007-2-1</td>
    <td width="47%" bgcolor=#F6F6F6 align="right">59.48.145.22 </td>
   </tr>     </table>
    </td></tr>
    <tr><td width="100%" height="4" bgcolor=#F6F6F6 colspan="4"></td></tr>
    <tr><td width="100%" height="1" bgcolor="#C9EBDD"></td></tr>
    <tr><td width="100%" height="1" bgcolor="#00AA8A"></td></tr>
    <tr><td width="100%" height="10"></td></tr>
   </table>
   </td>
   <td width="*" valign=top><br style="line-height:7px"><br>
   <br>
   </td>
  </tr>
</table>
</td></tr>
</table>
<table border="0" width="760" cellspacing="0" cellpadding="0" bgcolor="#FFFFFF" height="10">
<tr><td width="100%" height="10" align=right><A HREF="http://www.3320.net/"><img border="1" src="/images/bz/3320_slogo.gif" width="90" height=18 style="border-color:#D0D6FC"></A></td></tr>
</table>
</body>
<HEAD><META HTTP-EQUIV="PRAGMA" C></HEAD>
</html>
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

原帖由 elkay 于 2007-2-10 20:03 发表
第一个没有过滤掉那个导航条啊,你是不是用了页面过滤规则?是的话去掉页面规则过滤中针对btchina的那一条,好像是跟那条有冲突,目前没有网址匹配所以会出现这种情况

第二个网站我没明白你的意思,你是想过 ...


第一个确实如此,我考虑了一下,这几条页面过滤规则我只需要fhzw和百度的就可以了,其它网站我基本不上,这样也可以减少黑名单大小,其它的也准备这么做。

第二条,其实是过滤的过多了,把那个页面中的除了签到的其它图片和链接都给过滤了,不过因为这只是单个的一个页面,还是需要COOKIE验证的内部页面,所以也不是很要紧拉~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

白名单呀,1.3中的白名单都让我一条一条的删了,发现没有啥能用的上的。


对了,你给解释一下,第一条中的

/(\.|\/|_|")(ads?(\d|code|gif|graph|list|log|puba|file|sence|site|show)|(ali)?union(sky|sys)?|all(4ad|yes)|bdun|banner|cp(c|ro)|(guan|my|newhua)?gg(ao)?|keyrun|p(4|f)p|sms|sp(onsor|code)|themis|ulink(js|dir)|un|usmsweb|xc)(s)?(\d)*(\.|\/|_)/

红色部分的作用范围到底是到绿色的部分,还是到蓝色的部分。我怎么越看越糊涂?
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

/(online(\d)|(\w){1,4})\.(265|ete).+(_\d+|show)(.php)/
/(dds|biz(\d))\.(sandai|sogua).+(gif|htm|jpg)/
/\.(ku6|mumayi).+(\d{2,}|head\d?)\.htm/


这三条是针对某个特定网站还是具有普适性?
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

*3320.net*
*add*
*admin*
*adsl*
*adva*
*alum*
*cnnews*
*microsoft.com*
*mybook*

这是仅存的白名单
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

应该是看糊涂了

[ 本帖最后由 混神 于 2007-2-10 21:13 编辑 ]
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

好像那个修改黑名单后页面过滤规则消失的BUG给没有了(置顶帖子关于COOKIE丢失的那个程序)
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

TiGer-x给你那5条中的第二条

/(\/|\-|_)(\d){2,3}x(\d){2,3}[^0-9]+(asp|html?|js\w?)/

你给的那个图片广告的例子
过滤类似760x60.gif这样的图片广告(更新了)

/(\/|\-|_)(\d){2,3}x(\d){2,3}[^0-9]+(swf|gif|jpg)/

这两个可以合并了~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

最新的两个版本中是不是黑名单不能用了呀?

而且我的这两个版本和黑名单的第一条冲突,只要有第一条,立刻崩溃~

此时我用fhzw测试(删除第一条后),发现黑名单不再起作用,页面过滤也不其作用。
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

起点中文的页面中最上方的盛大的广告如何过滤?

<TABLE height=30 cellSpacing=0 cellPadding=0 width="100%" border=0>
<TBODY>
  <TR>
   <TD vAlign=bottom><iframe height=30 src="http://sndasdopassport.sdo.com/sdodownload/passport/SNDAHomepage/SNDANewsBar.aspx" scrolling="no" frameborder="0" width="100%"></iframe></TD>
  </TR>
</TBODY>
</TABLE>
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

那是因为匹配的东西比较多吧~
混神日志(韩磊BLOG)
http://www.hanlei.cn

TOP

返回列表