返回列表 发帖
首页的规则对搜狐过滤不起效,老大能改一下么

TOP

回复 #840 bigwuya 的帖子

哪个地方失效了?能举个例子么?我试了下还能过滤啊

TOP

原帖由 elkay 于 2007-5-7 21:26 发表 http://bbs.ioage.com/images/common/back.gif
哪个地方失效了?能举个例子么?我试了下还能过滤啊

搜狐两边的flash广告

TOP

回复 #842 bigwuya 的帖子

你是说首页?

TOP

回复 #843 elkay 的帖子

是的老大,我用下面两个都无法过滤sohu广告
  1. /(?:\.|\/|_|")(?:ads?(?:\d|code|gif|graph|list|log|puba|s?file|sence|site|show)?|(?:ali)?union(?:sky|sys)?|all(?:4ad|yes)|banner|cooperate|corporate|SogouUnion.*|cp(?:c|ro)|(?:guan|my)?gg(?:ao)?|keyrun|p(?:4|f)p|sp(?:onsor|code))s?(?:\d)*(?:\.|\/|_)/
  2. /[\W_]ads?(?!=&)(?:banner|click|flow|frame|ima?ge?|log|serv(?:er|e)?|stream|type|view|vert(?:ising|ise?ment)?|trix|xchange|wrapper)?s?[\W\d_]/
  3. /(?:\/|\-|_)(?:\d){2,3}x(?:\d){2,3}[^0-9]+(?:swf|gif|jpg)/
  4. #exd#*.google.*#q=cache###by=theworld&q=cache
  5. #exd#*.btchina.net*#<!-- begin of ad block -->(?:.|\n)*?<!-- end of ad block -->###<!--Ad blocked by TheWorld2-->
  6. #exd#*.btchina.net*#<TD align=center width="20%">(?:.|\n)*?<\/TD>###<!--Ad blocked by TheWorld2-->
  7. #exd#*.sina.*#<div id=PublicRelation[^>]*?>(?:.|\n)*?<\/div>###<!--Ad blocked by TheWorld2-->
  8. #exd#*.sina.*#<!--企业服务文字广告开始-->(?:.|\n)*?<!--正文结束-->###</table><!--Ad blocked by TheWorld2-->
  9. #exd#*.sina.*#<td width="(?:612|640)" valign="top" class="lc_blue">###<td width="100%" valign="top" class="lc_blue">
  10. #exd#*.sina.*#<style[^>]*?type="text/css[^>]*?>(?:.|\n)*?正文左边控制开始(?:.|\n)*?<\/style>###<link rel="stylesheet" type="text/css" id="css" href="http://files.myopera.com/elkay.theworld/filter/sina.css">
  11. #exd#*.sina.*#<DIV[^>]*class="?top_bar"?>[\s\S]*?http:\/\/unipro\.sina\.com\.cn\/[\s\S]*?<\/script>###<DIV class="top_bar"><SCRIPT src="http://nicolliu.googlepages.com/sinatopbar.js"></SCRIPT>
复制代码
  1. #exd#*.sohu.com*#<!--banner & 产品入口 st-->(?:.|\n)*?<!--banner & 产品入口 end-->###<!--Ad blocked by TheWorld2-->
  2. #exd#*.sohu.com*#<table[^>]*?align="left[^>]*?>(?:.|\n)*?<\/iframe><\/td><\/tr><\/table>###<!--Ad blocked by TheWorld2-->
  3. #exd#*.sohu.com*#<!--下通栏广告及文字链广告 st-->(?:.|\n)*?<!--内容区 end-->###<!--Ad blocked by TheWorld2-->
  4. #exd#*.sohu.com*#<style>(?:.|\n)*?网友意见箱(?:.|\n)*?<\/style>###<link rel="stylesheet" type="text/css" id="css" href="http://files.myopera.com/elkay.theworld/filter/sohu.css">
复制代码

[ 本帖最后由 bigwuya 于 2007-5-7 22:12 编辑 ]

TOP

  1. #exd#*.sohu.com*#<script[^>]*?sohuflash_\d\.js[^>]*?>[\s\S]*?<\/script>###<!--Ad blocked by TheWorld2-->
复制代码


这个可以干掉首页上所有的flash,试试

TOP

原帖由 elkay 于 2007-5-7 22:12 发表 http://bbs.ioage.com/images/common/back.gif
#exd#*.sohu.com*#]*?sohuflash_\d\.js[^>]*?>[\s\S]*?###

这个可以干掉首页上所有的flash,试试

干掉了,不过里面的非flash广告也干掉了

比如:http://sports.sohu.com/

TOP

还是谢谢elkay版主了,回复那么快,最后我用
  1. /(?:\.|\/|_|")(?:ads?(?:\d|code|gif|graph|list|log|puba|s?file|sence|site|show)?|(?:ali)?union(?:sky|sys)?|all(?:4ad|yes)|banner|cooperate|corporate|SogouUnion.*|cp(?:c|ro)|(?:guan|my)?gg(?:ao)?|keyrun|p(?:4|f)p|sp(?:onsor|code))s?(?:\d)*(?:\.|\/|_)/
  2. /[\W_]ads?(?!=&)(?:banner|click|flow|frame|ima?ge?|log|serv(?:er|e)?|stream|type|view|vert(?:ising|ise?ment)?|trix|xchange|wrapper)?s?[\W\d_]/
  3. /(?:\/|\-|_)(?:\d){2,3}x(?:\d){2,3}[^0-9]+(?:swf|gif|jpg)/
  4. #exd#*.google.*#q=cache###by=theworld&q=cache
复制代码
加上GreenBrowser的规则,暂时用下来过滤效果还可以,结果也算精确

附GB的
  1. */ad/*
  2. */ads.*
  3. */pops.*
  4. */popup/*
  5. */adfclick*
  6. http://gg.*
  7. http://ad.*
  8. */ad/*
  9. */ads/*
  10. */ggao/*
  11. */guanggao/*
  12. */wwwad/*
  13. */softad/*
  14. */newhuagg/*
  15. */cs/button/*
  16. */adimg.*
  17. */adimg/*
  18. */tuijianimg/*
  19. */adsence.*
  20. */adfshow*
  21. */adfclick*
  22. */advert*
  23. */adclient.*
  24. */adsview*
  25. */adsfile*
  26. http://ad.*
  27. http://mopgg.*
  28. http://ad*.sina.*
  29. *.narrowad.com/proxy/nad.jsp*
复制代码

[ 本帖最后由 bigwuya 于 2007-5-7 22:58 编辑 ]

TOP

啊,非flash的不会过滤啊,可能是其他规则过滤的,不过都是广告,过滤就过滤掉嘛

TOP

太平洋http://www.pconline.com.cn/过滤还是不彻底,广告图片地址相同的情况下,同一规则(http://image.pconline.com.cn/*)一半图片左右无法过滤,
而1.x或者其它浏览器轻松搞定的……

[ 本帖最后由 king_hh 于 2007-5-8 10:36 编辑 ]

TOP

回复 #849 king_hh 的帖子

这个是因为过滤机制不同造成的,2.0中必须要完全符合页面代码才能过滤,主要就是绝对路径和相对路径的问题。

TOP

关于广告过滤-页面过滤-页面替换,替换串中是否可使用通配符?


比如,我想把类似"http://www.86zw.com/Book/2059.aspx"替换成类似"http://www.86zw.com/Html/Book/16/2059/List.shtml"

2059 应该是属于变量吧

那么,我该如何替换呢?

我记得在WORD这类的文档处理软件中,在替换栏有类似代表查找结果的通配符号,不知目前TW过滤能否实现?

TOP

返回列表