原帖由 luyear 于 2007-1-16 16:56 发表
url0=/(\.|\/|_)(ad|adimage|adimg|adgif|adgraph|adinfo|adlog|adpic|banner|gg|guanggao|mygg|newhuagg|sms|sponsor|themis|usmsweb|union)(s)?(\d)*(\.|\/|_)/
url1=/ad(?!=&)(banner|click|flow|fra ...
原帖由 mutalisker 于 2007-1-17 16:59 发表
这个帖子中的正则表达式是针对img,iframe,js等标签src的过滤,和网页整体的用正则表达式过滤是两回事
另外,楼主的过滤项导致sina不能正常显示的问题已经找到并解决了,下个版本就能体现
原帖由 evilcat 于 2007-1-17 19:55 发表
果然是凤凰工作室的广告语:永远和用户在一起
LZ辛苦,无私的为咱们提供大家都不太明白的正则
原帖由 elkay 于 2007-1-17 21:32 发表
楼上的不是过滤的问题吧,那个网站的其他软件都可以下载的,估计是网站本身的问题
原帖由 jym2005 于 2007-1-18 08:42 发表
霏凡首页显示不是很正常,还有下载页底部有广告
http://un.265.com/index.htm?id=crsky
265上网导航 - 最多中国人使用的电脑主页
原帖由 tianyu21ty 于 2007-1-18 11:32 发表
http://www.djaol.com/index/htm/11655.htm 这个网站还是有广告~~~
原帖由 jym2005 于 2007-1-18 10:55 发表
http://down.oyksoft.com/downinfo/2.html
还有此处左边列表错位
原帖由 kidkidkid 于 2007-1-18 19:30 发表
看了一下, 感觉还不够模版化.也许是黑名单过滤的先天缺点吧.
建议LZ多研究研究HTML内容的正则式过滤, 会有收获的:>
其实SINA的广告我都舍不得过滤的, 看上去感觉还不错.
原帖由 elkay 于 2007-1-18 19:22 发表
*.sina.com.cn/ad/video/MediaPlayer.js
把上面的加到白名单应该可以了吧?
原帖由 mutalisker 于 2007-1-18 19:42 发表
白名单是网站白名单,是针对域名的,正确的做法是把这个串写成@@*.sina.com.cn/ad/video/MediaPlayer.js,然后加到过滤规则中
原帖由 tianyu21ty 于 2007-1-19 10:25 发表
添加以后,这个网站的网页显示不完:http://bbs.yhbest.cn/thread-242998-1-1.html
欢迎光临 世界之窗论坛 (http://bbs.theworld.cn/) | Powered by Discuz! 7.2 |