加入 我们
登录
论坛
搜索
导航
主站
论坛会员
帮助中心
私人消息 (0)
公共消息 (0)
系统消息 (0)
好友消息 (0)
帖子消息 (0)
世界之窗论坛
»
广告过滤规则讨论
» 正则表达式怎么写?
返回列表
发帖
okseek
发短消息
加为好友
okseek
当前离线
UID
58456
帖子
20
精华
0
积分
20
威望
20
贡献
0
推广
0
有效BUG
0
阅读权限
30
来自
fuzhou
在线时间
13 小时
注册时间
2007-5-14
最后登录
2019-4-28
初级用户
UID
58456
帖子
20
精华
0
贡献
0
推广
0
有效BUG
0
来自
fuzhou
注册时间
2007-5-14
1
#
跳转到
»
正序看帖
打印
字体大小:
t
T
发表于 2009-3-20 03:00
|
只看该作者
正则表达式怎么写?
正则表达式
我经常网上看小说 常去的小说站广告的源代码如下:
<script language='JavaScript' type='text/javascript' src='http://cpro.baidu.com/cpro/ui/cp.js'></script>
有多个类似的,不同的只是src=""里面的js路径而已,
本人对正则表达式不熟,请大家帮忙写个通用的可过滤这种类型的正则表达式,
谢谢!
收藏
分享
极品小猫
发短消息
加为好友
极品小猫
当前离线
UID
60057
帖子
134
精华
0
积分
135
威望
135
贡献
0
推广
0
有效BUG
0
阅读权限
40
在线时间
43 小时
注册时间
2007-5-27
最后登录
2014-1-27
中级用户
UID
60057
帖子
134
精华
0
贡献
0
推广
0
有效BUG
0
注册时间
2007-5-27
10
#
发表于 2009-3-31 13:16
|
只看该作者
BS一个
TOP
needed
发短消息
加为好友
needed
(>_<)
当前离线
首席替补 | 插件区
UID
10253
帖子
3334
精华
0
积分
3467
威望
3427
贡献
20
推广
0
有效BUG
0
阅读权限
255
性别
男
来自
江门·中国
在线时间
20260 小时
注册时间
2006-4-28
最后登录
2024-5-18
管理员
UID
10253
帖子
3334
精华
0
贡献
20
推广
0
有效BUG
0
来自
江门·中国
注册时间
2006-4-28
9
#
发表于 2009-3-31 07:43
|
只看该作者
100M光纤的路过..
天下无不散之筵席.
世界之窗浏览器开发计划
TOP
极品小猫
发短消息
加为好友
极品小猫
当前离线
UID
60057
帖子
134
精华
0
积分
135
威望
135
贡献
0
推广
0
有效BUG
0
阅读权限
40
在线时间
43 小时
注册时间
2007-5-27
最后登录
2014-1-27
中级用户
UID
60057
帖子
134
精华
0
贡献
0
推广
0
有效BUG
0
注册时间
2007-5-27
8
#
发表于 2009-3-29 10:41
|
只看该作者
大部分网站的广告都是大量的图片以及大型Flash~那应该都是很影响速度吧?
小的就那霏凡举例,顶部的广告一定要加载完才能看到下面的内容,这很烦人~网速不好的时候要等半天
TOP
needed
发短消息
加为好友
needed
(>_<)
当前离线
首席替补 | 插件区
UID
10253
帖子
3334
精华
0
积分
3467
威望
3427
贡献
20
推广
0
有效BUG
0
阅读权限
255
性别
男
来自
江门·中国
在线时间
20260 小时
注册时间
2006-4-28
最后登录
2024-5-18
管理员
UID
10253
帖子
3334
精华
0
贡献
20
推广
0
有效BUG
0
来自
江门·中国
注册时间
2006-4-28
7
#
发表于 2009-3-27 16:32
|
只看该作者
呵呵.. 有意思..
其实我也很少过滤广告 . 除非是严重影响阅读跟速度的..
天下无不散之筵席.
世界之窗浏览器开发计划
TOP
okseek
发短消息
加为好友
okseek
当前离线
UID
58456
帖子
20
精华
0
积分
20
威望
20
贡献
0
推广
0
有效BUG
0
阅读权限
30
来自
fuzhou
在线时间
13 小时
注册时间
2007-5-14
最后登录
2019-4-28
初级用户
UID
58456
帖子
20
精华
0
贡献
0
推广
0
有效BUG
0
来自
fuzhou
注册时间
2007-5-14
6
#
发表于 2009-3-26 23:35
|
只看该作者
谢谢!真的很感激!
因为我平常上网主要就只看看小说,而且几乎就是去长江中文这一家,其他的都没怎么去,所以不用基础黑名单,我就想有个针对长江中文的过滤就好了,省点资源。
而且 广告有时也是一种信息,因此如果有浏览其他网站时我觉得广告还是可以接受的,说不定哪天就从中有啥意外发现呢。
只是一些个人观点不同,呵呵,谢谢needed啦!
TOP
needed
发短消息
加为好友
needed
(>_<)
当前离线
首席替补 | 插件区
UID
10253
帖子
3334
精华
0
积分
3467
威望
3427
贡献
20
推广
0
有效BUG
0
阅读权限
255
性别
男
来自
江门·中国
在线时间
20260 小时
注册时间
2006-4-28
最后登录
2024-5-18
管理员
UID
10253
帖子
3334
精华
0
贡献
20
推广
0
有效BUG
0
来自
江门·中国
注册时间
2006-4-28
5
#
发表于 2009-3-21 19:25
|
只看该作者
#exd#*
www.changjiangzhongwen.com
*#<script[^>]+?ads[^<]*?<\/script>###过滤的长江中文广告
测试通过.
不过我还是强烈建议楼主添加置顶的基础黑名单.
因为那毕竟是版主辛辛苦苦的心血. 一定有它的价值.
天下无不散之筵席.
世界之窗浏览器开发计划
TOP
okseek
发短消息
加为好友
okseek
当前离线
UID
58456
帖子
20
精华
0
积分
20
威望
20
贡献
0
推广
0
有效BUG
0
阅读权限
30
来自
fuzhou
在线时间
13 小时
注册时间
2007-5-14
最后登录
2019-4-28
初级用户
UID
58456
帖子
20
精华
0
贡献
0
推广
0
有效BUG
0
来自
fuzhou
注册时间
2007-5-14
4
#
发表于 2009-3-21 17:20
|
只看该作者
本帖最后由 okseek 于 2009-3-21 17:28 编辑
有的还是不行啊
我黑名单中是这样设置的:
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?baidu[^<]+<\/script>###过滤的百度广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?googlesyndication[^<]+<\/script>###过滤的google广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?alimama[^<]+<\/script>###过滤的alimama广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?gonggao[^<]+<\/script>###过滤的长江中文广告
#exd#*.changjiangzhongwen.*#<script[^>]+?src=[\s\S]+?ads[^<]+<\/script>###过滤的长江中文广告
#exd#*.changjiangzhongwen.*#<a[^>]*?ads[^>]*?>[\s\S]*?<\/a>###<!--Ad blocked by TheWorld2-->
#exd#*.changjiangzhongwen.*#<a[^>]*?gonggao[^>]*?>[\s\S]*?<\/a>###<!--Ad blocked by TheWorld2-->
小说站首页:
http://www.changjiangzhongwen.com/
可以正常过滤了
但具体看某篇小说的章节时,如
http://www.changjiangzhongwen.com/xiaoshuo/7/7712/2122078.html
就没作用了
章节中源代码应该是类似<script type="text/javascript" src="/ads/top.js"></script>
<script type="text/javascript" src="/ads/zhangjie/2.js"></script>
<script type="text/javascript" src="http://www.changjiangzhongwen.com/gonggao.js"></script>这样的多个
我用ads gonggao等怎么过滤不掉呢?
请再帮帮忙吧,我对正则表达式很菜
我知道在过滤列表中直接写
http://www.changjiangzhongwen.com/gonggao.js
就可以过滤掉这个js文件,但这样就要具体写上每个广告的js,我就想用正则写个通用的
TOP
okseek
发短消息
加为好友
okseek
当前离线
UID
58456
帖子
20
精华
0
积分
20
威望
20
贡献
0
推广
0
有效BUG
0
阅读权限
30
来自
fuzhou
在线时间
13 小时
注册时间
2007-5-14
最后登录
2019-4-28
初级用户
UID
58456
帖子
20
精华
0
贡献
0
推广
0
有效BUG
0
来自
fuzhou
注册时间
2007-5-14
3
#
发表于 2009-3-21 16:48
|
只看该作者
可以用
万分感谢!
TOP
needed
发短消息
加为好友
needed
(>_<)
当前离线
首席替补 | 插件区
UID
10253
帖子
3334
精华
0
积分
3467
威望
3427
贡献
20
推广
0
有效BUG
0
阅读权限
255
性别
男
来自
江门·中国
在线时间
20260 小时
注册时间
2006-4-28
最后登录
2024-5-18
管理员
UID
10253
帖子
3334
精华
0
贡献
20
推广
0
有效BUG
0
来自
江门·中国
注册时间
2006-4-28
2
#
发表于 2009-3-20 09:41
|
只看该作者
本帖最后由 needed 于 2009-3-20 09:45 编辑
#exd#*
常去的小说站url
*#<script[^>]+?src=[\s\S]+?
这里写你想匹配的关键字[^<]+<\/script>
###这里是过滤后的字符,可空
上面的方法为tw2 提供独有的正则.
如果觉得不习惯, tw2同时提供了tw1.x方式过滤. 详细
可浏览
http://bbs.ioage.com/cn/thread-68858-1-1.html
天下无不散之筵席.
世界之窗浏览器开发计划
TOP
返回列表
2.x版本使用交流
灌水区
7.x版本使用交流
Windows系统使用与交流
1.x版本使用交流
团队日志
2.0皮肤设计大赛
浏览器皮肤资源
3.x版本使用交流
4.x极速版(Chrome)
世界之窗使用交流
7.x版本使用交流
团队日志
旧版使用交流
扩展和主题
6.x版本使用交流
5.x版本使用交流
4.x极速版(Chrome)
3.x版本使用交流
2.x版本使用交流
1.x版本使用交流
网络收藏夹测试区
常见问题解答
浏览器扩展
广告过滤规则讨论
TheWorld 6 过滤规则
TheWorld 3 过滤规则
TheWorld 2 过滤规则
浏览器皮肤资源
3.0皮肤设计大赛
3.0皮肤大赛讨论区
2.0皮肤设计大赛
浏览器插件资源
软件使用交流
图标壁纸光标美化
Windows系统使用与交流
休闲娱乐
读书之乐
每日一学
灌水区
天南海北
我的TheWorld 我的世界
会员交流、交友版
白金用户区
站务管理
站务广场
[收藏此主题]
[关注此主题的新回复]
[通过 QQ、MSN 分享给朋友]
管理团队