返回列表 发帖

【转】正则应该过滤的-恶意网址的目录

我在中天上面看到的恶意网址目录希望对作正则表达式的朋友有帮助
原地址在
http://bbs.366tian.net/viewthread.php?tid=332811&extra=page%3D1

2007年1月1日添加如下网址:
heimomo84604.131.tofor.com/zh/zhwlz.htm
ycdy.com/demo/mm.htm
163ooo.com
googkle.com
77930.com/66/1.exe
forum2.hkgolden.com/images/shua.jpg
mmmppp333.com/text/essay/cjsq/diantai.htm
pt.cga.com.cn/y4h1410.exe
ha85.com/jiang/index.htm
                             ——by风源使者

10月5日添加如下网址:
18hi.com
45520.com
cnhack58.net
dvd.qq92.com
h444.net/
hothack.home.chinaren.com
joyiex.com
jpic.com
JuJumao.com
ku666.com
kule5.com
mydj2005.com
nnptt.com/tv/  
qq92.com
sg51.com/qb?68.            
tian8.com
tv.megajoy.com/video/movies/  
v357.com
vod.hengshui.com/  
w510.com
YES9999.com
                           ——by  huangjy03
7月24日添加如下网址:
9qian.com
3yyy.cn
borlander.cn
map168.com
sky99.cn
74588.com   
最近流行的小不点、恶意软件网站。
                                ——by xchen

7月5日添加如下网址:
taiwan.co.nz/bbs
tian8.com
4tb.net/tghd.asp
zbszx.vicp.net/list.asp
xmclub.hc3w.net/bbs/index.asp
69.22.169.85/~pass/bbs/index.php
music.969688.com/music/music.asp
book99.3322.net/guanggao/sms/sms.htm
fs286.com/announce/announce.asp
cn4sex.com/star/kelly0608/k.html

6月24日添加如下网址:

ninesky.net
qq.qq5q.com
lilizhen.com
film888.com/film.asp
vod.52en.com/index.asp
6mb.net/movie
nic2000.com/?huyantao
getfreedomain.biz/index.php
chinaour.com
211.20.72.218/bbs
lovemm.8m.cn

6月14日添加如下网址:

e23.3322.net
okww.net
163[1].com
home.kimo.com.tw/avnvyou520
yysky.net
happy666.net
update.myxq.com
myxq.com
bbs.ccjz.com
91mm.net/join.php

6月4日添加如下网址:

dxy.9126.com
qth.nease.net
ezhgc.com
eastedu.com.cn
435000.com
sdik.8ok.net
feiying.cool.net
zhongxuesheng.myrice.com
94.yes9999.com
qq58.com

5月添加如下网址:
qq520.net
jjkafei.longcity.net
chow.yesky.net
oicq.hk.st
my288.com
laws-online.net
hj168.net
16888.6to23.com
love520.net
qq520.com
23down.com
378dj.com
net5w.com
fbstu.com
qlwl.com
yinshang.com
ncunet.com
555666.net
fm1058.cc
meim.y365.com
63581.yeah.net
maomao363.126.com
chinabdkx.363.net
zknew.com
dhchao.com
top666.net
amoisonic.com
markguide.com
xyxc.ccoo.com
flyingwalk.com
yezine.net
mmgirls.com
guosir.ccoo.com
163mm.com
cnooo.com
es158.com
aisa-girl.net
boliwu.com
cctv1.net
89005.com
play.cn.gs
newyouth.3322.net
girl008.com
xajh.15888.net
51bug.com
wplune.com
777888.net
pollen.my001.net
yule21.com
fish3000.com
666e.com
qm.8ok.com
9991.com
dj3344.com
qq168.net
777888.com
5dsoft.com
wokoo.net
movie.sx.zj.cn
yeapple.com
xyxy68.8u8.net
youmiss.com
cctv8.net
kuliao.com
yyqy.com
winzheng.126.com
sunvod.com
t168.com
boliwo.com
coolcdrom.com
zhengdian.com
girlchinese.com
yibinren.com
mtv51.com
163 [1].com
37021.com
cnqb.net
qq3344.com
qq3344.net
youlove.3322.net
58589.com
tty.yyun.net
ftlink.net
pixpox.com
k163.com
pk.com
xxx.com
204.177.92.68/rotate/r3.jhtml
fassia.net/wmed/index1.html
ehomeday.com
jinpin.net

楼主,拜托,这些事情是用host来做的,你以为把全世界的东东都加进黑名单啊,到时候一开就100%的资源占用

TOP

今天晚了,明天我把其中的整个网站部分做成正则吧,其他的比如某些网站的目录应该已经过滤掉了

TOP

不需要这么麻烦吧 ...  这样的过滤效率太低

我觉得过滤一个 width=0,heigth=0 的frame就过滤 99% 的恶意网页了

ex1= <iframe[^>]*?(?:(?:width|height)\s*=\s*['"]?\s*0\s*['"]?)[^>]*?><\/iframe\s*>
re1=<! virus -__,- !>
天下无不散之筵席.

世界之窗浏览器开发计划

TOP

楼上的好办法,呵呵,其实用host也是好办法,用正则去过滤实在太浪费资源了

TOP

用JS做
哪天SUN把TW捆绑JAVA,就可以用JAVA语句来过滤了
不过这一天会在什么时候呢?

TOP

这个可以考虑用过滤http头的方式来过滤
遇到崩溃假死或者感觉速度慢或者其他问题的朋友可以先试试使用TW3
TheWorld we explore the world.

TOP

那样的方式, 即使是用GRETA正则式库, 效率也很低.  

偶就不赞成像置顶贴那样的HTTP过滤. 支持基于HTML内容的正则式过滤.要抓住广告生成的本质.


过滤用插件来实现确实效果最好. 可以方便的识别多行广告, 弹出窗口等.

PS: 建议在正则式中提供一个大小写不敏感的选项....否则太麻烦了.......
仗剑红尘已是癫, 有酒平步上青天;
    游星戏斗弄日月, 醉卧云端笑人间.

TOP

原帖由 needed 于 2007-1-20 23:39 发表
不需要这么麻烦吧 ...  这样的过滤效率太低

我觉得过滤一个 width=0,heigth=0 的frame就过滤 99% 的恶意网页了

ex1= <iframe*?(??:width|height)\s*=\s*?\s*0\s*?)*?><\/iframe\s*>
re1=& ...




老大, 很不明白为什么你要过滤 长宽=0的
我看到的99%的.JS里面的<iframe>标签引入的广告, 都是长宽!=0的
仗剑红尘已是癫, 有酒平步上青天;
    游星戏斗弄日月, 醉卧云端笑人间.

TOP

原帖由 kidkidkid 于 2007-1-21 19:33 发表
那样的方式, 即使是用GRETA正则式库, 效率也很低.  

偶就不赞成像置顶贴那样的HTTP过滤. 支持基于HTML内容的正则式过滤.要抓住广告生成的本质.


过滤用插件来实现确实效果最好. 可以方便的识别多行广告, ...


现在就是大小写不敏感的
遇到崩溃假死或者感觉速度慢或者其他问题的朋友可以先试试使用TW3
TheWorld we explore the world.

TOP

原帖由 kidkidkid 于 2007-1-21 19:43 发表




老大, 很不明白为什么你要过滤 长宽=0的
我看到的99%的.JS里面的<iframe>标签引入的广告, 都是长宽!=0的

他是在过滤恶意网页  不是在过滤广告

TOP

还是用HOSTS方便

TOP

返回列表