返回列表 发帖
那样的方式, 即使是用GRETA正则式库, 效率也很低.  

偶就不赞成像置顶贴那样的HTTP过滤. 支持基于HTML内容的正则式过滤.要抓住广告生成的本质.


过滤用插件来实现确实效果最好. 可以方便的识别多行广告, 弹出窗口等.

PS: 建议在正则式中提供一个大小写不敏感的选项....否则太麻烦了.......
仗剑红尘已是癫, 有酒平步上青天;
    游星戏斗弄日月, 醉卧云端笑人间.

TOP

原帖由 needed 于 2007-1-20 23:39 发表
不需要这么麻烦吧 ...  这样的过滤效率太低

我觉得过滤一个 width=0,heigth=0 的frame就过滤 99% 的恶意网页了

ex1= <iframe*?(??:width|height)\s*=\s*?\s*0\s*?)*?><\/iframe\s*>
re1=& ...




老大, 很不明白为什么你要过滤 长宽=0的
我看到的99%的.JS里面的<iframe>标签引入的广告, 都是长宽!=0的
仗剑红尘已是癫, 有酒平步上青天;
    游星戏斗弄日月, 醉卧云端笑人间.

TOP

返回列表