返回列表 发帖

TW广告过滤的问题,TW正则和一般正则都有哪些不同?

研究TW的广告过滤就是搞不定,比方说我就想过滤与  /image.pconline.  匹配的广告,请问该怎么写?
在MT下写成:
*/image.pconline.*
就可以了,非常简单

在TW下,我写成:
*/image.pconline.*
/image.pconline.
/image\.pconline\.
\w*/image\.pconline\.\w*

都不行,还有在MT下写最简单的规则:
*/ad/*
同样用各种方式写在TW下也不管用

听说TW广告过滤规则要前后都加一个  /  ,我加了也不行,我研究了正则表达式规则,但TW似乎和一般的正则还不太一样,以前我记得看见过一个TW过滤规则的解说帖子现在也找不着了,知道地址的麻烦给个链接行吗,毕竟TW论坛提供的规则不见得全适用想自己学会写过滤规则

通配符的过滤方式肯定有问题,就比方说 http://www.pconline.com.cn/ 网站右边的4幅广告图片在其他如maxthon、gb等浏览器就可以用 */image.pconline.* 规则过滤掉,按版主的说法TW也可以滤掉,但实际上不能,不信的可以去试试就知道了。

再比方说 http://www.skycn.com/index.html 网站,用 *.skycn.*/tuijianimg/* 规则在TW下就完全不起作用,而在mathon下就过滤的干干净净,不信的去试试就知道了。

还有如用 */pagead?.* 规则过滤google的广告也不行,不知道TW支不支持?的单字符匹配?不过就算写成 */pagead2.* 也不行,甚至写成 */pagead* 都不行。

我还遇到过其他规则不起作用的时候,比如最简单的规则 */ad/* 不起作用。

下面是我的过滤规则,是直接从mathon下拷贝的,mathon下一点问题都没有。

*.12530.*/hezuo/*
*.131377.*
*.51.*/xilu/*
*.51ads.*
*.6park.*/images/*
*.6park.*/img/*
*.7clink.*
*.7town.*
*.ad?.*
*.ads?.*
*.ads99.*
*.adver*
*.all4ad.*
*.allyes.*
*.bluehost.*
*.chinabbs.*/banner/*
*.chinabbs.*/gdpic/*
*.chinabbs.*/line/*
*.chinabbs.*/loveline/*
*.chinabbs.*/out/*
*.chinabbs.*/unionbbs/*
*.chinabbs.*/unionline/*
*.chinabbs.*/womenline/*
*.chinabyte.*.swf
*.chinanews.*/fileftp/*.gif
*.chinanews.*/fileftp/*.swf
*.chinesemedianet.*/banner/*
*.clickeye.*
*.codeproject.*/ann/*
*.crsky.*/ggao/*
*.daqi.*/gdpic/*
*.daqi.*/out/*
*.daqi.*/searchbar*
*.dealsaving.*
*.doubleclick.*
*.enet.*/banners/*
*.heima8.*
*.iask.sina.*
*.keyrun.*
*.my5757.*
*.myad.*
*.narrowad.*
*.p4p.*
*.pcpop.*/js/*
*.people.*/zixun/*
*.qihoo.*/friend/*
*.sina.*/dy/sina_net/*
*.sina.*/iframe/*/ebay*.html
*.sina.*/iframe/*/sina_*.html
*.skycn.*/tuijianimg/*
*.sohu.*/chat_online/*
*.sohu.*/cs/*
*.sohu.*/promotion/*
*.sohu.*/richang/*
*.sonicchat.*.swf
*.tom.*/yigao/*
*.union.*
*.union???.*
*.verycd.*/banner/*
*.verycd.*/customer/*
*.xilu.*/js/*
*.xilu.*/mrjx?/*
*.xilu.*/tuijian/*
*.xinhuanet.*/2006xxfb/*
*.yeeyoo.*/yypic/*
*.yesky.*.swf
*.yesky.*/show/*
*.yimg.*/a/*
*/?smsad.*
*/33.pcpop.*
*/ad-*
*/ad.*
*/ad/*
*/ad?.*
*/ad?/*
*/ad???x??.*
*/ad?_*
*/ad?click.*
*/ad?file.*
*/ad?line/*
*/ad?pic/*
*/ad?show*
*/ad?site/*
*/ad?view?.*
*/ad_*
*/ad0?.*
*/ad1?.*
*/adbrite.*
*/adbs/*
*/adclick.*
*/adclient.*
*/adcode/*
*/addir/*
*/adds/*
*/adfile/*
*/adframe.*
*/adimage.*
*/adimages/*
*/adimg.*
*/adimg/*
*/adimg?.*
*/adinfo.*
*/adinfo/*
*/adjs/*
*/adlog.*
*/adlog/*
*/admore.*
*/adpic/*
*/adpics/*
*/ads?.*
*/adsence.*
*/adserver.*
*/adserver/*
*/adshow.*
*/aduni/*
*/adunion.*
*/adunion/*
*/adunion?.*
*/adver*
*/adview.*
*/banners.chinesenewsnet.*
*/bid.zhongsou.*
*/btn.pchome.*
*/c.tom.*
*/classad/*
*/cpc.*
*/cpc/*
*/cpro.baidu.*
*/d?.sina.*
*/ebayad/*
*/eiv.baidu.*
*/flashad?.*
*/ganggao/*
*/gg.*
*/gg/*
*/ggao/*
*/ggimg/*
*/ggjs/*
*/gimg.baidu.*
*/globalad/*
*/guangao/*
*/guangg/*
*/guanggao?/*
*/guanggao200?/*
*/image.pconline.*
*/imagead/*
*/images.163.*
*/images.17173.*/if/*
*/imguv.21cn.*
*/jsad?/*
*/lbad/*
*/links.news.sohu.*
*/lmad.*
*/ltad/*
*/mad?.*
*/mms/*
*/mms?/*
*/myadfile/*
*/mygg/*
*/mysms.*
*/newhuagg/*
*/news2.163.*
*/newweb.zcom.*
*/pagead?.*
*/pfp.sina.*
*/pic.zol.com.cn*/200*
*/rm.sina.*
*/scalink.sohu.*
*/sgad/*
*/showad*
*/sms.*
*/sms/*
*/smspop.*
*/spcode.baidu.*
*/taobao.*
*/textad/*
*/topad/*
*/tp.xilu.*
*/ulinkjs.tom.*
*/un.265.*
*/unicom/*
*/union.*
*/union/*
*/union?.*
*/union??.*
*/union???.*
*/unstat.baidu.*
*/urich.uitv.*
*/userfile/*banner*
*/videoad.*
*/vivi_iask.*
*/xfrd_0?.gif
*_ad.*
*_ad/*
*_ad_*
*33av.*
*adtology2.com*
*guanggao.*
*guanggao/*
*.sandai.*
*/p4pstatic.*

TOP

但那样的话通配符不就没有意义了吗,比方说我想过滤 http://www.pconline.com.cn/ 网站右边的4幅广告图片,用 */image.pconline.* 规则不就是全路径吗?如果不是全路径又或其他什么原因,请版主能不能写一个能过滤的例子,就类似于 */image.pconline.* 这样,把那4幅广告图片滤掉,全路径也好别的什么原因也好,全加全,版主能写个能工作的例子吗。

还有,如果必须写全路径,也就是中间不能有*号和?号是吧,那像 http://www.skycn.com/index.html 网站这样的,用 *.skycn.*/tuijianimg/* 这种规则就不行是吧,那通配符岂不就是意义不大了,每个网站的广告都存在不同的目录下,如果中间不能用通配符必须写全路径,那就太难用了。

TOP

也不知道楼上的版主试了没有,给之前请先自己试试行吗,楼上 http://image.pconline.com.cn* 这个规则根本不管用,我还怕自己的其他规则干扰特意把所有的都清空然后试的,我前面说的可都是试过了的,我说不行都是试过了不行,我之所以请版主给出能工作的例子,就是因为我认为版主是权威的,版主给的例子肯定没问题,然后我好照着改,所以请版主答的时候认真点行吗,试也不试想当然就写不好吧,而且楼上版主给的这条明显和我写的那个 */image.pconline.* 是一类吗。

weiguo的话我看懂了,谢谢。

TW下没有MT下viewpage侧边栏类的那种方便插件,找起广告图片等的源码很麻烦,如果全用网页源文件来找太困难了,而且源码的写法可能和真正广告的写法完全不同,比方说很多广告里都带AD关键字,但源码里可能就是一个链接不带AD,那要过滤就等于只能应用在这个特定网站,如果像MT那样可以直接过滤最终地址则可能一条AD规则就全过滤了。而且从用户使用角度也是直接看最终地址,如果用最终地址不能过滤可能会让用户感到惊讶。

再说回 http://www.pconline.com.cn/ 那4个广告,请给个能工作的例子行吗。

照版主的说法就是 */image.pconline.* 规则之所以不能过滤是因为这是最终地址是吧,要过滤这4个广告要写源地址,我的TW没有viewpage侧边栏类的那种插件,看源码找太麻烦了,版主们写过滤规则不会全看网页源代码吧,小网还行,大网累死,有好插件能推荐一个吗。

另外TW到底支不支持在规则中间加入通配符?像 http://www.skycn.com/index.html 网站这样的,用 *.skycn.*/tuijianimg/* 规则不行,版主能给个能工作的例子吗。

希望版主给出的例子能是最简洁的匹配,好能知道什么能包在里面什么不能。

TOP

非常感谢,现在已经都明白了,我记得原来置顶帖里有份教程的,后来给删了是吧,希望新的教程能尽快完成,再次感谢

TOP

返回列表