[已记录]MT2.0B3中值得借鉴的功能:"过滤页面内容"
最近下了个MT2.0B3版,用了2天,功能上没有什么特色,资源占用比TW2.0高多了。不过瑕不掩瑜,其"过滤页面内容"的功能非常有创意,可以所见既得的方式加黑名单,很好用,不需要有专业的网页知识,希望开发组借用过来。[[i] 本帖最后由 caten 于 2007-1-24 14:45 编辑 [/i]] 不单止是mt2,现在mt1.59也已经有类似功能。而opera更是有这个功能。相信是以后发展的趋势。
而现在tw2的过滤还不完善,至于以后加不加这个,看老大吧……其实我也双手赞成加的,点几下鼠标就清理干净网页了。
[[i] 本帖最后由 king_hh 于 2007-1-24 11:28 编辑 [/i]] 没特色?--!
是你没仔细用吧~比如几乎所有地方都能自己自定义
目前还没看到其他浏览器能做到这样的
[[i] 本帖最后由 01045319 于 2007-1-24 11:34 编辑 [/i]] 我所谓的“没特色”是指在MT2.0上有的功能在TW2.0上都可以实现(限定于我用的着的功能)!
“自定义功能”TW2.0以后肯定会加入,且这个功能不属于常用功能,用户只是在刚开始的时候根据个人喜好设置一下,以后就基本上不会再改动了。倒是"过滤页面内容"是个常用的功能,网络上广告这么多,没有也不可能有比较齐全的黑名单,通过这个可视化的操作可以自己解决写问题! 这个过滤内容如果加太多 会影响打开页面的速度 这也是迟迟没加这个功能的原因 [quote]原帖由 [i]caten[/i] 于 2007-1-24 12:15 发表
这个过滤内容如果加太多 会影响打开页面的速度 这也是迟迟没加这个功能的原因 [/quote]
可以把黑名单分为通用性的过滤规则和根据具体网站的过滤规则,用户通过"过滤页面内容" 功能加入的放在对应的网站下面。这样就等同于缩小了黑名单长度,应该不会对网站打开速度有很大影响。 你打开页面的时候 浏览器同样要去一条条试 看是否匹配 说了那么多还是得等,在正式版出来之前一切都是在空话,好还是差等正式版出来就知道了。希望这里说的最终都会是事实,而不是在吹泡泡 [quote]原帖由 [i]caten[/i] 于 2007-1-24 12:46 发表
你打开页面的时候 浏览器同样要去一条条试 看是否匹配 [/quote]
照我上面的办法,虽然也是一条一条去匹配,但是匹配范围被大大缩小了。
先匹配通用性规则,比如正则式,然后匹配对应网站的黑名单。一般通用规则屏蔽掉一部分广告后,对应网站的黑名单不会太多,你认为呢? 那不需要两个表单 一个表单就够了 只要能自动把网站屏蔽的放在最前面就行 是么?
即使这样 仍然对5楼的问题没有多大改善 当你列表中达到上百条之后 无论你用几个表单 那影响也不会小 一个表单可能不够吧,为了提高执行效率可能需要采用数据库技术。如果按照表单上的黑名单依次匹配,如果能用的正好排在最后,那不是需要很长时间?过滤算法中应该优化成不必每条都去匹配,可以按照内建的规则进行转跳,缩小搜索的范围。 自己添加的网站 各个网站之间 没有任何关联 没有任何相似的地方 如何跳转....不一一比对如何来屏蔽.... 其实很多人经常访问的网站并不会太多,加入了这个功能对速度影响并不大。相反,这些网站如果改变了一下,一般广告过滤就失效,而要重新添加起来就麻烦,更多人根本不会。所以这个功能感觉很好…… 比如过滤表单为以下格式:
[common]
这里放通用的过滤和正则式
[sina]
这里放新浪网的正则式或黑名单。由用户自定义或"过滤页面内容"功能自动加入。
[yahoo]
这里放雅虎网的正则式或黑名单。由用户自定义或"过滤页面内容"功能自动加入。
。。。。
[]里面为对应标签的关键字
执行步骤如下:
1、TW先匹配[common]标签里的内容,
2、然后根据当前网站的关键字匹配对应标签里的规则。
3、退出过滤规则,过滤结束!
这样是不是匹配时间可以大大缩短
[[i] 本帖最后由 xuyong 于 2007-1-24 13:58 编辑 [/i]] 这不就类似于正则....
回复 #15 caten 的帖子
正则我看不懂,不过看了置顶帖的正则好像也分通用和特定网站的过滤,不知道软件的执行机制是什么,好像是逐条解释的,否则也不会要用户尽量少加特定网站的过滤正则了。再次正则和黑名单应该可以同时存在的,如果不用标签之类的东西给它分类,系统肯定要逐条解释,过滤规则越长网页打开的速度也就越慢!我的方法也是一种优化方案吧!这样加入“过滤页面内容”的功能就不会对系统有很大影响了。 正则是先对比某条的开头 类似你说的这个 []分类 不匹配就直接跳过了 和你这个效果一样 并不存在优化反正也反馈多次了 那就报上去吧 以后直接回答已反馈 多简单-__,- 哈,我要的是“过滤页面内容”这个功能,怎么变成正则表达式来着?
正则表达式自己定义不来,反正没直接黑名单容易,有“过滤页面内容”就更容易了,不过又缺少了正则式的灵活性,加标签应该是一种可行方案。除非你们再开发一个正则转换器,把用户收集来的黑名单直接转成正则式那就更好了。:D
页:
[1]