返回列表 发帖
原帖由 needed 于 2007-12-28 10:56 发表 http://bbs.ioage.com/cn/images/common/back.gif


是的,MX只是比TW多了个用户暗示,所以“感觉上快”。

好吧,有具体的数据那就很好说话了,性能效率是其一。

其二是管理,LS说的很清楚,这是软肋,这一点以前很多帖子都反映了;
其三是稳定,其实这个说不准,变数很多,至少我感觉少匹配说不定能得到稳定的提升

这三点是顶楼帖子的核心,关于第一点数据已经证明不必多虑,非常感谢needed的数据;那么就只剩第二点和第三点了。

很高兴能够探讨这个问题。
liuyis[AT]live.com

TOP

域名 匹配跟 html 匹配不一样 ok ?
这样吧. 我们用数字来说明一下问题
   js的效率并不高, 比c++远远落后 . 我们测试一下 域名匹配所需要的时间
以下代码可以在资源收集器运行
  1. <script language="JavaScript">
  2. var  counter=1000;
  3. var host ='17173.com';
  4. var time1 = new Date().getTime();
  5. for(var i=0;i<counter;i++){
  6. if( host == '163.com')alert('true');
  7. }
  8. alert(new Date().getTime() - time1)
  9. </script>
复制代码
另外, js的计算周期为16ms(毫秒)

在我的电脑 p4 1.8 内存768  上
  裸奔,开了三个q 迅雷bt

前面是匹配次数 ,后面是所需时间, 单位毫秒 下同
次数: 0 ~ 1000   所需时间 0 (即瞬时或者 少于16ms
          10000                           20
           100000                        210~220
            1000000                       2073~  2153  

当你写了100w条规则, tw 用 脚本 需要域名判断只需要2秒.   c++ 呢? 我猜会在5分之1秒内完成


tw的黑名单需要改进, 或许索引是一个方向(因为自身管理不方便) 但绝对不是效率的问题
   
mt的过滤不见得比tw要先进...
天下无不散之筵席.

世界之窗浏览器开发计划

TOP

原帖由 needed 于 2007-12-28 00:19 发表 http://bbs.ioage.com/cn/images/common/back.gif
难道你用exd  写17173的规则  打开163的时候会 匹配么 ?
    当然不会.
  不过, 写的不太完善的黑名单对浏览速度的确有影响...



如何在theworld.ini配置文件内进行域名匹配?
如何在百千条(目前我还只有四百多条的样子)中搜寻相匹配域名的规则?
使用exd对17173写100条规则,然后再为cmfu写5条规则,那么TheWorld是进行105次域名匹配还是2次域名匹配?
如果将LZ的帖子看完的话,很清晰的可以看到两种方式的匹配量的不同,这是一个数量级的差距。
我不使用时间复杂度来进行解释,也不牵涉其他的机器性能进行具体的演算,因为这个工作是很复杂而难以理解的。

我们例举一个非常实际的例子。
假设17173有50条规则;163有50条规则;17K有50条规则;等等,共有20个网站,那么规则总数是50*20=1000条。
按照目前的匹配方式,我需要匹配17K网站,那么:

第一步,对1000条规则进行域名匹配,匹配1000次;
第二步,找到17K的那50条规则,进行HTML代码匹配,设HTML代码量为A,比例系数为M,则匹配量是50AM;

统计:总共的匹配次数为:1000+50AM。

如果采用我所说的索引方式的匹配方式,则:

第一步,对20个域名进行匹配,匹配次数20次;
第二步,对17K内的50条规则进行匹配,匹配次数是50AM次;

统计,总共的匹配次数为20+50AM。

很容易地,也很明显的,1000+50AM>>20+50AM,节省了匹配次数的好处是效率的提高,稳定性的提高,以及其他的好处。

如果比较一番的话,有时候你会发现MX的过滤效率比TW高,但不排除MX对用户心理的暗示(过滤了什么,右下角有提示)会导致用户“感觉上效率高”的感觉。

至于不完善的黑名单。。。一般的,我认为只有不规范的网页需要过滤,才会诞生不完善的黑名单。。。而且,一般的,写黑名单的人都非常谨慎,尽可漏杀也不误杀,宁可少杀也不滥杀,这一点E版深有体会。
liuyis[AT]live.com

TOP

原帖由 elkay 于 2007-12-27 16:30 发表 http://bbs.ioage.com/cn/images/common/back.gif
现在就是先匹配域名,再匹配规则啊。

没有明显的察觉到对速度的影响

这几天TW假死情况竟然少了好多,好像是因为改过黑名单的样子

1.现在除了填表功能鼠标手势方面跟GB还有些差距,浏览情况还算稳定

2.白名单自动消失的情况还时有发生,是我RPWT?
[align=right][color=red][size=2][url=http://fanfou.com/mmbeta]话痨[/url][/size]
[/color]没有GB的日子,生不如死[/align]

TOP

难道你用exd  写17173的规则  打开163的时候会 匹配么 ?
    当然不会.
  不过, 写的不太完善的黑名单对浏览速度的确有影响...
天下无不散之筵席.

世界之窗浏览器开发计划

TOP

非常强大
支持楼主,
就是主线网站下面N条分线过滤系统

TOP

现在就是先匹配域名,再匹配规则啊。

没有明显的察觉到对速度的影响

TOP

说实话,这帖子对我打击很大。

没想到躲到这里来还是有看不懂的帖子~~
论坛上我只佩服一种人,就是冒着吵架的风险回答那些不是问题的问题的人。
笑古笑今,笑东笑西,笑南笑北,笑来笑去,笑自己原无知无识
观事观物,观天观地,观日观月,观前观后,观他人总有高有低

TOP

正则的效率还是低  
不如建立黑名单的时候自动生成通用过滤规则存在配置文件里 效率高

TOP

e.....楼主, exd类型的过滤规则就是你说的那种实现方式啊
遇到崩溃假死或者感觉速度慢或者其他问题的朋友可以先试试使用TW3
TheWorld we explore the world.

TOP

不错。可以加快速度

TOP

楼主不管是皮还是其它都是长篇的,等高人来分析
------行到山穷处,坐看云起时!------

TOP

返回列表