返回列表 发帖

新基础黑名单与百度搜索引擎相冲突----找到原因--问题解决

新基础黑名单与百度搜索引擎相冲突。

当在搜索栏选百度搜索引擎,搜索“日语”时。
出现以下画面。
2008-03-19_110620.jpg

输入其他词时,没有这个问题。


所引用的基础黑名单:
  1. /(?:\.|\/|_|")(?:ads?(?:\d|code|gif|graph|list|log|puba|s?file|sence|site|show)?|(?:ali)?union(?:sky|sys)?|all(?:4ad|yes)|banner|bdun|cp(?:c|ro)|(?:guan|my|newhua)?gg(?:ao)?|keyrun|p(?:4|f)p|sp(?nsor|code))s?(?:\d)*(?:\.|\/|_)/
  2. /[\W_]ads?(?!=&)(?:banner|click|flow|frame|ima?ge?|log|serv(?:er|e)?|stream|type|view|vert(?:ising|ise?ment)?|trix|xchange|wrapper)?s?[\W\d_]/
  3. /(?:\.|\/|_)(?:soft|hot)?ads?(?:s..|img|vert|rotator|view|bot|c_|client|council|gif|graph|images|info|log|pic)?(?:\.|\/|_)/
  4. /(?:\.|\/|_|")(?:a2d|alimama|clickeye|dotmore|cooperate|corporate|ifocus|ivansms|SogouUnion.*|themis|ulink(?:js|dir)|un|usmsweb|vodone|vogate|xc)s?(?:\d)*(?:\.|\/|_)/
  5. /[^0-9]+(?:\d){2,3}[x_](?:\d){2,3}[^0-9]+(?:swf|gif|jpg|js)/
复制代码
ps:加入了白名单,结果也一样。




---------------------        找到原因的分割线     --------------------------------------------


一般人的百度搜索串是:
  1. http://www.baidu.com/baidu?word=%s&tn=ichuner_4_pg
复制代码
由于我是双系统,为防止乱码,用的搜索串是:
  1. http://www.baidu.com/baidu?word=%us&tn=ichuner_4_pg&ie=utf-8&oe=UTF-8
复制代码
这时就出现了和黑名单相冲突的问题,具体怎样冲突的不了解,不过黑名单和搜索引擎只要修改其中一个,在百度引擎输入“日语”出现AD现象就没有了。



----------------------      解决问题的分割线  ----------------------------

感谢xyao,果然把搜索串改成如下就可以了。

  1. http://www.baidu.com/baidu?tn=ichuner_4_pg&ie=utf-8&oe=UTF-8&word=%us
复制代码
但和我原来的搜索串相比。
只是参数顺序颠倒了而已啊,没看出其他的区别,按理说结果都应该是一样的啊。

更新:谢谢xyao告知原因

原帖由 xyao 于 2008-3-21 18:59 发表 http://bbs.ioage.com/cn/images/common/back.gif

那是因为那个版本的黑名单过滤写的有问题,把地址栏里的符合规则的关键字也过滤了。你如果用原来的搜索串,有些字的编码里含有%AD,后边还带有&以及之后的一串内容,被认为是广告而屏蔽了,因此无法搜索。颠倒顺序以后%AD在最后,就不会被认为是广告了。

[ 本帖最后由 killuasy 于 2008-4-2 13:25 编辑 ]

那是因为那个版本的黑名单过滤写的有问题,把地址栏里的符合规则的关键字也过滤了。你如果用原来的搜索串,有些字的编码里含有%AD,后边还带有&以及之后的一串内容,被认为是广告而屏蔽了,因此无法搜索。颠倒顺序以后%AD在最后,就不会被认为是广告了。

TOP

改下搜索串即可,改成:
  1. http://www.baidu.com/baidu?tn=ichuner_4_pg&ie=utf-8&oe=UTF-8&word=%us
复制代码

[ 本帖最后由 xyao 于 2008-3-20 19:54 编辑 ]

TOP

这两天发现一厘米http://www.1cm.com.cn/do/1cmOpen?game=10drops的flash游戏无法加载,似乎是换了2.1论坛预览版后出现的,用的是最新的黑名单和白名单

最近还发现cnbeta页面上的百度站内搜索被过滤掉了

[ 本帖最后由 roc5006 于 2008-3-20 15:19 编辑 ]

TOP

打 江  这个字
我也出现 AD

TOP

原帖由 elkay 于 2008-3-19 14:58 发表 http://bbs.ioage.com/cn/images/common/back.gif
楼主,把黑名单选项里的"过滤掉的元素显示为:"这里留空试试


找到原因,

一般人的百度搜索串是:

  1. http://www.baidu.com/baidu?word=%s&tn=ichuner_4_pg
复制代码


由于我是双系统,为防止乱码,用的搜索串是:

  1. http://www.baidu.com/baidu?word=%us&tn=ichuner_4_pg&ie=utf-8&oe=UTF-8
复制代码


这时就出现了和黑名单相冲突的问题,具体怎样冲突的不了解,不过黑名单和搜索引擎只要修改其中一个,在百度引擎输入“日语”出现AD现象就没有了。

楼上那位和我测试一样结果的,想来用的也是utf-8编码的查询吧。

TOP

回复 7# 的帖子

就是黑名单的原因, 关闭黑名单就正常了.

TOP

如果是因为黑名单的原因,该如何解决?如何恢复世界之窗黑名单的默认值?

TOP

打开www.baidu.com后, 输入"江", 回车后会显示AD. 用搜索框则正常.

刚再次测试了下:
就是黑名单的原因. (关闭黑名单恢复正常)

我用的是置顶的"基础黑名单 (03/11/2008)" 和 "安全浏览必备规则(首发霏凡论坛)2.9更新提示"

[ 本帖最后由 呦児咿 于 2008-3-19 19:09 编辑 ]

TOP

首先可以排除是我的电脑中病毒现象。

TOP

好像是黑名单的原因. 确实有这个问题.
搜索后左上角会显示AD

TOP

试过,确认不会中病毒
还确认一点,楼主好好检讨一下自己电脑
名ID会员,会员名ID:麻將桌上小牌一張

某一天听不见,望着世界在眼前沦陷

TOP

返回列表