世界之窗论坛's Archiver

令狐 发表于 2007-5-22 09:09

如何进行这种反向的HTML过滤

比如HTML中,有一个A,有一个B,我希望AB之间以外的全部不要。

现在我只会弄:A前边的不要,B后边的不要。不知道能否用一个正则式来一个反向过滤。

elkay 发表于 2007-5-22 13:30

不是很明白你的意思啊,能不能举个例子说明一下?

令狐 发表于 2007-5-22 14:23

HTML代码中,有一个地方写了A,有一个地方写了B。我希望的是,A和B之间的内容要,其他的内容不要。现在我只会按照两个步骤来过滤,不知道是否可以通过一个步骤实现过滤。

elkay 发表于 2007-5-22 14:30

这个....还是没大明白你的意思,html中结合html标识来匹配比较好

另外:如果是纯粹的字符串的话在tw中是不行的,如果是在编辑软件里可以做到

ps:你还是给个实例吧,你这样说我还是不能了解

elkay 发表于 2007-5-22 14:32

我想我明白了你的意思了,呵呵

答案是不行:)

elkay 发表于 2007-5-23 16:33

lz请跟我联系,或者给个具体的网页例子,我想也许可以做到的

kkf 发表于 2007-5-23 17:14

插件方法
var dStr = document.documentElement.outerHTML
var posA = dStr.indexOf(A);
var postB =dStr.indexOf(B)+B.length;

var result = dStr.substring(posA,posB);

黑名单过滤方法

#ex#[\s\S]+(<title>[\s\S]+</title>)[\s\S]+###$1

其中 A = "<title>"
       B = "</title>"
要十分注意的是 AB尽可能唯一,否则会有意想不到的结果

elkay 发表于 2007-5-23 17:25

回复 #7 kkf 的帖子

方法是可行的,楼主可以试试。

不过如果AB不是唯一会很恐怖的:)

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.