请教17k小说网页面过滤?
[url=http://www.17k.com/html/books/0/0/49/4946/1e7076/417983.shtml]http://www.17k.com/html/books/0/0/49/4946/1e7076/417983.shtml[/url]怎么过滤?我模仿置顶中sina.com 新浪网过滤尝试写的过滤为什么不行?我的过滤:#exd#*.17k.*#<!--广告条开始-->(?:.|\n)*?<!--广告条结束>###<!--Ad blocked by TheWorld2-->
sina.com 新浪网
#exd#*.sina.*#<div id=PublicRelation.*?>(?:.|\n)*?<\/div>###<!--Ad blocked by TheWorld2-->
#exd#*.sina.*#<!--企业服务文字广告开始-->(?:.|\n)*?<!--正文结束-->###</table><!--Ad blocked by TheWorld2-->
#exd#*.sina.*#<td.*?width="612".*?>###<td width="99%" valign="top" class="lc_blue"> 没有广告啊?!:( 有啊,顶上的文字广告
--------------------------------------------------------------------------------
**喷血尤物美女私密 正版扭蛋:买一赠一 难以想象的残忍:中外酷刑大观 [喜讯]神州行充值已经开通! 17k充值点卡团购价:27元
黑道浪子的人生旅途 怎样看见自己残存的前世记忆 点击免费上17k手机小说网 邓小平是怎么下决心打越南的 我捡了一**的手机(最近更新)
-------------------------------------------------------------------------------- #exd#*17k*#<!--骞垮憡鏉.*?->(?:.|\n)*?<!--骞垮憡鏉.*?->###<!--Ad blocked by TheWorld2-->
^^ 骞垮憡鏉是什么?
回复 #5 lwzjy 的帖子
变成乱码的中文:lol: hehe这个行么??? 为什么会变成乱码?是怎么找出来的? 页面用UTF-8编码了,用网络**程序看到http数据包中是这个字符.这个是TW对过滤功能支持的不好.但暂时不改了
页:
[1]