如何去除整站下载文件中的tppabs等冗余代码
有时我们会看到一个自己很喜欢的网站,用软件复制下来之后,发现代码中包含很多冗余代码,有的网站较大,一个页面中就有成百上千行代码,要想一行一行的删除,即使有这个精力,也要浪费不少的时间,我们可以利用vs中的“快速替换”功能,使用正则表达式,批量删除这些冗余代码。
工具/原料
电脑一台
软件:Visual Studio 2010
一、tppabs
1、用TeleprotUltra复制了一个网站,结果网页中出现了很多形如tppabs=””的冗余代码
2、点击vs中的“在文件中查找”图标,打开“查找和替换”对话框
3、转到“快速替换”,然后进行以下设置:“查找内容”文本框中输入 tppabs="h[^"]*";“替换为”设置为空;“查找范围”设置为“当前项目”; 勾选“使用正则表达式”。
4、点击上图中的“全部替换”,即可把当前整个网站中的tppabs代码全部删除掉。
二、href="javascript:if(confirm)..."
1、整站代码下载完成后,所有的超链接中都出现了这样的代码,我们只能选择批量删除。
2、同第一个模块一样,转到“快速替换”以后,进行如下设置:“查找内容”文本框中输入 href="javascript\:if\(confirm\('htt[^"]*";“替换为”输入 href="(这里是你想替换的链接)";“查找范围”设置为“当前项目”; 勾选“使用正则表达式”。
3、点击“全部替换”,批量删除完成。
三、/*tpa=http://...
1、整站代码下载完成后,css文件中,图片路径的后面都会添加一个“/*tpa=”标记,来表示图片的原路径。
2、同前两个模块一样,转到“快速替换”以后,进行如下设置:“查找内容”文本框中输入 \/\*tpa=http\://[^]*/;“替换为”设置为空 ;“查找范围”滤鲇魍童设置为“当前项目”; 勾选“使用正则表达式”。
3、点击“全部替换”,批量删除完成。