如何使用java自动获取网页内容并保存下来

2025-04-27 05:56:41

对于需要保存于处理大量的网页的是时候，往往需要一个程序自动获取获取网页的信息，并且将他们保存起来，那么该怎么实现呢，这里小编以java编程为例，给出一种解决方法；

工具/原料

eclipse软件

要保存的网页网址

win7系统

1.准备工作

1、1.打开编程工具编程工具软件如图所示，小编采用的是eclipse软件；

2、2.建夷爵蹂柢立一个java工程：单击“file”-“new”-“java project”；然后，选中工程，单击鼠标右键，在下拉菜单中选中“new”-“class”；具体可参见经验“eclipse如何建立一个java工程”

2.编写程序

1、1.旯皱镢涛程序主框架：由于这里用到的内容比较少，就采用一个main方法就可以；代码如下：package myurltext;public class myurltext { public static void main(String[] args) { }}

2、2.建夷爵蹂柢立异常结构为了保证，数据正常的传输，这里给出了应用了一种异常处理结构，增加程序的健壮性，结构代码如下： try{ }catch(Exception e){ }

3、3.写main方法：这里主要涉及到数据流的转换，和url的打开与读取，对于网址，有些网站采用该该方法诺蝈胂叟保存不全，例如百度经验的网页就很难用此方法保存； public static void main(String[] args) { String dre="**************"；//一个网址，这里就不贴出来了； String filep="c:/URL.html"; try{ URL url=new URL(dre); InputStream in=url.openStream(); InputStreamReader isr=new InputStreamReader(in); BufferedReader br=new BufferedReader(isr); BufferedWriter bw=new BufferedWriter(new FileWriter(filep)); PrintWriter pw=new PrintWriter(bw); String temps=null; while((temps=br.readLine())!=null){ pw.print(temps); } System.out.println("网页"+dre+"的内容保存完成，" + "保存在"+filep+"文件中，请注意查看"); }catch(Exception e){ e.printStackTrace(); } }

4、4.注意这里用到了比较复杂的数据流的知识，请大家仔细阅读分析，别仅仅copy就完事了，本程序还有些bug，小编还未知。

3.查看保存效果

1、1.运行单击“编译并执行”按钮，如图所示，就可以看到，运行一段时间后，就可以看到，输出提示，将什么网址的文档放到了c盘下面的一个url文件内；

2、2.查看文件找到，自己要保存的目录，如图所示，就可以看到我们保存的网页了；

3、3.查看网页：接着，我们双击打开URL.html文件，用浏览器打开，就可以看到我们保持的网页文件的内容了。

4.总结

1、总结：本经验仅仅给出一个简单的一个网页的保存实例，大家可以扩展一下，采用循环语句，保存更多的网站的内容一次性。相信聪明的你一定能做了！！！

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。