![网络数据采集技术:Java网络爬虫实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/251/33831251/b_33831251.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.4 条件判断与循环
条件判断语句是Java程序中最常见的选择控制结构,共分为三种形式:if、if-else和if-else if-else语句。程序2-1为这三种语句的语法格式。
程序2-1
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_26_01.jpg?sign=1738869684-JDr2eBJ8uhXu6qvPsTo4bJOe5IlJCOdi-0-671e3ec09497d4b2c51dde28c04e912d)
例如,在网络爬虫中,经常使用if-else语句判断网页是否请求成功,如程序2-2所示。
程序2-2
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_26_02.jpg?sign=1738869684-fZRHcWcVPxDYTKEovZABr922v8bhZFd8-0-eb62dcf7607d716e1d20b010f4db1e3f)
循环语句是Java程序中重要的结构,其功能是反复执行某段程序。Java中共有三种语句实现循环操作,即while,do-while和for循环语句。程序2-3为这三种语句的语法格式。
程序2-3
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_01.jpg?sign=1738869684-AJOIHk5pu9uyJluBWV99WxlE9GzT5dID-0-bde973fca4b0cc8f869106ce6e811ba3)
如在网络爬虫中,使用while循环URL队列,反复执行URL请求以及解析任务,直到队列为空,即所有URL采集完成。程序2-4为执行的流程。
程序2-4
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_02.jpg?sign=1738869684-K19zUr3NAMb6FCBrXki0ESkMxMr2zLuM-0-2816279eb64bf5d5382e25ee42e44ffa)
另外,如果采集的页面包含多页,可以通过for循环的方式,拼接每页URL,并将这些URL添加到队列中,如程序2-5所示。
程序2-5
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_27_03.jpg?sign=1738869684-m2wfonr6oEzPAXWtwTzDaMONU0DRg64f-0-f58ea9b130a196a363c3dfef80b2031f)
![](https://epubservercos.yuewen.com/CDDCA8/18096059701207306/epubprivate/OEBPS/Images/37607_28_01.jpg?sign=1738869684-fRg4TE95JAllvR6cAGlxyQ59SNVHSIhR-0-b7f1716af9ff00465fb1724f12a262a2)