关注
没写爬淘宝的。老婆也不让买什么。写了个爬小说的。
package years.year2016.months11;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import years.year2016.months10.WebUtil;
public class WebDataGain {
public static void main(String[]args){
WebDataGain w = new WebDataGain();
String url = "http://www.biqugezw.com/3_3096/";
String bookname = "一念永恒";
w.downNovel_Biqugezw(url,bookname);
}
/**
* 下载笔趣阁小说功能
* @param url
* @throws IOException
*/
public void downNovel_Biqugezw(String url,String bookName) {
String url_root = "http://www.biqugezw.com";
//用Jsoup连接站点
Document doc=null;
try {
doc = Jsoup.connect(url).get();
} catch (IOException e2) {
// TODO Auto-generated catch block
e2.printStackTrace();
}
//选择器,选择class做为容器
Elements elementList = doc.select("#list");
String query ="a[href~=/[0-9]{1}_[0-9]{4}/.*html]";
Elements elements = elementList.select(query);
int size = elements.size();
System.out.println(size);
String fileName = "";
int num = 0;
int initnum=371;
for(int i=initnum;i<size;i++){
Element e = elements.get(i);
String href = e.attr("href");
String tempurl = url_root+href;
System.out.println(tempurl);
Document docInner=null;
try {
docInner = Jsoup.connect(tempurl).get();
} catch (IOException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
System.out.println(fileName);
System.out.println(i);
}
Elements elementsClass = docInner.select(".bookname ");
Elements elementsH = elementsClass.select("h1");
String sectionkname = elementsH.text();
System.out.println(sectionkname);
Elements elementsContent = docInner.select("#content");
String content = elementsContent.text();
System.out.println(content);
num=i%20;
if(num==0&&i==0){
fileName="1-20章";
}else if(num==0&&i!=0){
fileName=i+"-"+(i+20)+"章节";
}else if(i==initnum){
int temp=initnum-num;
fileName = temp+"-"+(temp+20)+"章节";
}
try {
WebUtil.downloadText(sectionkname+" "+content, bookName+"--"+fileName+".txt", WebUtil.getFileDir()+"//book//"+bookName+"//");
} catch (IOException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
}
}
}
查看原帖
点赞 2
相关推荐

点赞 评论 收藏
分享
05-15 19:57
西安建筑科技大学 Java 
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 你觉得实习能学到东西吗 #
30348次浏览 629人参与
# 机械人集合!你是什么工程师? #
15291次浏览 88人参与
# 现代汽车前瞻技术研发急速编程挑战赛 #
25777次浏览 210人参与
# 秋招什么时候开投比较合适? #
18588次浏览 272人参与
# 发工资后,你做的第一件事是什么 #
67486次浏览 228人参与
# 如何准备秋招 #
17741次浏览 346人参与
# 百度工作体验 #
218953次浏览 1956人参与
# 机械人与华为的爱恨情仇 #
116123次浏览 942人参与
# 工作中哪个瞬间让你想离职 #
25420次浏览 177人参与
# 硬件应届生薪资是否普遍偏低? #
73541次浏览 514人参与
# 不考虑转正,实习多久合适 #
31528次浏览 145人参与
# 影石Insta360求职进展汇总 #
123084次浏览 1069人参与
# 通信和硬件还有转码的必要吗 #
57224次浏览 526人参与
# 24届的你们都什么时候入职? #
59918次浏览 424人参与
# 面试被问期望薪资时该如何回答 #
255910次浏览 1479人参与
# 实习,不懂就问 #
41326次浏览 641人参与
# 你们公司几号发工资 #
20456次浏览 139人参与
# 软开人,秋招你打算投哪些公司呢 #
102399次浏览 958人参与
# 每个月的工资都是怎么分配的? #
24683次浏览 408人参与
# 如果你有一天可以担任公司的CEO,你会做哪三件事? #
28966次浏览 460人参与
# 你觉得现在还能进互联网吗? #
7316次浏览 130人参与