关注
没写爬淘宝的。老婆也不让买什么。写了个爬小说的。
package years.year2016.months11;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import years.year2016.months10.WebUtil;
public class WebDataGain {
public static void main(String[]args){
WebDataGain w = new WebDataGain();
String url = "http://www.biqugezw.com/3_3096/";
String bookname = "一念永恒";
w.downNovel_Biqugezw(url,bookname);
}
/**
* 下载笔趣阁小说功能
* @param url
* @throws IOException
*/
public void downNovel_Biqugezw(String url,String bookName) {
String url_root = "http://www.biqugezw.com";
//用Jsoup连接站点
Document doc=null;
try {
doc = Jsoup.connect(url).get();
} catch (IOException e2) {
// TODO Auto-generated catch block
e2.printStackTrace();
}
//选择器,选择class做为容器
Elements elementList = doc.select("#list");
String query ="a[href~=/[0-9]{1}_[0-9]{4}/.*html]";
Elements elements = elementList.select(query);
int size = elements.size();
System.out.println(size);
String fileName = "";
int num = 0;
int initnum=371;
for(int i=initnum;i<size;i++){
Element e = elements.get(i);
String href = e.attr("href");
String tempurl = url_root+href;
System.out.println(tempurl);
Document docInner=null;
try {
docInner = Jsoup.connect(tempurl).get();
} catch (IOException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
System.out.println(fileName);
System.out.println(i);
}
Elements elementsClass = docInner.select(".bookname ");
Elements elementsH = elementsClass.select("h1");
String sectionkname = elementsH.text();
System.out.println(sectionkname);
Elements elementsContent = docInner.select("#content");
String content = elementsContent.text();
System.out.println(content);
num=i%20;
if(num==0&&i==0){
fileName="1-20章";
}else if(num==0&&i!=0){
fileName=i+"-"+(i+20)+"章节";
}else if(i==initnum){
int temp=initnum-num;
fileName = temp+"-"+(temp+20)+"章节";
}
try {
WebUtil.downloadText(sectionkname+" "+content, bookName+"--"+fileName+".txt", WebUtil.getFileDir()+"//book//"+bookName+"//");
} catch (IOException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
}
}
}
查看原帖
点赞 2
相关推荐
点赞 评论 收藏
转发
牛客热帖
正在热议
# 和牛牛一起刷题打卡 #
10274次浏览 879人参与
# 通信硬件薪资爆料 #
251151次浏览 2368人参与
# 牛客帮帮团来啦!有问必答 #
1062143次浏览 16056人参与
# 机械制造薪资爆料 #
348671次浏览 4103人参与
# 晒一晒我的offer #
3733206次浏览 57648人参与
# 我想象的工作vs实际工作 #
104537次浏览 1690人参与
# 面试中,你被问过哪些奇葩问题? #
19405次浏览 150人参与
# 你收到了团子的OC了吗 #
526062次浏览 6244人参与
# 毕业租房也有小确幸 #
38659次浏览 3211人参与
# 金融银行面经 #
12934次浏览 209人参与
# 你怎么评价今年的春招? #
10009次浏览 165人参与
# 提前批和秋招有什么区别 #
28985次浏览 696人参与
# 春招你拿到offer了吗 #
398646次浏览 5750人参与
# 秋招开了,你想投哪些公司呢 #
132669次浏览 3431人参与
# 本周投递记录 #
218453次浏览 5342人参与
# 实习生应该准时下班吗 #
88687次浏览 650人参与
# 字节跳动工作体验 #
73579次浏览 2022人参与
# 我发现了面试通关密码 #
378180次浏览 6991人参与
# 腾讯工作体验 #
151527次浏览 1479人参与
# 浅聊一下我实习的辛苦费 #
100345次浏览 1015人参与