biubiu~你有一份中国人口数据需要查收

爬取世界人口网上的中国各省的2019年人数和2018年GDP

（数据并非完全真实有效）

import requests
import time
from selenium import webdriver
from bs4 import BeautifulSoup
import pandas as pd
from selenium.webdriver.common.action_chains import ActionChains

def get_page(url):
    driver = webdriver.Chrome()
    driver.get(url)
    xpath = '//*[@id="menu-item-9802"]/a'
    ActionChains(driver).click(driver.find_element_by_xpath(xpath)).perform()
    time.sleep(1)
    xpath1 = '//*[@id="copy"]/div[1]'
    table1 = driver.find_element_by_xpath(xpath1).get_attribute('innerHTML')
    soup = BeautifulSoup(table1,'html.parser')
    tb = soup.find_all('tr')
    return tb

def find_message(tb):
    for row in tb:
        cols = [col.text for col in row.find_all('td')]
        if cols[0] == '排名':
            continue
        index.append(cols[0])
        adress.append(cols[1])
        number_2019.append(cols[2])
        GDP_18.append(cols[3])

def save_message():
    data = {'排名':index,'地区':adress,'2019年人口':number_2019,'2018年GDP':GDP_18}
    dataframe = pd.DataFrame(data)
    dataframe.to_csv('Pnumber.csv',index=False,sep=',',encoding='utf-8-sig')

def main():
    tb = get_page(url)
    find_message(tb)
    save_message()

url = 'http://www.chamiji.com'
index = []
adress = []
number_2019 = []
GDP_18 = []
main()

全部评论

推荐最新楼层

昨天 15:14

南京大学 C++

不愧是鹅！给实习生和mt发咖啡券提高交流？

这福利有点意思，即实际又实用，不知道大家觉得如何🤔️

芹菜是真的菜：然而mentor不喝，几个实习生相互用券连喝一周爱马哥

投递腾讯等公司7个岗位

点赞评论收藏

昨天 11:22

桂林电子科技大学 Java

已经练成了面试吹牛神功

我都不敢相信我能输出这么多，简直不知道自己在说啥，，，能找到工作就行

点赞评论收藏

06-02 23:35

门头沟学院后端

在 boss 上找到了好工作

六十块钱的发烧友，哈哈哈哈哈哈哈哈哈哈

门口唉提是地铁杀：之前b站被一个游戏demo深深的吸引了。看up主页发现是个初创公司，而且还在招人，也是一天60。二面的时候要我做一个登录验证和传输文件两个微服务，做完要我推到github仓库，还要我加上jaeger和一堆运维工具做性能测试并且面试的时候投屏演示。我傻乎乎的做完以后人家跟我说一句现在暂时不招人，1分钱没拿到全是白干

你的秋招第一场笔试是哪家

点赞评论收藏