【有书共读】跟老齐学Python数据分析读书笔记12
第4章 综合应用
1. 分析内衣评论数据
数据分析,首先要有数据,即解决数据来源问题。4.1节分析的股票数据来源于Pandas,还有数据来源于其他处,包括某人/机构整理的API等。此外,众多的各种类型的网站是更广阔的数据源。每个网站都有若干网页,网页上的内容就是我们要获取的数据。从网站上获得数据的方法有多种,比如有的网站提供访问本站数据的 API,但这类网站较少,并且 API 还有诸多限制,所以获取数据的一种技术——“网络爬虫”就得到了广泛应用。
本节就从某东网站上爬取了一点点数据,仅供研习之用。