Python(学习笔记—网络爬虫)

Python网络爬虫(学习笔记)——First Day——初识爬虫

这篇呢作为学习笔记吧,应该不是太官方的
那就开始吧,不太正式,就不注重格式了

一、引言

首先我们应该想这么个问题,学Python的目的是什么,最近我们开了python这门课,有好多同学的学习方法我感觉出了问题,有的同学问我怎么学,说实在我也不知道,因为我也是新手,C语言也是刚及格,菜鸡一枚。但是就我自己而言,python可能会不同于C,由于python的运行速度是比C要慢的,所以python并不是一个太看重算法的语言(个人理解),这就导致了一个问题:刷题有用吗?我的回答是:当然有用,但是如果你想锻炼你的算法能力的话,不如去刷C语言的题,因为它更加复杂,所有的函数更加的少,可以更好的培养你的思维。(好像跑题了)算了不重要了,我最近在GitHub里找到一个很好地学习python的项目可供参考:

https://github.com/jackfrued/Python-100-Days

可以参考一下,毕竟访问量还是挺多的

二、正文

(一)什么是爬虫
嗯嗯正文到了!
所以,网络爬虫到底是什么呢
通俗的解释就是:你把内个网站上面的东西扣下来自己用。
如果再文明一点的话那就是:请求网站并提取数据的自动化程序
(二)爬虫的基本流程
一般的爬虫是分为四步的
发起请求—>解析内容—>获取相应内容—>保存数据
这是一个大致上的流程,具体的一些比较细致的流程咱们下次再说

三、结尾

由于这可能是篇水文,就不往外发了,你们几个看到就好了,莫喷,后期会有干货

全部评论

相关推荐

10-17 09:06
门头沟学院 Java
8527睿:有些地方感觉不太契合实际啊。简单看看第二个项目那里。 比如canal流式读取数据库日志进行缓存同步那里。可不可以加个消息中间件来确保SQL语句的削峰填谷。一般都是canal+消息中间件 双层鉴权登录那里,描述有点模糊,登录是鉴权的前提唉,后面功能都在说是登录,鉴权没有啊
点赞 评论 收藏
分享
安静的鲸鱼offer...:神仙级别hr,可遇不可求,甚至他可能也是突然有感而发。只能说遇上是件幸事。
秋招开始捡漏了吗
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务