爬虫下载添加进度条

def report(count, blockSize, totalSize):
  percent = int(count*blockSize*100/totalSize)
  sys.stdout.write("\r%d%%" % percent + ' complete')
  sys.stdout.write('[%-50s] %s'%( '=' * int(math.floor(count*blockSize*50/totalSize)),percent))
  sys.stdout.flush()

urlretrieve(url,'{}/第{}节.mp4'.format(self.BASE_PATH,i),reporthook=report)

[%-50s]表示50个占位符炫酷吧！

print('[%-50s]'%('='*25))

/usr/bin/python /home/pipidi/learngit/lianjia/lianjia/spiders/aa.py
[=========================                         ]

Process finished with exit code 0

占位符的神奇用法！

--------------------2/21-------------------------------------------------------------------------------

因为不了解reporthook的用法所以我继续写了一些例子：

def myReportHook(count, blockSize, totalSize):
     print count, blockSize, totalSize



 >>> import urllib
 >>> 
urllib.urlretrieve('http://personalpages.tds.net/~kent37/Python/PythonResources.html', 
reporthook=myReportHook)
0 8192 7955
1 8192 7955
2 8192 7955

This result surprised me at first - why is it reading three blocks? But the 
first line is output _before_ any blocks are read (count=0); the second 
line is the actual read, and the third line is the failed read that ends 
the operation. If you look at the code for urllib.urlretrieve(), you see 
that it calls report hook for each attempted read, so it will always get an 
extra call at the end.

大体意思是第一行是开始链接，第二行是下载，第三行是结束

全部评论

推荐最新楼层

04-28 19:35

中南民族大学数据分析师

无敌简历求拷打

简历中的项目经历要怎么写

点赞评论收藏

04-28 10:35

北京邮电大学 Java

腾讯 PCG 后台开发一面

自我介绍实习A 系统 多表关联更新时，如何避免死锁；联表查询是如何做的二级缓存体系中数据读写的流程延时双删是如何做的；延时时间如何确定；延时时间过短或过长分别有什么后果C 系统 从读主库切到读从库的业务场景是什么八股Spring 事务的传播机制MySQL 底层的事务隔离级别MySQL 读写分离架构中，什么时候需要读主库算法最大连续 1 的个数 II

查看11道真题和解析

点赞评论收藏

04-02 10:09

门头沟学院 Java

我的3月好失败

投的大厂几乎全都是简历挂，我不太明白，我问了很多人他们都说简历没什么问题。可是快手挂我两遍美团、阿里大部分、拼多多、字节剪映、懂车帝、爱奇艺、百度、oppo、小米、美的、哔哩哔哩基本上都是简历挂。我想不通了，一整个三月只有腾讯和钉钉给面了。结果腾讯的两道题我没a出来，钉钉遇到kpi面，面完出来看官网果然是秒挂，我已经觉得绝望了。难道真是简历问题？

用微笑面对困难：这里面问题还是很多的，我也不清楚为啥大家会感觉没啥问题。首先就是全栈开发实习9个月的内容都没有java实习生的内容多，1整个技术栈没看出太核心和难点的内容，感觉好像被拉过去打杂了，而且全栈基本上很容易被毙。里面能问的bug是在太多了比如L：继承 BaseMapper 可直接使用内置方法’。请问你的 BaseMapper 是如何扫描实体类注解如果瞬时产生 100 个上传任务，MySQL 的索引设计是否会有瓶颈？你做过分库分表或者索引优化吗？全栈的内容可以针对动态难点去搞，技能特长写在下面吧，你写了这么多技能，项目和实习体现了多少？你可以在项目里多做文章然后把这个放下去，从大致来看实习不算太水，有含金量你也要写上内容针对哨兵里面的节点变化能问出一万个问题，这个很容易就爆了。