【有书共读21】Python编程之美 09

Web客户端库
Requests可以完成python HTTP请求的各种相关工作,无缝集成web服务。无需手动把查询字符串添加到URL货对POST数据进行表单编码。使用pip安装Requests:
$pip install requests

Web API
  • get方法是HTTP协议的一部分,在RESTful API中,API的设计者选择服务器会使用那些动作,并在api中告诉开发者。除GET外,还有POST、PUT、DELETE等方法。
  • URI的基础部分是API的根源。
  • 客户端会指定一个特定元素来获取相关书
  • 可能还存在一个选项,用来指定不同的媒体类型

JSON解析
json库可以将JSON格式的字符串或文件内容解析为一个python字典,也可以将python字典或列表转换为JSON格式。

XML解析
标准库中有一个XML解析器,通过创建ElementTree对象来保存xml结构,这意味着我们必须逐级迭代,仅需子元素获取内容。使用pip获取:
$pip install untangle
$pip install xmltodict

untangle读取xml文档,返回python对象,其结构逐一映射xml文档的节点和属性。
借助xmltodict可以使用unparse()函数反向将字段转化为xml。xmltodict的流式模式适用于处理无法全部读入内存的文件,并支持命名空间。

web页面数据抽取
web页面数据抽取是使用计算机程序对web页面内容进行筛选,以最恰当的格式收集需要的数据,同时保留数据的原有结构。

lxml
lxml可以快速解析xml和html文档,甚至可以处理解析过程中遇到的错误格式的标记。使用pip获取:
$pip install lxml
使用requests.get获取目标数据的web页面,使用lxml的hml模块进行解析,并将结果存到树状结构变量tree中。

数据序列化
序列化是指将结构化数据转化成一种能够被共享或者存储的格式,保留必要的信息让数传输的接收端能够在内存中重建对象。
数据序列化有:
Pickle:python原生数据序列化模块。
跨语言序列化:Google的protobuf和Apache的avro是常见的两个选项。
压缩:python标准库支持zlib、gzip、bzip2和lzma算法压缩解压数据,并支持创建zip和tar格式的归档文件。
缓冲协议:使用内存减少python对相同数据进行内存内赋值的次数,甚至可以将数据从文件或套接字读入一个已有的内存缓冲区。


分布式系统
网络编程、:asyncio、gevent、twisted、pyzmq、pika。

密码技术
常见方案:ssl和hashlib以及secrets、pyOpenSSL、pynaci libnacl、cryptography、pycrypto、bcrypt。























#Python#
全部评论

相关推荐

10-15 18:02
已编辑
香港中文大学 golang
秋招有幸一开始就拿了淘天的笔面,并且美团转正的意向也顺利通过后续在淘天和字节两个 9 月主要流程都走到了 hr 面,国庆节后一个通过,一个横向挂了其他面过的包括:b 站一面挂 八股还行,最后手撕给了个笔试压轴限时 15min...整段垮掉阿里控股 kpi一面➕换部门走到二面,控股的都不喜欢开摄像头京东一面挂 常规问题,但是疑似成都 base hc 很少,并且透露了已经转正,目前池子里无人捞腾讯正在二面 一面体验不错,还指出了要改进的地方,提示二面不会再问问过的问题快手一面未知小红书一面未知字节换部门一面不喜欢业务,又回到了人才库大麦约面,准备拒掉虾皮一面 无后续流程,面试聊的还行,感觉上海 base 池子满了---------------------------------------------------------------------------感觉秋招可以结束了,后续感觉走完这个腾讯流程就随缘面面 t 和 b,主包家在南京,奈何南京没啥好的民营企业和互联网氛围,以及好国企又太难进,不知道淘天这个意向够不够直接结束秋招了...今天去深圳 nip 主场看了一下入围赛,主队不是这两家,还是觉得 ig 可惜了,有很好的机会没有抓住。感触和我字节 hr 面挂一样评论区有推荐的字节杭州上海base的业务线或者有字节 hr uu 可以捞一下吗?
肖先生~:大佬都这么强了还要干啥啊
我的求职进度条
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务