[面试题]百度资深面试官:如何理解python垃圾回收机制?

文章有点长,大家耐心看看,更多求职面经和校招内推,也可以关注Linker5微信公众号。

更多面试题系列,可查看:

如下是本次的面试题分享:

本期我们邀请了来自于百度的资深校招面试官为你解题,欢迎大家持续关注。

垃圾回收机制,就是我们常说的GC(Garbage collection)。高级编程语言,如java,c#等,都采用了垃圾回收机制,减轻程序员对于内存的处理压力。但这并不代表内存泄漏等问题可以被完全杜绝,所以这部分仍然非常重要,同时也是面试中的热点考察内容。

就python而言,主要采用的是常见的引用计数机制,同时结合标记-清除和分代收集两种机制。

01

引用计数

python中一切皆对象,每一个Python对象都有一个引用计数器,用于记录有多少其他对象指向(引用)这个对象。那什么时候引用计数增加,什么时候引用计数减少呢?


引用计数增加

  • 对象被创建:x = “test”

  • 另外的别名被创建:y = x

  • 对象被作为参数传递给函数(新的本地引用):foobar(x)

  • 对象成为容器对象的一个元素:myList = [x, 'xyz']


引用计数减少

  • 一个本地引用离开了其作用范围。如fooc()函数结束时,func函数中的局部变量(全局变量不会)

  • 对象的别名被显式销毁:del y

  • 对象的一个别名被赋值给其他对象:x = 123

  • 对象被从一个窗口对象中移除:myList.remove(x)

  • 窗口对象本身被销毁:del myList


当引用计数变为0时,会回收对象释放内存空间。


引用计数法有很明显的优点:

  • 实现简单

  • 实时性:一旦没有引用,内存就直接释放了。不用像其他机制等到特定时机。实时性还带来一个好处:处理回收内存的时间分摊到了平时。

但同时存在非常显著的的缺点:

  • 维护引用计数消耗资源,维护引用计数的次数和引用赋值成正比,而不像mark and sweep等基本与回收的内存数量有关。

  • 无法解决循环引用的问题。A和B相互引用而再没有外部引用A与B中的任何一个,它们的引用计数都为1,但显然应该被回收。


为解决上面2个问题,python又引入了两种GC机制


02

此GC机制,主要是为了解决循环引用问题。

标记清除(Mark—Sweep)』算法是一种基于追踪回收(tracing GC)技术实现的垃圾回收算法。它分为两个阶段:第一阶段是标记阶段,GC会把所有的『活动对象』打上标记,第二阶段是把那些没有标记的对象『非活动对象』进行回收。那么GC又是如何判断哪些是活动对象哪些是非活动对象的呢?

对象之间通过引用(指针)连在一起,构成一个有向图,对象构成这个有向图的节点,而引用关系构成这个有向图的边。从根对象(root object)出发,沿着有向边遍历对象,可达的(reachable)对象标记为活动对象,不可达的对象就是要被清除的非活动对象。根对象就是全局变量、调用栈、寄存器

在上图中,我们把小黑圈视为全局变量,也就是把它作为root object,从小黑圈出发,对象1可直达,那么它将被标记,对象2、3可间接到达也会被标记,而4和5不可达,那么1、2、3就是活动对象,4和5是非活动对象会被GC回收。

标记清除算法作为python的辅助垃圾收集技术主要处理的是一些容器对象,比如list、dict、tuple,instance等,因为对于字符串、数值对象是不可能造成循环引用问题。

03

分代回收

分代回收是一种以空间换时间的操作方式,Python将内存根据对象的存活时间划分为不同的集合,每个集合称为一个代,Python将内存分为了3“代”,分别为年轻代(第0代)、中年代(第1代)、老年代(第2代),他们对应的是3个链表,它们的垃圾收集频率与对象的存活时间的增大而减小。新创建的对象都会分配在年轻代,年轻代链表的总数达到上限时,Python垃圾收集机制就会被触发,把那些可以被回收的对象回收掉,而那些不会回收的对象就会被移到中年代去,依此类推,老年代中的对象是存活时间最久的对象,甚至是存活于整个系统的生命周期内。同时,分代回收是建立在标记清除技术基础之上。分代回收同样作为Python的辅助垃圾收集技术处理那些容器对象。



#百度##Python##面试题目#
全部评论
makr,好东西
点赞 回复
分享
发布于 2019-07-05 14:12
支持
点赞 回复
分享
发布于 2019-07-05 15:39
联想
校招火热招聘中
官网直投
没看到图啊。
点赞 回复
分享
发布于 2020-07-22 12:45

相关推荐

4 48 评论
分享
牛客网
牛客企业服务