小米后端开发日常实习二面

应该是去年10月面的,最近复习八股,就每天往牛客贴一条面试记录,自己也复习一下。

1. 没让我自我介绍,而是问我还没找到实习吗? 。。。找到实习了我还面试干嘛。。。

2. 实习做了什么?项目来源?

3. redis常见数据结构,用了哪些?

4.除了redis还有知道有哪些缓存,回答memcached。追问区别。

5.布隆过滤器。(简历里写了用来解决缓存穿透,每次都会被问,面试官真的喜欢问这个)

6.jvm内存结构,垃圾回收算法

7.除了kafka还了解哪些消息队列,有什么区别,为什么有这么多种

8.读过哪些源码

9.算法题:快排

10.反问

对里面的八股我简单贴下回答和扩展(个人理解,有问题欢迎指出)

3. String:最常见,字符串和数字都能用String存。实现是动态字符串和int。

Hash:kkv结构。可用来存订单购物车这种,订单id——商品id——数量

List:

Set

ZSet:跳表实现,有序集合,可以根据元素权重来排序。排行榜,比如牛客有个人品排行榜,可能就是存了redis。有人送花,加了人品,可以通过 ZINCRBY命令来增加对应权重。

可能引申的问题:为什么ZSet的实现用跳表而不是其它结构例如红黑树

其它几种不常用数据结构BitMap,HyperLogLog,GEO,Stream

4.这个问题倒是不常见,因为基本都是用的redis。既然问了稍微背两句八股吧

相比于Memcached,redis支持更丰富的数据类型,而Memcached仅支持kv结构;

redis支持数据持久化(aof,rdb);

redis主流程单线程(aof刷盘,关闭文件,释放内存。注意还有这三个后台线程;6.0后又引入了多个线程来处理网络请求,当然不影响主线程是单线程),memcached是多线程

除了分布式缓存,还有常见的本地缓存像Caffeine

5. 布隆过滤器本质是一个很长的Bit数组以及多个hash函数,当写入一条数据进数据库,求多个hash函数的code,在数组的对应位置改为1。读取数据时,先通过多个hash函数找到对应哈希槽,如果里面有一个是0,就说明该数据一定不存在于数据库,也就不用查数据库了,很大程度上解决了缓存穿透。但注意,查的所有哈希槽都是1不代表该数据一定存在于数据库,因为存在hash冲突的问题。但是没关系,不过是多查一次数据库,还是能发现数据不存在的。

6.堆,虚拟机栈,本地方法栈,方法区,直接内存。 字符串常量池在堆中,运行时常量池在方法区中,直接内存是用的本地内存,jdk1.8将方法区移到了本地内存。

堆分为新生代,老年代,永久代(1.7之前有,1.8后被元空间代替,移到了本地内存,实际上都是对方法区的实现),其中新生代又能分为Eden,S0,S1(其中Eden区一般占内存较大)。新创建的对象首先分配在Eden区,当Eden满了会触发一次Minor GC,存活下来的对象会被移动到Survivor区(s0或s1,这两个区是对称的,每次只有一个用来使用),MinnorGC后,从Eden区和当前Survivor区中存活下来的对象会被复制到另一个Survivor区。在Survivor中存活下来多次(可通过jvm设置阈值)后就能进入老年代。

作用范围 触发时机

Minor GC: 新生代 Eden区满

MajorGC: 老年代 老年代空间不足

FullGC: 整堆+元空间(1.8) JVM显示请求(System.gc())或老年代严重不足

注意元空间用的是本地内存,一般比较充足,当然也可能把整个操作系统的内存全部用完了。

FullGC回收堆,自然是回收的垃圾对象。那么在元空间里回收什么呢?

元空间主要存放类的元信息,运行时常量池,方法定义,字段定义。。。

回收元空间主要是回收已经被卸载的类的元数据(包括类的结构信息墩、字段方法常量。。。)

再说到垃圾回收,

首先是判断对象已死:引用计数法,可达性分析法

再是三种回收策略:标记清除,标记复制,标记整理(要区别分别用于哪个虚拟机的哪个区域,为什么。很常见,等下一篇帖子整理吧)

7.常见的消息队列有kafka,rocketMq,rabbitMq。会一个就行了,然后记一下区别,多了记不住,我这里主要说一下kafka和rocketMq吧。

定位 适用场景 零拷贝

kafka 高吞吐 日志采集,实时流处理 sendfile

rocketMq 高可靠 金融,订单,电商等业务 mmap

这里提到零拷贝的话,面试官大概率会让你继续说说零拷贝的内容,以及为什么两个消息队列这么选择。

传统IO:硬件———>内核缓冲区(内核空间里)——>用户缓冲区(用户空间里)——>socket缓冲区(内核空间里)——>网卡

其中硬件与内核空间的消息复制用的是DMA拷贝,内核空间与用户空间的拷贝是CPU拷贝,以及会涉及到上下文切换

mmap:反正不管内核空间还是用户空间都只是内存,直接将上述内核缓冲区和用户缓冲区映射到同一个内存空间

这样就减少了以此CPU拷贝。但没有减少上下文切换,因为只是内存用的同一块,但是逻辑上还是分开的。

sendfile:更进一步,干脆不走用户空间了,直接从内核缓冲区拷贝到socket缓冲区。直接减少两次上下文切换,注意你进行sendfile系统调用还是会有上下文切换,只是省略了数据拷贝中的两次上下文切换。

kafka的追求是高吞吐日志系统,直接把文件发送出去,用sendfile更快。

rocketmq追求的是可靠的业务中间件,用mmap起码数据还是会走到用户空间的,这样我们的可操作性就更大,比如rocketMq可以自己控制刷盘,再多我也不了解了,我只用过kafka。

8.没读过源码可以直接背aqs的八股。

AbstractQueuedSynchronizer是抽象队列同步器,是java并发包中提供的构建锁和同步器的基本框架。

首先是它有一个volatile修饰的int型变量state,在ReentrantLock里它表示锁被获取的次数,在Semaphore里它表示剩余的许可数量。一般我们通过cas操作来修改这个变量,cas成功表示获取锁成功,否则失败。

同时,aqs内部维护了一个同步队列,用来存储那些等待获取锁的线程。当线程获取锁失败时,就会把线程引用包装成一个结点放到队列里去。当持有锁的线程释放资源时,会调用release方法,在释放锁之后会把队列里的第一个结点唤醒,被唤醒的线程会去尝试获取锁。

aqs是基于模板方法设计的,它定义了一系列模板方法,如acquire,acquireShared,release,releaseShared等等,我们可以写一个aqs的子类,然后自己实现tryAcquired,tryReleased等几个抽象方法。然后就能实现自定义的同步器。

如果觉得该帖子对你有帮助的话,欢迎一键三连

全部评论
m
点赞 回复 分享
发布于 今天 19:13 江苏
才发现电脑编辑的tab用手机看效果不好,全乱了,这次就不改了
点赞 回复 分享
发布于 今天 13:11 安徽
我才准备一个月,估计暑假实习没有机会了
点赞 回复 分享
发布于 今天 00:24 黑龙江

相关推荐

评论
1
4
分享

创作者周榜

更多
牛客网
牛客企业服务