京东数据开发一面
状态最差一次面试,整个人在漫长春招一个多月后开始说话语无伦次+脑袋不转。
0. 面试官自我介绍,问实习时间
1. 自我介绍,简单讲项目
2. neo4j底层怎么存储:基于磁盘的二进制文件存储
3. 故障怎么办:故障检测、宕机恢复
4. 访问量增加怎么办:水平扩展、读写分离、索引缓存(redis
5. redis怎么数据一致性:单线程保证了、主从同步、持久化机制
6. py的dict怎么安全多线程?加锁
7. py线程池 threadlocal:忘了
8. 分布式负载均衡的算法:rr、wrr、随机、加权随机、最少连接
9. CAP:一致性可用性和分区容忍不可兼得,一般舍弃C或者A
10. 项目和hdfs的区别:算法上,结构微调
11. 知道其他大数据组件吗:没咋看
12. 分布式系统总结 共通的特点解决问题和架构:解决一致性可用性分区容忍、负载均衡容错。。架构是分namenode和后面存储node
13. 解决数据一致性的方法:2PC预提交 + 正式提交、投票、最终一致性
14. 场景:py 生产者消费者 时间戳数据 怎么实现
15. Queue有界的话怎么办?丢异常
16. 报错怎么解决:重传、调速度
17. queue锁怎么设计:互斥锁、又说了乐观锁桶锁好像跑题了。。应该有条件变量?
18. 加整个queue还是怎么加?生产者生产的时候消费者没办法消费:只锁关键小段代码
19. 假设分布式系统十亿数据挑选最大top10:每个服务器选top10然后归并。选的算法可以hashset、可以bitmap、可以堆排,考虑到内存。
20. spark用py写的?对。。
21. 卡夫卡用过:恩
22. 反问
感觉又要凉了,自己面的方向太多做的东西又杂.. 路漫漫其修远兮😌
0. 面试官自我介绍,问实习时间
1. 自我介绍,简单讲项目
2. neo4j底层怎么存储:基于磁盘的二进制文件存储
3. 故障怎么办:故障检测、宕机恢复
4. 访问量增加怎么办:水平扩展、读写分离、索引缓存(redis
5. redis怎么数据一致性:单线程保证了、主从同步、持久化机制
6. py的dict怎么安全多线程?加锁
7. py线程池 threadlocal:忘了
8. 分布式负载均衡的算法:rr、wrr、随机、加权随机、最少连接
9. CAP:一致性可用性和分区容忍不可兼得,一般舍弃C或者A
10. 项目和hdfs的区别:算法上,结构微调
11. 知道其他大数据组件吗:没咋看
12. 分布式系统总结 共通的特点解决问题和架构:解决一致性可用性分区容忍、负载均衡容错。。架构是分namenode和后面存储node
13. 解决数据一致性的方法:2PC预提交 + 正式提交、投票、最终一致性
14. 场景:py 生产者消费者 时间戳数据 怎么实现
15. Queue有界的话怎么办?丢异常
16. 报错怎么解决:重传、调速度
17. queue锁怎么设计:互斥锁、又说了乐观锁桶锁好像跑题了。。应该有条件变量?
18. 加整个queue还是怎么加?生产者生产的时候消费者没办法消费:只锁关键小段代码
19. 假设分布式系统十亿数据挑选最大top10:每个服务器选top10然后归并。选的算法可以hashset、可以bitmap、可以堆排,考虑到内存。
20. spark用py写的?对。。
21. 卡夫卡用过:恩
22. 反问
感觉又要凉了,自己面的方向太多做的东西又杂.. 路漫漫其修远兮😌
全部评论
相关推荐