京东数据开发一面

状态最差一次面试,整个人在漫长春招一个多月后开始说话语无伦次+脑袋不转。
0. 面试官自我介绍,问实习时间
1. 自我介绍,简单讲项目
2. neo4j底层怎么存储:基于磁盘的二进制文件存储
3. 故障怎么办:故障检测、宕机恢复
4. 访问量增加怎么办:水平扩展、读写分离、索引缓存(redis
5. redis怎么数据一致性:单线程保证了、主从同步、持久化机制
6. py的dict怎么安全多线程?加锁
7. py线程池 threadlocal:忘了
8. 分布式负载均衡的算法:rr、wrr、随机、加权随机、最少连接
9. CAP:一致性可用性和分区容忍不可兼得,一般舍弃C或者A
10. 项目和hdfs的区别:算法上,结构微调
11. 知道其他大数据组件吗:没咋看
12. 分布式系统总结 共通的特点解决问题和架构:解决一致性可用性分区容忍、负载均衡容错。。架构是分namenode和后面存储node
13. 解决数据一致性的方法:2PC预提交 + 正式提交、投票、最终一致性
14. 场景:py 生产者消费者 时间戳数据 怎么实现
15. Queue有界的话怎么办?丢异常
16. 报错怎么解决:重传、调速度
17. queue锁怎么设计:互斥锁、又说了乐观锁桶锁好像跑题了。。应该有条件变量?
18. 加整个queue还是怎么加?生产者生产的时候消费者没办法消费:只锁关键小段代码
19. 假设分布式系统十亿数据挑选最大top10:每个服务器选top10然后归并。选的算法可以hashset、可以bitmap、可以堆排,考虑到内存。
20. spark用py写的?对。。
21. 卡夫卡用过:恩
22. 反问

感觉又要凉了,自己面的方向太多做的东西又杂.. 路漫漫其修远兮😌
全部评论

相关推荐

06-17 20:38
已编辑
湖南科技大学 Java
6.17 腾讯云一面原以为到六月份就没啥hc了,结果早上就投到了腾讯云的后台开发,然后电话问我下午有没有空面试,太意外了,也太惊喜了,终于迎来我的处女面了面试官看我是大二还是第一次面,问的都比较简答,但我太紧张了,有点胡言乱语,但面试官还是很好的说, 总共拷打了70分钟左右,但是没怎么问八股,主要还是在拷打项目,记的不是很清楚,见谅面试过程:自我介绍,手撕:合并区间并输出索引列表,因为我用的c++,所以就是结构体+自定义排序+遍历计网:tcp三次连接,tcp与udp区别,udp为什么不可靠?数据结构:c++与java中的数据结构,c++中vecotr我设置长度为8然后push_back第九个元素会发生什么(因为我用c++写的手撕,面试官就问了写c++ stl相关的,以后还是尽量用java写吧避免挖坑)ArrayList与LinkedList,B+树用来做什么的(索引)?数据库中哪里用到了悲观锁和乐观锁,慢sql语句优化项目:第一个项目自己介绍了亮点,然后面试官问如果我前端心跳请求每1s发一个该怎么处理?(我答的redis搭建主从或者哨兵)第二个项目问了如何实现redis缓存高可用(答了针对缓存击穿、穿透、雪崩的几种方案),对于项目描述中说拦截90%请求是怎么知道这个数据的(答的用Jmeter)反问:面试官觉得我想要进入该公司实习需要具备什么能力:面试官说项目+八股+算法搞好面试官对我的评价怎么样和建议:还可以,建议写程序的时候变量名要规范(我手撕的时候有点懵,变量都是a,b,c)大概就是这些了,能不能二面已经无所谓,重要的是经验+1,面试官人真的很好
查看13道真题和解析
点赞 评论 收藏
分享
一·语言方面:由于很多大数据框架都是基于JAVA开发的,个人认为JAVA语言是必不可少的,有余力的话可以去掌握以下PYTHON😊二·数据结构与算法:大二课上没好好学,现在只能再补一遍了,悲😣打算刷完Leetcode的Hot100就先放一边,等秋招再刷别的题😇三·MYSQL:一个关系型数据库管理系统,SQL BOY的开始,初步领略通过建表来管理数据的思想,学完可以去刷一下基础50题和进阶50题(虽然本菜鸡只刷了基础50😓)四·Linux:会安装虚拟机,掌握常见linux常见命令即可五·Hadoop:一个分布式计算框架。所谓分布式,就是将一台电脑无法处理的数据量分散给一个由多台电脑组成的计算机集群来处理,互相分工,彼此合作,形成一个有机整体。框架分为三部分:HDFS(数据存储),MapReduce(数据计算),Yarn(资源调度)。虽然MapReduce已经逐渐被Spark淘汰,但思想依然值得借鉴。高可用机制也应当学习六·Maven:会用即可,打包项目用的七·Hive:也是一种SQL,有了MYSQL的基础应该还算好理解八·Scala和Spark:Spark是用Scala写的,在学习之前得先浏览一遍基本语法。Spark是基于内存的批式计算引擎,已经逐渐取代MapReduce(基于磁盘的计算引擎),APACHE也基本上停止了对MapReduce的更新(经典白学😃)。将来很多离线数仓项目也都是基于SPARK的,可以说非常重要了九·Kafka,Hbase,Flume和ZooKeeper:都是一些小组件,将来面试可能会问到十·Flink:一个流式实时计算引擎,本人JAVA基础较弱,听的时候也是懵懵懂懂当然,仅仅这些肯定远远不够,本人将来还要学Doris,数仓建模理论,数仓项目,八股面经等等。上述理解如有错误还请友好指正(叠甲叠甲叠甲😱)。这些理论也只是匆匆过了一遍(大一太贪玩,大二2月份才开始学),发布笔记也只是记录自己的学习过程,提醒自己不要懈怠(还有当个免费网盘😏)。如果能帮助到你就更好了,虽然我也比较迷茫😖
点赞 评论 收藏
分享
评论
6
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务