已注销 level
获赞
2928
粉丝
1482
关注
138
看过 TA
3.9W
IP属地:北京
暂未填写个人简介
私信
关注
2024-02-05 10:39
已编辑
1.自我介绍拷打之前为啥鸽子2.项目拷打3.计算引擎为啥接入yarn做资源调度,不用stanealone直接部署4.为啥历史状态不用updatestate算子,采用了redis数据库更新状态5.spark和mr计算引擎的本质区别,计算引擎从mr到tez到spark的一个衍生过程,各个时代的优缺点6.当同时有海量计算任务在运行的时候,怎么设计计算引擎迁移的方案,怎么平滑迁移,不带来突然崩溃的问题7.mr引擎迁移到spark引擎时,应该注意考虑到的问题,对具体的任务要针对性考虑什么东西8.分析分析Influxdb为何适用于时序数据处理的场景9.讲讲LSM树,HBase和Influxdb的合并有什么区别10.请你设计一个从Influxdb到Hive的一个数据同步方案,Hive里面的数据模型怎么设计,spark或者flink怎么做并行同步消费,同步数据源的怎么消费,api消费和消费文件效率差距大吗11.跟着9,如果同时有几百个task在运行,分片方案怎么设计12.讲讲spark的内存模型,1.6之前和1.6到3.0之间和3.0之后的模型有什么区别13.spark下各个节点之间是怎么通信的14.为啥spark这样设计通信模型呢,不采用actor模型会带来哪些问题,多线程做同步可不可以15.当要对几百个T数据进行排序的时候,spark会不会遇到什么问题,它会怎么样排序的16.讲讲tungsten细节17.问了一个spark的qua(?不知道什么东西,没听过)18.讲讲violate19.你提到了JMM模型,那你说说你对happen-before的理解,它有8大原则,分别讲讲是什么,还有你怎么理解先行发生这个概念的20.你还提到了工作内存和主内存,这是JVM下的概念,在操作系统里面工作内存和主内存分别对应什么东西,讲讲21.你熟悉计网吗,来讲讲拥塞控制的过程22.在tcp通信中,滑动窗口用在哪里了23.拥塞控制和流量控制有什么区别24.在spark设计中,有一个机制和流量控制很像,讲讲那个机制25.你是考研还是保研的,是考研有专门复习过吗26.对flink有多少了解27.有参与过开源社区项目吗28.最后问几个问题吧,堆和栈访问哪个更快,为啥访问速度有区别29.讲讲cache,cache和寄存器有什么区别写题二叉树路径和
前程似锦的加菲猫很讨厌吃香菜:?我怎么一点也看不懂,全是见都没见过的名词
查看20道真题和解析 投递字节跳动等公司9个岗位
0 点赞 评论 收藏
分享
2024-01-27 00:15
已编辑
0 点赞 评论 收藏
分享
2024-01-25 23:10
已编辑
叱咤月海鱼鱼喵:佬,太强了
查看25道真题和解析 投递网易等公司9个岗位
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务