腾讯云智一面被吊打

谁懂啊,一面就遇到10年经验大佬,简历提了嘴对分布式计算有一定理解,就疯狂问带数据的东西
自我介绍5分钟 (介绍的烂1分钟结束)
1. kafka架构 生产者 消费者,中间的broker 里面有多个topic topic多个副本,一个leader leader的作用? 知道checkpoint吗 如何保证消息不丢失,背了个多个节点收到ack还有个忘了
2. zookeeper架构 用的什么一致性协议 cp还是ap
3. spark架构 (你不是大数据专业的吗,为什么不了解大数据框架架构啊,我:只会应用  学校哪教了架构啊)
4. nacos服务发现的原理 sentinal熔断降级处理方式
5. java的io包用过哪些
6. jvm内存结构
7. redis缓存击穿穿透雪崩
8. 口述wordCount+topk问题 分布式情况下怎么处理
9. 接口慢,怎么处理 怎么看磁盘io是否阻塞 
10. docker容器原理,通过linux什么技术实现
11.项目架构图
全程紧绷,答出一半不到,面试官很耐心,有些想不出放弃的会让我多想想,不会的都会耐心的提示和解答,面试过程中一直想着放过我吧我就一废物速速结束吧,感谢面试官的时间拷打我这废物,面试跟上课似的疯狂学习
全部评论
我一面怎么是纯聊天,那个base地是看腾讯会议的标题么
1 回复 分享
发布于 2023-11-03 10:57 重庆
校友,你这也太顶了
1 回复 分享
发布于 2023-09-27 20:35 重庆
弱弱问一句,自我介绍怎么介绍5min的😭
点赞 回复 分享
发布于 2023-10-31 12:22 四川
过了吗,这也太难了😰
点赞 回复 分享
发布于 2023-10-11 22:57 陕西
顶个,祝二面过
点赞 回复 分享
发布于 2023-10-09 16:55 重庆
你这个也太难了
点赞 回复 分享
发布于 2023-09-26 19:18 北京
大佬投的是武汉的嘛?
点赞 回复 分享
发布于 2023-09-26 18:39 湖南

相关推荐

1. 基本情况方向:数据工程,时间:40分钟结束、16:00开始,无手撕,多场景2. 自我介绍3. 一些能够回忆起来的(或许有不正确的地方):(1)提问R:你这个项目是课程作业还是什么?R:那你说说Hive和ClickHouseR:你谈到了OLAP,那和OLTP有啥区别?R:没了?ClickHouse适合那种场景?R:可以用作实时数仓吗?R:课程中有数据库相关的吗?只有数据结构与算法?R:MySQL系统学习过吗?R:数据怎么导入到ClickHouse的?R:直接到ClickHouse?R:数仓分层?四层讲讲。R:那为什么要分层呢?DWS已经差不多了为什么还需要ADS呢?R:场景题:在你的表上新...
牛客861513826号:A场景题:数量统计不说了;退货平均时间:先沟通清楚,月平均退货时间算不算上不退货的用户,不算的话,就只计算退货用户;一个用户的退货时间减去到货时间拿到这件商品的退货时间,然后计算每个退货用户的退货时间,AVG开窗partition by月份,计算出每个月的平均退货时间。如果要算上不退货的用户,也就是让这个用户的退货时间是0,然后对所有用户计算AVG同上。 B场景题:结合下面他提示你再想想数据倾斜,其实这道题是想靠你数据倾斜怎么解决;本来是一个商品购买信息表,记录商品信息和购买者信息,如果给购买者信息加上性别,要求算出每个商品不同性别的购买人数。百分之八十女性用户,所以如果单纯对表进行分组聚合,会产生数据倾斜问题,由分组聚合产生。五种办法可以解决,两种hive参数,三种SQL,往SQL方向聊,以防他追问参数底层,参数这种东西最难聊了,别给自己挖坑
点赞 评论 收藏
分享
问题1:为什么会使用分库分表,到达了什么样的数据级别才会去加设计,是否对数据量有一个统计我的理解:看星哥之前写过 单表行数超 500 万行或者单表容量超过 2GB,推荐分库分表,但是面试的过程中怕被问自己写的项目会有这么大的数据量吗不要这么硬背,具体情况具体分析,有的表字段少,经常是条件等值查询,这样加个索引,一个亿也不用分表,有的字段多,还是范围查询,可能5000万就得分表,面试官问你你说是自己在学习分库分表应用到项目中,自己造了几千万的数据量问题2:基因法需要分表的一个数量和确定的一个东西(我的理解是分表的依据,例如大麦中是订单编号和用户id),但是正常的生产环境中是可能动态改变的,比如说需要动态扩容的话,怎么解决呢(例如当前有4个分表,但是现在需要扩充到8个分表),是使用双写吗?这个在扩容前就要考虑好能维持多少年内不需要再扩容。转转架构师在分库分表前,通过之前记录的数据增长量,做了256张表,能在7年内不需要再扩容,如果需要扩容的话,可以使用双写,新扩容表写的过程中,用新的分库分表算法问题3:如果在防止超卖的过程中,Redis不可用了,怎么解决我的理解:使用Redis集群和主从复制吗?因为Redis宕机的话数据库的数据也不能保证是最新的版本,所以得尽量保证Redis不宕机?肯定要使用redis集群模式,但可能会有主从延迟,导致从节点数据不是最新的,但关系不大。可以在用户生成订单后,修改数据库的座位和库存,然后用户支付后,再改数据库的座位和库存,每一步都做好验证。这样从节点的数据问题会降到最低。问题4:如果在当前的幂等验证逻辑中,有一个消息所对应的幂等标识符是不存在的,按照现有的逻辑是可以执行的,但是幂等验证之后的业务系统异常了,这个时候应该怎么处理呢(即通过了幂等的验证,但是后面的服务down掉了,比如说下游抛了一个异常出来)【没太明白应该回答什么,是指需要将幂等标识符重新进行设置吗】异常了就异常了呗,把这个请求的标识从redis中删除了,就像分布式锁时,业务异常也要执行解锁一样,让下一个请求进来正常执行,然后设置好标识位问题5:本地缓存为什么使用Caffine呢,为啥不用Guava因为caffine的性能要远高于Guava,没有其他复杂原因我的理解:查了下Caffine就是Guava改进而来的,可以这么说吗- Caffine在读写操作方面的性能更高,是基于异步的操作,将淘汰过期操作与读写进行分离- Caffine采用了一种结合 LRU、LFU的算法W-TinyLFU+,具有高命中率,低内存占用的特点
查看5道真题和解析
点赞 评论 收藏
分享
评论
6
39
分享

创作者周榜

更多
牛客网
牛客企业服务