腾讯 天美一面 9.19

两道智力题一道场景题一道算法题
不是kpi我吃#牛客AI配图神器#
全部评论

相关推荐

1.  先请你做一个简单的自我介绍。2.  你能给我分享一个你觉得比较值得分享的项目吗?哪一个亮点比较突出?3.  (针对调度中心)你这里有没有去做一些性能上的压测?4.  (针对调度中心)它的稳定性、可靠性方面有什么设计吗?5.  (针对调度中心)你能否做到定时任务的并发实例控制?(比如上一个任务没跑完,下一个任务又来了)6.  介绍一下HashMap它底层的原理。7.  HashMap是一个线程安全的数据结构吗?8.  讲一下死锁是怎么形成的,我们可以采取什么策略去规避这个问题?9.  平时在代码过程中怎么去注意,避免出现死锁的情况呢?10. (针对死锁规避)你怎么做这个保证呢?怎么去确保(至少一个线程能拿到所有资源)?11. 假设有多个线程需要获取两把锁,你怎么去避免死锁呢?12. (针对原子操作的回答)具体一点用什么操作可以设置?13. 怎么去设计一个分布式锁呢?14. (分布式锁)有没有可能执行时间太长,导致Key被Redis释放,被另外的进程拿到,然后原进程又执行了删除(误删锁)?15. (分布式锁)如果因为网络故障导致续期不成功,那怎么办呢?有没有更可靠的方式?16. 讲一下MySQL索引的原理。17. 假设我有一张表,给它的每一个字段都设置一个单独的索引,这是一个好的方法吗?理由呢?18. (那)做一个囊括所有字段的大联合索引,是不是能够比较好的解决这种问题?19. (针对联合索引)为什么?为什么还要回表呢?20. (场景:读多写少、查询条件无规律)这个大联合索引还有什么别的问题吗?21. (那)我给他们每个字段都单独加上索引这个方案怎么样?22. 那这种情况下你有什么办法做的更好?23. 假设开发一个电商系统,要做一个实时的热榜系统(比如24小时内点击量最高的前100个商品),你有什么想法吗?24. (热榜系统补充)时间范围是可以选的(24小时、一周、一年),并且是滚动更新的。25. (针对方案)它的数据量级很大,点击量可能达到上亿甚至几十亿,你(的方案)撑得住吗?26. (针对方案)真的有必要记录每一次点击的数据吗?内存也顶不住。27. 我刚刚讲的是要做一个秒级的(更新),你这个(方案)是能做到秒级的延迟吗?28. 看你有什么问题想问我。
查看28道真题和解析
点赞 评论 收藏
分享
1.WordCount 具体是怎么跑的?比如怎么分片、map 阶段做了啥、shuffle 是咋回事、reduce 最后怎么汇总的2.MapReduce和Spark 到底差在哪儿?适用场景这些都得对比着说3.Spark 提交任务时,Client模式和集群模式有啥不一样?比如 Driver 在哪跑、日志在陖瞎圈看、适合啥场景4.同一条 SQL,为啥 SparkSQL 跑起来比HiveSQL 快?得从执行引擎、优化器这些底层说说原因5.自定义 UDF 怎么实现?比如在 Hive 或Spark 里,具体步骤是啥,有没有踩过坑6.设计 HBase 表得注意啥?rowkey 怎么设计才合理、列族要不要分、版本数怎么设,这些睪腘狐旨を曽斷纰可能问到7.HBase 里的 HLog 是干嘛的?跟数据持久化、故障恢复有关系吗8.都是存在 HDFS 上的数据,为啥 HBase 能支持在线实时查询,Hive 就不行?底层存储结构不一样在哪9.用 SparkSQL 操作 Hive 数据时,有没有縈区堠浓ゴ壮攥到过兼容性问题?比如某些函数不支持、数据格式读不对之类的,怎么解决的10.Spark Streaming、Storm、Flink 这几个流处理框架,区别在哪?各自的优缺点和适用场景得搞明白场景题:11.数据量特别大,要用三个 Map 和一个Reduce 来做 Top10,哪种方法效率最高?得考虑怎么减少数据传输、避免倾斜
查看11道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务