你是研究生?看着面试挺有难度的啊
点赞 评论

相关推荐

04-08 20:18
已编辑
苏州大学 数据仓库
点赞 评论 收藏
分享
首先自我介绍,然后I.上来就是两道中等的sql题目:1.SELECT   CASE     WHEN name_count > 1 THEN CONCAT(d.name, s.name)    ELSE s.name  END AS display_nameFROM (  SELECT sp.*, COUNT(*) OVER (PARTITION BY sp.name) AS name_count  FROM student_profile sp) sJOIN department d ON s.department_id = d.id;唯一记录的一条sql,我感觉有小问题,但是感觉面试官很急。我想改他直接说赶紧下一个。为什么select里面用的别名不能直接用到同一个语句中,我回答sql执行顺序的问题,以及在hive中会报错,未找到相应的名字。他笑了,我的回答错了???whateverIII. 考了spark shuffle 的过程,非常的细节,怎么给partition分区?我的回答:spark.default.parallelism,通常等于集群的 CPU 核心数,默认值为 200。或者读取文件时指定分区数。然后这里他又笑了,内心os:这位大佬是微笑大使。IV. 他让我直接写ods 和 dwd 层建模的过程!这一考法我有点不理解要考什么,有木有大佬给我解答一下(感谢)。虽然我写了一部分,但是有的还是忘了。V. 考了我HTTP中reception的作用,不知道这里是不是我听错了,我说能再说一遍吗?他说没时间了,今天就这样吧。总结:自我介绍我太简略了?我想着他手上有我的简历,他好像对我的实习经历有点不感兴趣,因为他说我介绍的时候都是业务层面的?Interview time:One Hour中间还有一些,我就没写了。。。#如何判断面试是否凉了##大家都开始春招面试了吗##数据人的面试交流地##牛客AI配图神器#
点赞 评论 收藏
分享
状态最差一次面试,整个人在漫长春招一个多月后开始说话语无伦次+脑袋不转。0. 面试官自我介绍,问实习时间1. 自我介绍,简单讲项目2. neo4j底层怎么存储:基于磁盘的二进制文件存储3. 故障怎么办:故障检测、宕机恢复4. 访问量增加怎么办:水平扩展、读写分离、索引缓存(redis5. redis怎么数据一致性:单线程保证了、主从同步、持久化机制6. py的dict怎么安全多线程?加锁7. py线程池 threadlocal:忘了8. 分布式负载均衡的算法:rr、wrr、随机、加权随机、最少连接9. CAP:一致性可用性和分区容忍不可兼得,一般舍弃C或者A10. 项目和hdfs的区别:算法上,结构微调11. 知道其他大数据组件吗:没咋看12. 分布式系统总结 共通的特点解决问题和架构:解决一致性可用性分区容忍、负载均衡容错。。架构是分namenode和后面存储node13. 解决数据一致性的方法:2PC预提交 + 正式提交、投票、最终一致性14. 场景:py 生产者消费者 时间戳数据 怎么实现15. Queue有界的话怎么办?丢异常16. 报错怎么解决:重传、调速度17. queue锁怎么设计:互斥锁、又说了乐观锁桶锁好像跑题了。。应该有条件变量?18. 加整个queue还是怎么加?生产者生产的时候消费者没办法消费:只锁关键小段代码19. 假设分布式系统十亿数据挑选最大top10:每个服务器选top10然后归并。选的算法可以hashset、可以bitmap、可以堆排,考虑到内存。20. spark用py写的?对。。21. 卡夫卡用过:恩22. 反问感觉又要凉了,自己面的方向太多做的东西又杂.. 路漫漫其修远兮😌
查看22道真题和解析
点赞 评论 收藏
分享
牛客网
牛客企业服务