一点资讯 大数据开发 (凉经)
10.20 一面 25min
自我介绍
Hadoop三大组件介绍
MR Shuffle的过程?
Spark shuffle和 MR Shuffle概念和区别? shuffle作用?
shuffle中涉及到哪些排序?快排和归并排序时间复杂度是多少?
宽窄依赖概念,如何划分?
一亿条数据如何找出top100?
归并排序
未来职业规划?
反问
自我介绍
Hadoop三大组件介绍
MR Shuffle的过程?
Spark shuffle和 MR Shuffle概念和区别? shuffle作用?
shuffle中涉及到哪些排序?快排和归并排序时间复杂度是多少?
宽窄依赖概念,如何划分?
一亿条数据如何找出top100?
归并排序
未来职业规划?
反问
相关推荐
等闲_:感觉有好多地方会被问穿,mysql存储向量这个方案问题应该很大的,如果深问的的话,为什么不用es,不用pg,不用mivus,分块策略是怎么做的,向量化是怎么向量化的,稠密向量还是稀疏向量,再深问余弦相似度,HSWM算法,Bm25算法,为什么不用混合检索或者Rank重排序优化?其他的项目不停机分库分表咋实现的,切库过程中数据有diff的话有没有补偿策略?既然有了分库分表了有没有碰到业务上不好优化的慢sql,让这个sql读从库?而且点评的话,最好自己压测过,要不这个数据也不好解释。现在就27的情况来看,很多同学已经有了中大厂实习,这个节点也会偏向这些有大厂实习的92同学,而且hc也不多,所以坚持海投吧