数开面经

#找实习# #面经# #数据人offer决赛圈怎么选#
投的太多忘了什么公司了,打电话约面,面的时候发现偏推荐系统的业务,

1.自我介绍
2.项目太简单了,不太对口,面试官好像不太清楚数仓建模?问了点基础八股
3.HDFS的组成架构
4.HDFS读数据的流程
5.MapReduce的执行流程
6.spark的执行流程
7.sparkSQL中map和flatmap的区别
8.hive数据倾斜
9.hive内部表外部表区别
10.小文件处理
11.flume结构
12.flume丢失数据如何处理
13.推荐算法做过吗,机器学习这类(在学校学过,做的不太多,分类回归预测这些)
14. Hive和传统数据库区别(应该是HDFS作为存储数据库)
15. HDFS副本机制
16.spark on yarn和spark standalone区别
17.Python和Java哪个用的多,用来做什么

后面一直在问数据挖掘相关问题,感觉不是很对口,面试官说会反馈我这个情况,数据挖掘倒是也做过,和想找方向不是很统一。
全部评论
mark基础八股题
1 回复 分享
发布于 2025-06-19 16:56 湖北
mark
点赞 回复 分享
发布于 2025-06-20 17:04 湖北

相关推荐

自从我室友在计算机导论课上听说了“刷 LeetCode 是进入大厂的敲门砖”,整个人就跟走火入魔了一样。他在宿舍门口贴了一张A4纸,上面写着:“正在 DP,请勿打扰,否则 Time Limit Exceeded。”日记本的扉页被他用黑色水笔加粗描了三遍:“Talk is cheap. Show me the code。”连宿舍聚餐,他都要给我们讲解:“今天的座位安排可以用回溯算法解决,但为了避免栈溢出,我建议用动态规划。来,这是状态转移方程:dp[i][j] 代表第 i 个人坐在第 j 个位置的最优解。”我让他去楼下取个快递,他不直接去,非要在门口踱步,嘴里念念有词:“这是一个图的遍历问题。从宿舍楼(root)到驿站(target node),我应该用 BFS 还是 DFS?嗯,求最短路径,还是广度优先好。”和同学约好出去开黑,他会提前发消息:“集合点 (x, y),我们俩的路径有 k 个交点,为了最小化时间复杂度,应该在 (x/2, y/2) 处汇合。”有一次另一个室友低血糖犯了,让他帮忙找颗糖,他居然冷静地分析道:“别急,这是一个查找问题。零食箱是无序数组,暴力查找是 O(n)。如果按甜度排序,我就可以用二分查找,时间复杂度降到 O(log n)。”他做卫生也要讲究算法效率:“拖地是典型的岛屿问题,要先把连通的污渍区块都清理掉。倒垃圾可以用双指针法,一个指针从左往右,一个从右往左,能最快匹配垃圾分类。”现在我们宿舍的画风已经完全变了,大家不聊游戏和妹子,对话都是这样的:“你 Two Sum 刷了几遍了?”“别提了,昨天遇到一道 Hard 题,我连暴力解都想不出来,最后只能看题解。你呢?”“我动态规划还不行,总是找不到最优子结构。今天那道接雨水给我整麻了。”……LeetCode 真的害了我室友!!!
老六f:编程嘉豪来了
AI时代还有必要刷lee...
点赞 评论 收藏
分享
中科曙光 大模型推理优化工程师 25w 硕士211
点赞 评论 收藏
分享
评论
3
20
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务