俊朗的外卷侠拒绝无效加班

2025-04-16 16:23 河北工业大学大数据开发工程师发布于北京

关注

字节安全风控数开实习一面凉经

针对简历的项目提问，
介绍一下mapreduce的过程，
spark的优势，
数据倾斜的解决方案，
数仓分层的好处，
介绍一下flink,
如何实现精准一次
sql题：现在有一张表存的是这两个字段，student_id, score 数据格式如下，lihua01,['math':98 english':87, chinese':99].
写一个hivesql实现查询每个学科排名第三名的同学

sql题：hivesql实现查询今日订单量是过去7日订单量均值的2倍的商家id

#牛客AI配图神器#

全部评论

推荐最新楼层

联想内推来找我

联想_算法工程师

校友啊，数开看看我们这里呀，我可以帮你tui

1 回复分享

发布于 2025-04-16 17:14 天津

在等offer的小学生很勇敢

河北工业大学大数据开发工程师

SELECT subject, student_id, score FROM ( SELECT student_id, subject, score, ROW_NUMBER() OVER (PARTITION BY subject ORDER BY score DESC) as rn FROM ( SELECT student_id, kv.key as subject, kv.value as score FROM student_score LATERAL VIEW explode(score) kv AS key, value ) t1 ) t2 WHERE rn = 3;

点赞回复分享

发布于 2025-07-07 15:57 北京

在等offer的小学生很勇敢

河北工业大学大数据开发工程师

SELECT shop_id FROM ( SELECT shop_id, SUM(CASE WHEN order_date = CURRENT_DATE THEN 1 ELSE 0 END) AS today_cnt, SUM(CASE WHEN order_date >= date_sub(CURRENT_DATE, 7) AND order_date < CURRENT_DATE THEN 1 ELSE 0 END) / 7.0 AS avg_7_cnt FROM orders WHERE order_date >= date_sub(CURRENT_DATE, 7) -- 近7天及今天 AND order_date <= CURRENT_DATE GROUP BY shop_id ) t WHERE today_cnt >= 2 * avg_7_cnt ;

点赞回复分享

发布于 2025-07-07 15:57 北京

在等offer的小学生很勇敢

河北工业大学大数据开发工程师

WITH -- 1. 统计今日订单量 today_orders AS ( SELECT shop_id, COUNT(*) AS today_cnt FROM orders WHERE order_date = CURRENT_DATE GROUP BY shop_id ), -- 2. 统计过去7天（不含今天）日均订单量 last7_orders AS ( SELECT shop_id, COUNT(*) / 7.0 AS avg_7_cnt FROM orders WHERE order_date >= date_sub(CURRENT_DATE, 7) AND order_date < CURRENT_DATE GROUP BY shop_id ) -- 3. 筛选今日订单量为过去7天均值2倍的商家 SELECT t.shop_id, t.today_cnt, l.avg_7_cnt FROM today_orders t JOIN last7_orders l ON t.shop_id = l.shop_id WHERE t.today_cnt >= 2 * l.avg_7_cnt ;

点赞回复分享

发布于 2025-07-07 15:56 北京

04-14 14:54

门头沟学院 Java

4.9滴滴二面

1.skill按需加载主要是解决什么问题？2.优化上下文有什么手段?3.讲解一下静态规划和动态规划的区别？4.讲解一下rag全流程5.ConcurrentHashMap的原理6.CAS是什么7.synchronized的是什么8.线程池参数9.jvm内存模型有什么？10垃圾回收判断算法？11.jvm双亲委派机制12.慢sql优化手段13.联合索引14缓存三剑客15.redis和mysql的缓存一致性问题16.rocketmq如何解决消费重复的问题？ 面试官问的还比较简单，算法题也没给我出

查看16道真题和解析

点赞评论收藏

分享

04-13 23:48

门头沟学院大数据开发工程师

滴滴，大数据开发3面

前几天面了滴滴的国外业务，3面技术终面，过了，面试如下1，先自我介绍2 说一下自己做过的项目，讲一下技术难点和亮点3 能说一下你们数仓建模的基建过程吗，为啥需要这样设计，这样设计有啥好处4 看你实时经验丰富，你能说一下如果实时指标和离线指标不一致，怎么检验那个对的，为啥会出现不一致，不一致的原因有哪些5 你能说一下olap引擎有哪些吗，为啥你这边选starrocks，这个对于别的来说有啥特殊之处吗，用了哪些新特性6 对于flink任务如何确保精确一致性，如何确保实时任务没问题7 说一下实时的join有哪些，都是啥效果，哪些场景会用这个8 看你财务经验也有，对于流量数据和财务数据你认为有啥区别，侧重点主要是啥，财务需要遵循什么规范9 看你数据治理经验也有，对于数据治理你认为如何评价治理的细节，对于一个湖仓架构哪些指标可以衡量一个湖仓的好坏10来个SQL题目，最大的在线人数，这个是个经典题，比较难，需要有经验11 有啥要问的

查看10道真题和解析

点赞评论收藏

分享

04-21 22:55

门头沟学院大数据开发工程师

字节，数据开发2面

最近也面试了字节，感觉面试还比较难，面试技术较深1 先自我介绍一下自己2 介绍一下目前接触的项目，做了哪些工作，有啥亮点，技术栈主要包含哪些3 flink的窗口函数有哪些，底层运行原理是啥，触发器如果自定义一般都是怎么触发的4 对于flink来说怎么做到精确一致性，实时指标如何确保数据没有问题，有哪些保障措施5 对于olap引擎来说如果要短时间回溯百亿数据，怎么做到秒级别写入，如果一个表查询挂了写入任务，如何做到保障6 对于湖仓来说为啥现在都在说这个，湖仓对于普通的数仓来说有哪些好处，为啥现在都在部署湖仓7 对于模型建设来说，主要是设计哪些模型，每个模型在建设的时候，主要是需要考虑哪些方面，如果不遵循该怎么解决8 对于数据治理来说，你觉得一个数仓如果需要治理主要是从哪些方面入手，对于技术来说有哪些措施9 有啥需要找我了解的

查看8道真题和解析

点赞评论收藏

分享

04-19 18:53

陕西科技大学大数据开发工程师

滴滴大数据开发一面 40分钟

1.自我介绍2.开始讲项目，然后就是项目问题  项目背景-目的-自己的职责-成果3.实习经历，问我两段实习都干了什么，问的非常细，基本上都问到了4.数仓项目遇到了什么问题，我说的数据倾斜，问怎么优化5.有接触过数据治理吗？有哪些规则？6.如果晚上数仓的某一层，失败了没跑出来，怎么解决，（我说的是设置一个时间阈值，达到这个阈值没跑出来就默认是报错，然后跑前一天的数据，然后第二天早上来了检查前一天的数据有没有问题） ，公司晚上有人值班吗7.举一个指标，来实现六层数仓你会怎么设计这六层···8.谓词下推  提前过滤行（这个我回答错成，投影上移，选取列）大意了9.怎么检验数据那个值到底对不对10.对大数据开发的理解，重要的是什么，实习你都学到了什么···11.sql,共享屏幕，连续最大在线人数，（前一天刚刚看了）结果太紧张了，直接拿日期-时间，面试官让我讲解一下思路，然后问我日期可以减去时间吗？我才想起来，然后我说用date_sub函数，后面是count计数，我又写成sum，但是这两个都是面试官提醒了我一下，我就改对了12.反问环节问的对于实习生是怎么培养的好久没面大厂，写sql时有点紧张

查看12道真题和解析

点赞评论收藏

分享

04-24 03:20

门头沟学院 Java

字节搜索广告后端开发一面

发面经攒攒人品，现在复盘觉得自己答得超级无敌烂😭第一次面大厂就被狠狠拷打了，尤其是布隆过滤器只背了一点原理，被问得汗流浃背了。简历上一段非互联网后端实习+一个agent玩具项目1.agent项目用的是什么大模型？2.部署在什么地方？部署的过程遇到什么问题？3.对模型的推理框架有了解吗？4.实习拷打问题×n……（下面基本是我的八股吟唱）5.redis在你两次同步到数据库里突然挂了怎么办6.说一下redia持久化机制7.缓存击穿、缓存穿透8.布隆过滤器什么情况下会误判9.那一个普通的位运算是100%准确判断的吗？（麻了…）10.布隆过滤器和普通的bitmap有什么区别（答了一点但是现在发现不够全）11.布隆过滤器加hash函数的目的是什么（其实知道但不知道为什么磕磕巴巴）12.布隆过滤器的误判率受什么影响（也莫名其妙磕磕巴巴）13.介绍你实习的时候用的数据库，和mysql有什么区别后续问我对mysql了解程度怎么样，我说还行，面试官说还行那就不问了，后续手撕手撕：LCR 082.组合总和2，一开始不熟悉ACM模式一直报错，让面试官看了一下，面试官让我继续调代码或者写死就行，然后我写死了就运行出来了。反问的时候问我主要写什么语言。面试官人比较温柔，虽然把我问麻了但是面试官人比较好，也可能已经对我无语了🥲

查看12道真题和解析

点赞评论收藏

分享

评论

1

16

招聘动态

完美世界

拍了拍你并邀请你投递

上海人工智能实验室

2026年春季校园招聘

27届校招宝典

快手

27届实习超多转正机会

海信集团

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

16844次浏览 118人参与

# Vibe Coding 会干掉初级岗位吗？ #

51703次浏览 328人参与

# 我的求职总结 #

486675次浏览 6870人参与

# 美团秋招笔试 #

218932次浏览 1196人参与

# 27届实习投递记录 #

85358次浏览 906人参与

# 实习生应该准时下班吗 #

360551次浏览 1762人参与

# 职场吐槽大会 #

361446次浏览 2308人参与

# 面试常问题系列 #

311135次浏览 4803人参与

# 面试中的破防瞬间 #

1268879次浏览 11141人参与

# 我是XXX，请攻击我最薄弱的地方 #

96113次浏览 642人参与

# 拼多多工作体验 #

62800次浏览 439人参与

# 机械人还在等华为开奖吗？ #

342033次浏览 1655人参与

# 华为工作体验 #

332365次浏览 1439人参与

# 牛油的搬砖plog #

207622次浏览 1337人参与

# 什么专业适合考公 #

73485次浏览 476人参与

# AI Coding实战技巧 #

32078次浏览 400人参与

# 实习工作，你找得还顺利吗？ #

597384次浏览 6758人参与

# 求职遇到的搞笑事件 #

192929次浏览 962人参与

# 运营每日一题 #

147691次浏览 981人参与

# 小厂实习有必要去吗 #

95216次浏览 453人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务