2025-03-06 19:13 门头沟学院大数据开发工程师发布于北京

关注

腾讯PCG-数据工程一面

1.  简单介绍一下项目
2.  在中间层建设中遇到过什么问题
3.  数仓中状态的更新是比较及时的,如何记录这些状态,最核心是关心最终的状态还是流转的状态
4.  拉链表是什么,怎么实现的,执行过程中怎么解决效率的问题
5.  用的什么计算引擎,sql在spark上怎么执行的
6.  spark的提交流程
7.  uv和pv的含义,计算uv在spark上的运行原理
8.  MapReduce的原理,快排的目的是什么,有序的目的是什么,知道每个过程才能知道如何去调优
9.  sql转ast是怎么转的
10. ast做逻辑执行计划优化做了哪些
11. 逻辑执行计划和物理执行计划大概有什么区别
12. 写sql过程中有没有遇到过执行时间特别长的,引出数据倾斜相关内容(问的很细,基本所有的都问了)
13. 不同数据类型join为什么导致数据倾斜
14. mapjoin和正常join的区别,mapjoin原理是什么,怎么实现的
15. 加随机数打散,两阶段聚合怎么做的
16. new一个线程怎么做,thread和runnable的区别是什么
17. java集合类用过哪些(说没怎么用过java,就没再问了)
18. sql在不同执行引擎下有什么区别,答有些语法不通用,为什么不通用,如何造成这种问题的
19. sql中所有关键字的执行顺序
20. a join b where条件写在join里面和join外面有什么区别
21. 4道sql
22. 一道mid算法

做的是计算引擎调优，一直在问spark底层，顶不住顶不住。
当晚挂...

全部评论

推荐最新楼层

杨慕辣_许愿offer版

石家庄学院大数据开发工程师

请问做完测试题等了多久才面试的？

点赞回复分享

发布于 2025-03-09 11:44 河北

调皮的山羊在写bug

上海科技大学数据仓库

这个偏数据平台了么

点赞回复分享

发布于 2025-03-07 13:19 北京

04-07 21:54

广州大学前端工程师

双非前端暑期腾讯pcg二面噩梦缠绕

实习生当社招面，所有人全疯了这次加粗的不是答不出来的，是答案缺乏深度的，不是实习生哪来的深度自我介绍为什么选择前端有没有接触过其他方向（写过一丢丢服务端）用过哪些 AI 工具（说了平常用 AI 的用途，之前构想的单人异步工作流从输入提示词到 AI 产出结果发生了什么（？？？先是想说 ReAct、Plan and execute 之类的，告诉我别说这些，就说 agent 做了什么）你对提示词如何规范 AI 产出的理解，它到底做了些什么（只能说说列计划啊工具调用啊之类的）怎么理解 harness engineering，有没有实践过（说了一下 skill 之类的，然后确认与 ai 的需求文档）手撕...

点赞评论收藏

分享

03-27 11:10

滴滴出行_国际化事业部_数据开发(实习员工)

腾讯数据工程一面

1. 自我介绍2. 用Hive还是Spark,比较了解哪个3. spark问题定位流程，以及解决方法4. 现在有一个任务跑的很慢，你如何去定位5. 介绍一下广播和Shuffle的区别，以及Shuffle为什么会比广播慢？你这里面之前说到的大部分都是在数据传输上，包括涉涉及到一些网络会导致它传数据量大比较慢嘛。6. Shuffle将各个节点的数据传输到另一个节点之后，会做什么操作呢？7. 小文件导致任务运行缓慢，是在Spark读的环节还是哪个环节？8. 用过二级分区吗？用Spark写Hive二级分区时有没有遇到过什么问题？9. flink的滑动窗口，以滑动窗口为例子啊，就是每5分钟统计过去一小时的那个行为流水，100万一分钟的，然后你5分钟去输做这种滑动窗口所计算的时候，怎么去预估它可能会产生多大的输出，以及计算量。10. flink 的就它发完了，它在重写的时候有个问题，我想问一下。它能基于checkpoint，我们可能说是checkpoint来重启嘛。那我数据从kafka里面消费的时候，我们可以某个精确到某一秒的时间点，能回溯对应的数据吗？11. 那有没有哪里有性能问题？换一种更好的方式写的话，你会怎么写？12. 如何优化你写的这两个sql13. 这两段sql在spark里面是如何运行的

查看13道真题和解析

点赞评论收藏

分享

03-30 19:33

门头沟学院 Web前端

腾讯PCG一面凉经

在你简历中的两个项目里，你觉得哪一个做得比较好或者更有技术含量？讲一下虚拟滚动的实现原理是什么？虚拟滚动在处理用户快速滚动时，底层是如何监听更新并保证页面流畅度、不掉帧的？针对 AI 对话的流式渲染，在技术选型时为什么要选择 SSE 而不是 WebSocket？结合 Markdown IT 工具，前端打字机效果具体是如何处理数据拼接和渲染的？你目前实现的打字机效果，是根据服务端响应的数据块增量渲染，还是真正做到逐字渲染的？假设后端逻辑不变，要求前端调整成“带有光标且挨个字匀速吐出”的真实打字机效果，你会怎么调整架构设计？如果这个 AI 对话平台要做到支持一万个用户同时在线，从前端或服务端的架构...

查看17道真题和解析

点赞评论收藏

分享

03-23 16:51

长沙学院 Java

数据说话：技术类扩招36%，产品类扩招39%重点岗位：AI金融投资研究员：用AI搞量化、做投研金融AI Agent高级工程师：智能体方向元宝AI产品经理：既懂技术边界，又懂用户需求薪资：30K-60K，15薪特点：金融AI赛道特别强，想搞“AI+金融”的盯紧腾讯。

找AI工作可以去哪些公司...

点赞评论收藏

分享

03-25 19:37

已编辑

蚌埠坦克学院 C++

字节 AIDP后端开发暑期实习一二面

时隔一年再战字节 又是二面挂了😅 每次字节都是第一个面的 准备的确实也不太好。一面 1h左右 根据项目问的八股1. 介绍项目 事务消息在项目中是怎么用的2. 除了事务消息还有哪些实现分布式事务的方法 优缺点是什么3. 2PC 3PC的区别4. mysql执行一条插入语句的过程5. mysql中有哪些索引 分别用了什么数据结构实现的？ 比较各种数据结构6. 分布式事务和本地事务的区别？7. 队列怎么保证消息不丢失 不重复消费算法：实现一个类似于MVCC的数据结构 按不同时间戳保存数据的多个版本 询问时返回数据不超过timestamp的那个版本面试官经典问题：1. 为什么要用这个技术实现功能2. 这个技术和其他相似技术的区别是什么 还知道哪些其他技术3. 技术的底层原理感觉面试的核心就是这三个问题二面 1h左右1. 智能指针介绍一下 什么时候用原始指针好？2. 深拷贝 浅拷贝3. 平时怎么用AI辅助编程的 有什么经验吗？4. 实习过程中做完一个项目有没有总结可复用的内容5. 了解大模型评测吗 怎么评测的？怎么评估一个测试集的质量？6. 有了解AI前沿的技术吗算法题：判断二维平面上3点能否构成三角形 主要考虑优化double的精度问题 这题我直接用叉积 但是面试官说的精度不够 我后来又问豆包 给的答案和我一样 不知道面试官想要什么答案。反问：1. 有哪些不足？ 技术上还行 但是对于AI的理解比较欠缺。

查看18道真题和解析

点赞评论收藏

分享

评论

9

26

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

35446次浏览 441人参与

# 想从事Agent应该学习哪些技术？ #

8672次浏览 295人参与

# 有哪些公司在面试时考察AICoding？ #

19647次浏览 350人参与

# 你的第一家实习公司是什么档次？ #

70325次浏览 335人参与

# HR面都在聊什么？ #

13920次浏览 164人参与

# 大学生该如何认清当下的就业环境？ #

162547次浏览 889人参与

# 26届春招投递记录 #

3656次浏览 42人参与

# 从投递到OC，你用了多久 #

24077次浏览 241人参与

# 什么人最适合大厂？ #

12902次浏览 134人参与

# 哪些公司面试还在问八股？ #

14298次浏览 125人参与

# 父母问你工作找得怎么样，怎么回 #

23305次浏览 285人参与

# 我的求职进度条 #

1118149次浏览 8063人参与

# 如何快速融入团队？ #

50128次浏览 306人参与

# 校招生月薪1W算什么水平 #

143454次浏览 493人参与

# 你觉得什么岗位会被AI替代 #

57289次浏览 371人参与

# 多益网络工作体验 #

68595次浏览 310人参与

# 薪资爆料 #

412715次浏览 2209人参与

# 美团开奖 #

407837次浏览 1805人参与

# 运营来爆料 #

98846次浏览 508人参与

# 你觉得机械有必要实习吗 #

83702次浏览 529人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务