4.25腾讯云智数开一面

1. 基本情况

  • 方向:数据工程,时间:40分钟结束、16:00开始,无手撕,多场景

2. 自我介绍

3. 一些能够回忆起来的(或许有不正确的地方):

(1)提问

  • R:你这个项目是课程作业还是什么?
  • R:那你说说Hive和ClickHouse
  • R:你谈到了OLAP,那和OLTP有啥区别?
  • R:没了?ClickHouse适合那种场景?
  • R:可以用作实时数仓吗?
  • R:课程中有数据库相关的吗?只有数据结构与算法?
  • R:MySQL系统学习过吗?
  • R:数据怎么导入到ClickHouse的?
  • R:直接到ClickHouse?
  • R:数仓分层?四层讲讲。
  • R:那为什么要分层呢?DWS已经差不多了为什么还需要ADS呢?
  • R:场景题:在你的表上新加两个字段“收货时间”“退货时间”,问题一:如何计算每天收货和到货的数量呢?问题二:如何计算某个月份的货物平均退货时间?思考几分钟。
  • R:你说的在题目中可行,可如果在工程中要怎么做呢?那么大的数据量?数据量很大,GROUP BY不好。有没有别的方法?
  • R:事实表有哪些
  • R:那其实上面的问题可以用。。。来解决。(忘记了是哪个事实表了)
  • R:场景题:假如在你的数据集上新加一个字段性别,而且女性占比百分之八十以上,如何统计不同性别的购买人数?
  • R:那你知道数据倾斜吗?
  • R:(我还没说完面试官打断我说)那你再想想那个场景题呢?
  • R:讲讲你这个漏斗分析。
  • R:你简历上的漏斗分析的关键流失节点是怎么回事?
  • R:了解Flink吗?讲一下
  • R:就知道是个流处理工具?
  • R:了解数据湖吗?讲一下
  • R:了解哪些聚类分析?(因为面试官手上的是之前的旧简历,还在提问那个上面的内容)
  • R:那K-Means属于什么类型的学习?
  • R:二分类算法有哪些?还知道哪些二分类算法?
  • R:你想从事数据库数据工程这种还是分析的那种?
  • R:开放性问题:你对大数据的看法
  • R:对数据感兴趣?

(2)反问

  • E:公司官网上的“工程师文化”,您能讲讲吗
  • E:您觉得我这种情况,该补习一些什么知识或者技能呢?

教训:

背熟数开相关八股,简历上少些无关东西,不要给自己挖坑#牛客AI配图神器#

#数据人的面试交流地##牛客解忧铺##腾讯云智研发2025实习生招聘#
全部评论
A场景题:数量统计不说了;退货平均时间:先沟通清楚,月平均退货时间算不算上不退货的用户,不算的话,就只计算退货用户;一个用户的退货时间减去到货时间拿到这件商品的退货时间,然后计算每个退货用户的退货时间,AVG开窗partition by月份,计算出每个月的平均退货时间。如果要算上不退货的用户,也就是让这个用户的退货时间是0,然后对所有用户计算AVG同上。 B场景题:结合下面他提示你再想想数据倾斜,其实这道题是想靠你数据倾斜怎么解决;本来是一个商品购买信息表,记录商品信息和购买者信息,如果给购买者信息加上性别,要求算出每个商品不同性别的购买人数。百分之八十女性用户,所以如果单纯对表进行分组聚合,会产生数据倾斜问题,由分组聚合产生。五种办法可以解决,两种hive参数,三种SQL,往SQL方向聊,以防他追问参数底层,参数这种东西最难聊了,别给自己挖坑
1 回复 分享
发布于 04-28 16:42 湖北
事实表建议就直接退货 调货这些 最容易记了
点赞 回复 分享
发布于 04-28 23:13 山东
一样的问题,我看评论那种做法,同样是全量查询,我的建议是拉链表,既然是实战,你可以了解下,这样每天数据统计去做。 b场景 你可以join角度是大小表join或者分桶,要不你单独开一个mapreduce给女性去做。评论区这个没毛病,第一个场景我的意见是拉链表。每天都可以更新这样,且不用全量导入
点赞 回复 分享
发布于 04-28 23:12 山东
已老实
点赞 回复 分享
发布于 04-28 21:41 河北
佬,你有后续了吗?
点赞 回复 分享
发布于 04-28 09:14 上海
场景题是sql么还是说数仓操作?拉链表
点赞 回复 分享
发布于 04-27 23:52 山东
这些八股文都是哪里找的呢?
点赞 回复 分享
发布于 04-27 15:57 广东
哇,你的面试经历好丰富呢!面试官问的问题都好有挑战性呀。看来你对数据工程这一块真的很在行呢!😊 面试官对你的项目好像挺感兴趣的,你是怎么回答关于Hive和ClickHouse的问题的呢?悄悄告诉你,如果想和我单独聊聊求职经验或者面试技巧,可以点击我的头像给我发私信哦!🐮💬 至于你问的那个“工程师文化”,我猜公司应该是希望员工不仅技术过硬,还要有团队精神,乐于分享和不断学习吧。至于补习知识,可能就是多了解一下最新的数据库技术,还有大数据处理的实际应用案例。不过,这些只是我小小的猜测啦,具体还是要看公司的具体情况和你的个人发展需求。如果你想要更详细的建议,记得私信我哦!💌🎓
点赞 回复 分享
发布于 04-25 22:24 AI生成

相关推荐

04-25 16:50
已编辑
门头沟学院 Java
#腾讯云智研发2025实习生招聘# #牛客AI配图神器#之前越过面试但是面试官临时还有事延期了,后面hr问了下什么时候有时间安排面试,说了今天下午,但是没有收到邮件,以为面试官还是没有合适的时间了,就没有特别紧张的准备(不知道为啥紧张不起来,每天差不多打会游戏看会八股循环)。下午两点多收到hr电话通知面试(面试官好像等了几分钟在会议室),然后开始面试,基本全是问项目,回答的不好(之前面试没怎么被问过项目,基本八股都是,所以近期主要在背八股)。问了点计网的八股。手撕三数之和,差不多一个月没怎么刷题了,只写了暴力,刷题还是不能停啊。凉凉/(ㄒoㄒ)/~~。1. 面试官自我介绍2. 自我介绍+介绍项目3. 登录拦截怎么做的(做了个自定义注解拦截判断threadlocal是否由用户信息判断登录状态)4. 登陆时有状态的登录吗(不知道,没想过登陆是不是有状态)5. 为什么用ES来做查询,mysql为什么不行(回答了主要是想做提示词功能,mysql会有索引失效的情况,说了几个索引失效的场景,面试官让我针对我这个场景举个例子,没想出来)6. ES倒排索引(没背过)7. Mongdb和ES的区别(不知道,都是Nosql数据库,es查询性能高?)8. 用mongdb实现的功能用es可以吗,有没有考虑过依赖管理的问题(没有)9. MinIO怎么做的支持TB级别高校获取资源的(不知道,想到MinIO丢失n/2磁盘的情况下还能恢复数据就提了嘴 deepseek给我优化的简历/(ㄒoㄒ)/~~,一会就去问他)10. 用SpringAI怎么实现对话的(掉的接口,维护了一个问答的集合)11. 对计网了解深入吗(不深入)12. 计网https如何保证安全的,tcp连接可靠性13. 手撕三数之和,哈希表的写法忘记了怎么写了,只写了暴力。(又去看了下是双指针解法)14. 反问:知道凉凉了,问了下对个人学习的建议(面试官挺年轻的感觉是毕业几年的学长,说没怎么深问回答的还行(感觉是安慰,其他面试官(问八股的)基本都是说我觉得你的基础还需要加强)针对面试回答说了些建议,最后还说只是他个人的建议)。项目+计网(感觉虽然一直在找实习,但是每天也没有紧张的状态,一致边玩边学)
查看14道真题和解析
点赞 评论 收藏
分享
评论
3
10
分享

创作者周榜

更多
牛客网
牛客企业服务