快手大数据开发

#面试问题记录#
我前几天面的大数据开发岗位,社招,岗位薪资是30-60k的,面试问题如下
1 先自我介绍
2 从你做的实时项目和离线项目重点讲一下你建设的过程和遇到的问题
3 对于离线来说,你的dwd,dws,dim,ads是怎么建设的,dwd是按照什么划分的dws建设的时候需要遵循什么规范,如果一个业务在最开始做基建的时候需要怎么规划,dws如何建设可以做到后续的复用,如何体现可扩展性
4 对于dqc规则一般都是配置哪些,触发了规则怎么止损,对于数据治理你怎么治理的,治理有啥量化的指标,对于一些耗时很久的任务如何进行优化
5 对于实时来说我看你经验比较丰富,你平时实时主要是用哪些技术栈,对于实时一般哪些问题比较严重,你主要是做了哪些优化,优化之后提升了几倍性能,如何确保这个实时任务不延迟不出现计算问题,对于监控怎么监控的
6olap的几个都聊一下,为啥需要选型这个,都各有哪些好处,为啥现在各大公司都在追求湖仓一体,对于超大的数据,一天如果有千亿起步的量级,对于数据生命周期和每个表的分区分桶和索引有啥好的方案
7 对于用户画像你是怎么建设的,是如何高效的运用你建设的数仓模型,对于时效性你怎么做到的稳定可靠
8 ai你们公司有用吗,ai如何进行提效的,对于一些常规的报警和一些常规的上线ai可以解决吗,怎么玩的
9 你也干了几年大数据开发了,如果你作为一个领导者如何评价你们团队数仓建设的好不好,对于好的地方如何量化,不好的地方如何改进,如何平衡各个业务的模型规范
10 你这边有啥问我的,
我面试了2场了,给我的感觉就是人家招的是需要有实时和离线能力的人,而且是需要有快速解决问题,并且可以给团队带来技术的人,还可能要点对整体技术基建和带人的领导能力,当然薪资估计也比较高,我估计给40k起步应该问题不大的,而且我估计过了,hr频繁给我打电话呢,我还是不打算去,毕竟去年刚来这家新公司,对于需要玩大数据实时离线的可以看看我上面的问题你们都能不能会,都会估计可以去试试快手
全部评论
很棒的分享
点赞 回复 分享
发布于 04-09 17:52 北京

相关推荐

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。团队介绍:AIDP(AI Data Platform)是深度参与字节跳动 AI 数据管理与模型训练流程的数据基础设施团队,提供数据采集、清洗、标注、合成、验证、管理等全流程的数据服务和全面解决方案。加入我们,你能深度参与字节 AI 核心业务近距离接触真实的大模型训练场景,解决数据处理中的实际问题和优秀团队协作,在数据与模型的交叉领域积累实战经验;在数据与模型领域实现个人价值,推动行业进步。你的工作将直接影响 AI 技术的落地效果,推动技术真正服务于用户。1、围绕Seed大模型数据全生命周期,参与/负责大模型数据管理平台的数据基建的整体架构设计与建设,包括数据接入、处理、检索、跟踪、质量评估、权限合规等基础能力;2、构建Seed大模型海量数据的资产目录、标签体系、元信息管理及血缘分析能力,提升高质量数据挖掘效率与可用性,赋能算法预训练、SFT/RLHF等核心场景;3、协同基础架构/云平台团队,搭建稳定高效的底层数据基础设施(数据湖、对象存储、向量存储、分布式计算、元数据管理系统等);4、主导技术选型与架构优化,基于Spark/Flink/Ray、湖仓一体、向量数据库等技术栈,构建高吞吐、高容错、可扩展的处理存储能力,支撑日PB级数据处理。职位要求1、2027届本科及以上学历,计算机、通信等相关专业优先;2、具备大数据开发相关技能,熟悉Java/Scala语言,包括JVM、类加载、并发等;有较好的SQL基础;3、熟悉Flink、Spark、Kafka、ClickHouse、Doris、Hudi、Icebreg、Paimon中的部分大数据引擎,掌握原理及性能调优优先;4、善于沟通,对数据敏感,责任心强、积极主动;5、每周实习4天以上,连续实习3个月以上。
点赞 评论 收藏
分享
评论
6
12
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务