字节跳动data部门三面凉经

字节

一面(60min)

  1. 自我介绍
  2. 说一个自己做的项目
  3. spark和hadoop的不同之处
  4. spark为什么快?
  5. 说说自己对spark和hadoop的理解
  6. hadoop里的namenode和datanode
  7. spark的lazy体现在哪里
  8. Yarn相对于hadooop的不同在哪里
  9. hdfs数据存储
  10. 二叉树层次遍历
  11. 子序列的最大和
  12. valitile关键字
  13. c++里棱形继承
  14. 描述堆排序
  15. 基数排序过程


二面(50min)时间太久有点忘了

自我介绍

pagerank算法

spark与hadoop对比

hadoop的特性 特性对应在hadoop里的发挥

hadoop恢复如何恢复

yarn的改进在哪里

spark的stage划分

spark相比mapreduce的优点

最小逆序对


三面(30min)

自我介绍

介绍一下mapreduce

mapreduce和spark区别

进程和线程的区别

进程通信方式

网络结构以及每层应用

打开一个网页的过程都经历了什么

栈的push和pop的时间复杂度

栈的最小值操作

期望地点是上海吗

有什么要问我的



自我感觉三面不太理想,面试官说要了解实用工具的原理以及计算机基础知识要掌握牢固。第三面计算机基础知识说的不太好,感觉凉了😔

#字节跳动##校招##数据开发工程师##面经#
全部评论
请问lz这到底是面的data还是tiktok呀?还是说tiktok是data下面的?😂 另外想问下这个国际化广告团队有关系吗
点赞 回复 分享
发布于 2020-07-15 00:07
赞赞,非常感谢~😊
点赞 回复 分享
发布于 2020-05-07 14:34
楼主你这个base哪里呀
点赞 回复 分享
发布于 2020-05-06 20:07
是算法方向还是后端啊,问了好多大数据的?
点赞 回复 分享
发布于 2020-04-14 16:44

相关推荐

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。团队介绍:AIDP(AI Data Platform)是深度参与字节跳动 AI 数据管理与模型训练流程的数据基础设施团队,提供数据采集、清洗、标注、合成、验证、管理等全流程的数据服务和全面解决方案。加入我们,你能深度参与字节 AI 核心业务近距离接触真实的大模型训练场景,解决数据处理中的实际问题和优秀团队协作,在数据与模型的交叉领域积累实战经验;在数据与模型领域实现个人价值,推动行业进步。你的工作将直接影响 AI 技术的落地效果,推动技术真正服务于用户。1、围绕Seed大模型数据全生命周期,参与/负责大模型数据管理平台的数据基建的整体架构设计与建设,包括数据接入、处理、检索、跟踪、质量评估、权限合规等基础能力;2、构建Seed大模型海量数据的资产目录、标签体系、元信息管理及血缘分析能力,提升高质量数据挖掘效率与可用性,赋能算法预训练、SFT/RLHF等核心场景;3、协同基础架构/云平台团队,搭建稳定高效的底层数据基础设施(数据湖、对象存储、向量存储、分布式计算、元数据管理系统等);4、主导技术选型与架构优化,基于Spark/Flink/Ray、湖仓一体、向量数据库等技术栈,构建高吞吐、高容错、可扩展的处理存储能力,支撑日PB级数据处理。职位要求1、2027届本科及以上学历,计算机、通信等相关专业优先;2、具备大数据开发相关技能,熟悉Java/Scala语言,包括JVM、类加载、并发等;有较好的SQL基础;3、熟悉Flink、Spark、Kafka、ClickHouse、Doris、Hudi、Icebreg、Paimon中的部分大数据引擎,掌握原理及性能调优优先;4、善于沟通,对数据敏感,责任心强、积极主动;5、每周实习4天以上,连续实习3个月以上。
点赞 评论 收藏
分享
评论
5
33
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务