字节数开一面

1.自我介绍
2.你学数学为什么想做数据开发?
3.介绍一下实习期间的工作?
4.实习期间团队规模?主要的业务是什么?
5.接受实习期间最有难度的项目?
6.你是怎么对接需求的?怎么做到前端的看板?
7.有没有过直接处理数据源的经历?还是所有的数据对你来说都已经落到 hive 表了
8.有考虑过数仓分层设计吗?
9.你对于业务域和公共层的划分有了解吗?
10.在实习过程中遇到数据倾斜情况吗?怎么处理?
11.数据倾斜的主要原因是什么?
12. mapreduce 了解过吗?大概介绍一下。
13. spark 有学习过吗?spark 如何划分 stage?
14. 介绍一下星型模型和雪花模型
15.实习过程中最大的收获
16.未来的职业规划
17.sql 手撕:用户互相关注
18.如何优化这个任务
全部评论

相关推荐

1.对 Hadoop 各组件之间通信所使用的 RPC协议的具体内容2.Hadoop 中读数据的完整流程(包括客户端发起请求、与 NameNode 交互、与 DataNode交互等各环节)3.在数据传输过程中,若 DataNode 突然挂掉,Hadoop 系统会如何处理(包括任务重试、数据副本恢复等机制)4.HBase 源码的核心模块、关键类及底层实现窪捞轶货嶍瑛冶辑(如数据存储、读写流程等相关源码细节)5.在 HBase 中构建二级索引时,通过何种方式或机制保证索引数据与原始数据的一致性(如事务控制、同步更新策略等6.JVM 的具体架构(包括程序计数器、方法区虚拟机栈、本地方法栈、堆等组成部分);堆内存的划分的原理及适用场景;以及平时实际工作中是否会调整GC算法调整的依据是什么7.JVM 参数中,-Xms(初始堆大小)和-Xmx(最大堆大小)仅设置其中一个,与同时设置两个且值相同的情况下,对 JVM 运行产生的具体区别8.如何通过命令或工具查看当前 Java 进程中内存各代(新生代的 Eden 区、Survivor区,老年代等)的内存占比情况9.用于查看 Java 进程中线程堆栈信息的具体命令(如 jstack 等)及使用方法10.如何查看 Java 进程中某个对象的具体大小包括对象本身及引用的对象所占用的内存),可使用的命令或工具及操作步骤11.排查堆内存泄露的方法,除了将堆内存Dump 出来用MAT(Memory AnalyzerTO01)分析之外,还有哪些更简单直接的排查方式
查看11道真题和解析
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务