杭州端点数据开发面经

杭州端点数据开发面经:
一面(大概40分钟):
感觉面试官更多的会根据你的简历来问你问题。所以先介绍一下我的简历。我的简历上大概写了自己会java、scala编程语言,熟悉大数据的技术栈,比如hive、spark、map reduce、Kafka、flink,然后两个项目,一个电商数据库一个直播推荐。
面试官首先问了java的垃圾回收机制。
介绍一下spark怎么基于内存计算的,这边说了主要了是基于rdd,然后问什么是rdd。Rdd是分布式弹性容错的数据集,又问了rdd的容错。(持久化和checkpoint)介绍DAG有向无环图。
Spark为什么比mapreduce快。
了解过cap原则吗。
数据倾斜问题,怎么解决。
为什么要用hdfs,hdfs是分布式高可靠的文件系统,那么加磁盘,用redis不也能保证,为什么用hdfs。
就着电商项目问了,电商数仓怎么分层的,各个层次之间有什么作用,为什么要分层。
了解维度建模吗。(不咋了解)
Kafka的ack机制,解决了什么问题。
应该还有,想不起来了。
面试体验:面试官很不错,有些问题没回答好,还会讲解,还推荐了一本书,比较轻松。
二面(大概30多分钟):
二面的面试官问的问题比较散乱hive的架构hive中的4个by (order by,sort by……),有什么区别
有hive调优过吗(使用hive解决数据倾斜)
Hive中的数据在哪存放,mysql的在哪存放。
Hadoop中的小文件问题,怎么解决数据倾斜问题。Spark的架构。Spark提交一个任务的具体流程。划分stage是依据什么划分的。Rdd的五个特性。Stage的数量等于什么,等于宽依赖数量+1
Spark中的并行度等于什么,等于rdd的一个分区数。
Kafka集群架构,其中一个节点挂掉怎么选主的。(zookeeper) zookeeper的选主策略了解过吗(没有)
Spark常见的算子介绍一下。(10个以上)
map 和 mapPartition的区别。
你感觉自己项目中最大的亮点是什么。(spark使用高性能序列化类库)
有自己写过hive里的utf函数吗(没有)
面试体验也不错,回答问题的时候面试官会有回馈,不会的说没事换一个。
三面(大概30分钟左右): 首先向我介绍一了一下公司具体是做什么的。
让我介绍一下电商数据仓库项目。分层之后的一个好处,对于开发者有什么好处,对于使用者有什么好处。
你为什么要使你为什么要使用flume进行数据采集。(flume功能强大,自己比较熟悉)
当数据量非常多,hdfs扛不住flume采集的压力怎么办。(使用kafka做一个削峰,自己回答的是hdfs做一个集群,就是在扩大hdfs)
维度建模
进入公司之后你怎么快速适应公司
当发现实习生做的和想象的不太一样怎么办,实习生做的偏基础。(先从基础慢慢来)
你生活中遇到的最大的困难,怎么解决他的。
最近在学什么东西,看什么书。
面试体验:面试体验不错,面试官问的比较深入,更多会问一些理解性的东西,考察你个人的一个理解深度。最后反问阶段也给了一些建议,同时还纠正了回答错误的地方。#面经##数据开发工程师##端点网络科技##社招#
全部评论
请问是实习招聘吗
点赞 回复
分享
发布于 2021-07-07 21:25
看您二面有一个UTF函数,请问是UTF函数还是UDF函数?还没接触过UTF函数
点赞 回复
分享
发布于 2021-08-12 12:25
百信银行
校招火热招聘中
官网直投

相关推荐

- 自我介绍- 讲讲你目前在蔚来测试什么产品?你在其中的工作是什么?你在工作中使用的是什么自动化测试框架?case 的通过率如何?- 你的 Python 水平如何?- 看到你之前有做过开发,现在有做测试,你今后的规划是什么?- 我们做的是偏底层网络的,对网络知识的要求可能会比较高,你这方面怎么样?- 讲讲 TCP/IP 五层模型?- 了解 ARP 吗,讲讲这个协议?- 说下你对 TCP 和 UDP 的了解和见解?TCP 遇到堵塞是如何解决的?了解过粘包吗,如何解决?- 简单说说 TCP 三次握手?了解半连接和全连接吗?- 简单说说 TCP 四次挥手?了解 TCP 连接中的一些状态吗,比如 TIME_WAIT 和 CLOSE_WAIT?- 有了解过 PING 泛洪(PING Flood)吗?如何防范?- Linux 接触的多吗?用过 Ubuntu 吗?用过哪些网络抓包工具?有没有了解 Linux 上的一些网络相关工具,例如 tcpdump?- 对虚拟化了解吗?(不太了解)当我们从虚拟机访问百度时,会经过什么样的流程?- 讲讲 TCP 报文格式?头部有多大?- 对于一个 2000 字节的 UDP 大包,MTU 为 1500 字节,IP 层会作何处理?- 了解(数据包的)分片和重组吗?如何判断数据包是否分片?- 刚才我说到了 ARP,ARP (报文)是通过什么方式进行传播的?(广播)了解广播和组播的区别吗?- DHCP 了解吗,简单讲讲?- BPS 和 PPS 了解吗?- Python 这边你之前用的都是哪些版本(他们用 2.7,太草了)- 写过 Socket 吗,用过哪些库?- 对 IPv4 和 IPv6 有什么了解吗?知道 CIDR 吗?- 有了解过最长前缀匹配吗?有没有在自己的机器上配置路由表?- NAT 了解吗?简单说一下?了解 SNAT 和 DNAT 的区别吗?- 有用过 scapy 吗?- 代码题:现有一个包含四个元素的 list,每次调用接口时都需要从 list 中随机选出一个(索引)不重复的数,应该如何设计代码?- 场景题:当你发现你上网很慢的时候,你如何进行排查?- 反问
点赞 评论 收藏
转发
投递策略与准备精准定位:研究美团的业务方向还有技术栈,个人简历尽可能往上靠,突出与美团岗位相关的项目经验和技能!提前准备:一定要提前准备问题,要事先了解公司文化还有岗位要求,这也会在面试官心里加分。实习过程中的学习与成长主动学习:不仅限于完成分配的任务,当然一般是不会让你闲着的,基本上不用担心不会,到了再学就行,因为公司也有自己的技术和工具。实战经验:实习时候会让你参与实际的项目,让你了解软件开发的整个生命周期,流程很规范,从需求评审、方案设计、自己开发、代码评审和测试上线等。团队协作:大家都很好相处的,团建很多,已经参加两次团建的我转正攻略成果展示:一般是会写个文档(我当时转正时候)或者是转正答辩,一般都会留下的,美团的留用率还是挺高的。积极反馈:建议积极跟导师沟通,这样真的会让自己成长的很快,摊上一个好导师真的是会让工作干起来没那么不舒服。职业规划与心得目标明确:根据实习经历,及时调整和明确自己的职业规划,找到最适合自己的发展路径。我身边就有实习时候干算法,秋招找测试的,工作还是要干的舒心不是。心态调整:保持乐观的心态,将遇到的困难视为成长的机会,我问了干了10个月的校招生,也表示现在还无法独立自己做需求,所以遇到难题不要emo!!!实习生活分享美团文化:可能大家都会调侃,开水团~确实,福利貌似只有开水,但是美团周边很多的,什么有奖评论,参加抽奖啦,这些非常好拿,还有就是mbp笔记本,4年🉑回购,不是你必须干四年才可以回购,是按照笔记本开封日期算起~美团在职实习生,随便问,我必答!!!附上内推码:RW4KGAP,欢迎大家来美团👏👏👏#美团校招##美团2024届秋招##美团工作体验##正在实习的碎碎念##美团##实习##浅聊一下我实习的辛苦费#
点赞 评论 收藏
转发
10 60 评论
分享
牛客网
牛客企业服务