数据研发-作业帮3-18处女面

讲解你都学了哪些?

巴拉巴拉写数仓,springboot 写个http接口
微服务了解吗?
--不了解
面试官说:我的理解是  巴拉巴拉虽然我也不干这个

spark和flink的区别:
spark批,flink实时,spark stream 微批

flink实时是一条一条的嘛?他会不会很慢?
  --讲了是,但是他有window 巴拉巴拉不知道讲的对不对

flume  +sqoop是干什么用的;
--flume 数据日志采集等等  sqoop不知道

你比较熟悉什么架构,
--spark,flink

讲一讲flink是怎么运行的
--想了一下不知道, 面试官讲就其实spark,flink就是在客户端怎么样和集群怎么样计算怎么样   (架构还是得更加了解)
flink env中都有什么?
--集群配置,什么名字来着、并行度  讲的不全

dophinshedule了解吗?
他的底层实现了解吗?

你这个项目是什么网上做的吗?开源的吗哪里学的?

讲一讲java基础:
微服务了解吗 ?
你知道java有哪些集合吗?
--set  --hashset
有什么区别?还有吗?
面试官讲其实hashset 就是底层是hashmap实现的  巴拉巴拉  set其实是java的一个基础类bala
什么时候用hashset 什么时候用hashmap
--hashset通常指针对于处理去重操作,hashma用于需要存储数据时,并且hashset对比list他的查找插入时间复杂度是o(1)
hashset 存放一个已有数据的时候会怎么办?
--我说不会放进去 ,面试官问只是不会放进去吗?

代码:链表反转  本来想让我写集合相关的,看我集合不熟就改这个了。
--注意面向对象的代码书写细节

反问:
你们做什么业务?
--主要就是flume-sqoop一些数据日志采集  一些简单的etl   包括dophinshedule一些流式管理;还有一些仓库维护;

对我有什么建议吗?
--实习面试侧重于一些基础一些的面试,不会问太多项目,校招侧重于具体的框架,最好能够重点了解某一个框架能够阅读源码,对于基础的语言需要重点了解不一定非得是java,但是肯定需要了解,技术栈不一定要宽,要深。
#牛客AI配图神器#
没问hive kafka这个我也不会

总结:要注重基础语言知识和深挖某一框架,加强基础语言代码了解
全部评论
sqoop类似datax,数据同步工具
点赞 回复 分享
发布于 03-21 14:41 安徽
问的很难啊
点赞 回复 分享
发布于 03-21 14:39 安徽

相关推荐

作业帮时间是随机的,今天下午测的。作业帮是10道选择题加2到算法题:选择题:考了数据结构排序二叉树,linux命令:awk '$NF' test 这里的test是一个有多行数据的文件,这命令是输出该文件末行的内容。还考了mapreduce优化数据倾斜的办法这里我好像选错了有两个选项一个是把count(distinct ) 替换为sum()group by 还有是将小文件先保存到内存中这两个好像是对的都可以优化数据倾斜此问题。还考了Flink的一些特性不过我还没学过flink,还考了kafka的高性能和低性能的一些问题,这我也是一脸懵。还考了六个盘的汉洛塔要移动几次才通过。然后是算法题,第一个是简单的二分查找,不过我只通过了94%,后面看估计是我对左右指针移动还是有点问题。第二个是leetcode32题,最长有效括号,可惜了我两个月前还写过但是还是没写对,只通过了63%。也不知道能不能过。阅文(寄了,以为是8.30考没想到是8.30结束结果只写了20分钟):这好像是前面是单选题,中间是不定项,后面是问答题单选题:考了hive内置函数,考了hive与spark的对比,hadoop节点默认备份是多少~(还考了斗破苍穹的主角是谁虽然我没看过印像中好像叫萧炎)不定项:有mysql中delete,drop和truncate这三者的区别特点(我对truncate完全没印象),还考了flink的一些知识。问答题:第一个是mapredce工作流程这个还好,第二个是如何解决spark数据倾斜的方法。这里时间不够了我一点没写,也没多少印象。这里我现在写一下加深点印象1.可以增加随机前缀或后缀:来打散数据分布,在后继计算中去除前后缀从而负载均衡2.广播小表,如果是原因是小表与大表join可以将小表广播到每个节点,避免产生数据倾斜。3.salting方法:为倾斜数据填加盐值,打散倾斜数据4.分区策略调整:通过自定义分区器或者合理选择内置分区器来均匀分布数据5.增大并行度:针对只有少量数据造成的倾斜任务,增加并行度可以更快地处理这些小任务6.数据预处理:合并一些小文件,fliter操作等第三四个就是写sql语句,第三个挺简单的就是第四题来不及看了。ok就是这些了,预祝大家都能找到自己想要的工作实现,我还是继续去沉淀去了,这一个月也不知道自己在忙些啥好像就是一直在刷算法题和sql题,八股都没怎么看,对组件的掌握还是太浅了。
查看14道真题和解析 投递阅文集团等公司6个岗位 数据人的面试交流地
点赞 评论 收藏
分享
1. 根据本科学校 先问我是哪里人2. 先跟我介绍分三个部分去聊,第一部分是目前的背景,大概是什么情况,第二部分是聊一下我的期望,对业务,对工作内容方面的期待,第三部分聊一些技术3. 本科软工,硕士电子信息,为什么选择前端这个方向4. 为什么选择程序员这个行业(答了本硕都是计算机专业,不满意继续追问,答不想考公考编,也不满意,还说还有很多可以选择的职业,还有啥职业能选?难道去干销售吗?...)5. 问学长学姐大概都从事什么方向6. 跟我说职业选择是很慎重的事情7. 对实习城市的工作地点有什么要求8. 对实习的期望9. 对团队和leader有什么期望10. 项目部署了吗11. 请求token是拿什么做的?后端是什么做的(回答了用了提供好的api接口,被调侃现在教学项目都这么成熟了)12. 除了对框架的学习,对JS和CSS有什么学习吗13. 项目中布局是用的什么(flex,relative,absolute)14. 没用过grid吗(没有)15. 用的是js还是ts16. ts学习过吗?为什么会出现ts?(说ts的优势)17. 说了类型的限制,在写代码过程中就会报类型错误,而不是在编译后才发现错误,type和interface,继续问ts不也是解析成js去运行的,提供这些特点有什么用呢18. css用过sass,sass有什么优势?(你这项目挺老的,得是五年之前的了...)19. 前端一共学了多久,是一直持续学习还是断断续续的20. 每天学习5h以上的时间大概有几个月21. web的存储大概有哪些?22. localStorage,sessionStorage的get和set,与indexDB的区别有哪些23. localStorage的读取是同步的还是异步的24. 问我哪门专业课学的比较好?(本科学的基本忘的差不多了)25. 非要让我说一门课然后针对提问(只能回答计网了)26. ip寻址 ,他在公司的网络中,与我在学校的网络中进行网络通信,如何找到对方的地址?具体步骤说一下()27. 聊个老生常谈的RPC,熟悉吗(根本没听过,硬着头皮瞎说)28. 说点我了解的(我再了解也经不住问,已经快绷不住了)29. 继续问我熟悉的,了解的比较深的(没有了解深的,总不能说我最近只看八股吧)30. 随便说了八股的几个知识点,问父子组件通信的原理(答了基于发布-订阅)31. 父子组件属性传递原理(答了单向数据流,v-bind,不对,答了响应式原理)32. 还有哪块比较了解(真的不了解)33. DOM树怎么渲染出来的(说了Render的一些线程)34. 这些线程做了什么事35. 继续问渲染是怎么渲染的(布局 分层)36. 绘制的细节知道吗(不会)37. 反问阶段,问了技术栈,部门主要做什么(技术栈很杂,部门项目方向很多)38. 被问学校就业率如何,去北上广的多一些,还是去省会城市的多一些(...根据实验室毕业去向回答了)39. 被说现在学生不如他们那一批的卷了(只想赶紧结束)最后反问阶段问了部门,面试官还说给我3-5分钟继续问,但是我真的没什么想问的了,被硬控3分钟
点赞 评论 收藏
分享
评论
2
1
分享

创作者周榜

更多
牛客网
牛客企业服务