01-15 16:01 数据分析师

关注

脉脉大数据开发实习生一面

岗位JD

使用大数据组件对海量数据进行建模，参与数据仓库的的开发、维护及优化

岗位要求

计算机相关专业，对大数据有浓烈的兴趣
扎实的计算机基础，熟练使用python/java/scala其中至少一种语言
熟悉Hadoop生态体系，包括但不限于Hadoop/Hive/Spark/Clickhouse
学习能力强，强烈的责任心，具有较强的沟通能力及团队合作精神，细致耐心、积极主动
有大规模数据/日志处理经验，熟悉离线计算者优先

一面

自我介绍
对数仓分层、维度建模有什么相关的了解。数仓分层答的不是很好磕磕绊绊得加强维度建模还行
项目是都跟着走完了还是？
维度建模分数据域和分层主题域分了哪些数据域数据是怎么流向的大概讲解下数据域(交易域流量域用户域工具域互动域)
对hive的优化有什么了解？具体的优化措施
本科和硕士都是大数据相关数仓大数据类相关的知识学过哪些
hadoop三大件有哪些
简单讲一下mapreduce怎么跑起来的 mapreduce的流程这个没讲好
简单讲一下shuffle的原理？
两道hive sql题简单题 1:排名函数 2 多行转多列
反问：我问了工作时间(早10晚7)和工作氛围(和蔼平和)怎么样？最近部分有项目在忙吗？

以后可以问面试官对我有一些什么建议吗？技术上，简历上，面试上等？

SQL题总结

第一题窗口函数

select a,second_c
from (
  select a,second_c,
  row_number() over (partition by a order by b) rank
  from t2
where rank=2
)t
group by a

问题 子查询里面的 where 不能直接用rank判断 这样会报错 where 应该写在外面 且是c列 不是second_c

第二题

select 
    year,
    concat_ws(',', collect_list(case when department = 'A' then person_count else null end))  col_A,
    concat_ws(',', collect_list(case when department = 'B' then person_count else null end))  col_B
from t
group by year;

全部评论

推荐最新楼层

网易_数据开发工程师

还好，问的不是很深

1

送花回复

发布于 01-31 21:51 上海

河南牧业经济学院计算机类

大佬

点赞

送花回复

发布于 01-15 16:28 河南

滴滴

校招火热招聘中

官网直投

中国地质大学（北京）计算机类

我们组刚走一个就招人了😅

点赞

送花回复

发布于 01-15 21:21 北京

05-04 21:49

淘天集团_数据科学

联易融二面

公司：联易融岗位：数据分析师工作职责1、负责研发面向供应链金融场景的核心算法模型，如风险预测，潜客挖掘，关联图谱等；2、与团队成员一起负责以上能力的产品化工作；3、参与以上能力的应用落地工作。工作要求1、硕士或以上学历，统计学、计算机、数学、经济学、计量心理学、人工智能等相关专业；2、熟练掌握Hive\SQL\Hadoop，熟练使用JAVA/R/SAS/Python等编程语言，熟悉大规模数据挖掘、机器学习、自然语言处理(NLP)；3、可独立完成数据挖掘工作，包括数据预处理、特征选取、建模、验证、调优、结论陈述等各环节；4、对数据敏感，具备良好的逻辑思维能力、沟通技巧、组织沟通能力、团队精神以及...

软件开发2024笔面经

点赞评论收藏

转发

聪明勇敢有力气y

04-19 08:08

已编辑

第一拖拉机制造厂拖拉机学院

美团数据开发转正实习面经总结:美团效率，完全没准备好就面试了。问了很多八股，兼具深度广度，知道的不知道全问了。学习之路道阻且长啊。数仓分层：为什么不能直接建DWD,DIM层，ODS层的必要性是什么？DWS层的作用是什么，为什么不能直接建ADS层？完全同上乱答SQL考查:统计每个科目各等级的人数，写的很艰辛，面试的时候脑子经常短路，干着急。菜就多练分组topN，窗口函数。left join where中的条件写在where里和写在on里面有什么区别，查询结果一样吗？Java考查:HashMap底层组成，怎么减少扩容次数，答扩大初始容量，增加扩容因子。说说面向对象。了解的数据类型。Hive：什么情况会导致倾斜，怎么解决。写了一个HQL语句，问从提交到MR的整个详细执行过程，答的很粗略。hive 怎么根据表名去找表数据，metastore。MySQL 常见内存引擎，什么时候适合用哪种引擎。事务隔离级别。银行应该用哪种隔离级别。为什么用B+树，而不是B树或者其他。行列存储优缺点。常见的压缩格式。MR:切片规则，100个文件前面99个小文件，最后一个文件150M，默认切几片。顺势问到小文件的危害，怎么解决。分区器问题，疯狂拷打，但没什么印象了环形缓冲区调大调小有什么问题，纯乱答。写个快排，没注意有重复元素，好像陷入死循环了。问了为什么选择走数据开发这条路，有看过什么大数据类型的书吗。最后问你的亮点是什么，一直都不知道这些问题怎么答然后详细描述。其他的想不起来了。

点赞评论收藏

转发

04-23 16:56

已编辑

门头沟学院畜牧学

百度java后端实习一面 4.23

百度地图组 50min 无算法1.自我介绍2.项目拷打3.项目-项目上线or还是预研4.项目-项目怎么迭代，你是下发任务的，还是合作任务的5.项目-怎么合作任务（主要问接口文档怎么写的）6.项目-spark是什么写的，为什么不用scala7.用过spark什么算子你感觉特别惊艳，其算子源码是怎么写的8.问了一个奇奇怪怪的算子，可能是我没用过，也可能是没听懂他发音（x）9.在一个大型项目中，有很多spark任务，你会让spark任务怎么进行管理，你怎么知道任务执行到什么程度，你怎么控制任务的提交和撤销10.项目-讲讲redis，为什么项目里在持久层和用户间引入一层缓存11.项目-nacos干啥用...

点赞评论收藏

转发

DataPulse_辉常努腻

04-24 19:17

上海交通大学计算机类

百度面试2024数据开发岗位

#软件开发2024笔面经# 百度面试2024数据开发岗位1.结合以往经历，谈谈项目管理哪些过程域，你认为更重要？原因是啥？你的弱势点有哪些？2.讲一个项目，完整介绍下项目，你的职责，具体咋做的，成效业绩。3.总结讲一下你主导过的数据分析应用类项目中痛难点有哪些？怎么解决的？4.横向讲一下几个etl工具的优缺点？cdm,kettle,infa5.数据共享服务怎么做的？过程中如何做到的安全合规？6.数据要素相关工作做过哪些？有过哪些接触？7.招投标工作，文档材料编写汇报，做过哪些？ #offer#  #大数据#   

软件开发2024笔面经

点赞评论收藏

转发

要学会找工作

04-26 18:30

门头沟学院计算机类

【Vivo】深度学习算法工程师（AI方向）

Vivo 泡池子泡死了，大部分同学都在2024-04-03~2024-04-08左右（清明节前后）开了。 2024-04-19收到感谢信。 投递2024-02-27 深度学习算法工程师（AI方向） （线下）一面2024-03-26 30多分钟。基本围绕项目，无八股。把自己项目准备好，感觉还行 自我介绍 介绍项目一与项目三，以及一些衍生问题。 spark单个计算节点计算量很大怎么办？（数据倾斜。。。没考虑过；面试官让随便说一下） 你觉得Transformer为什么能够在nlp一统天下？ 你觉Transformer相对于其他模型最大的优势是什么？ 专硕三年？专硕和学硕的区别？ 实习？ Jav...

点赞评论收藏

转发

4 35 评论

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

733147次浏览 11758人参与

# 非技术岗是怎么找实习的 #

74912次浏览 1401人参与

# 海康威视求职进展汇总 #

91809次浏览 1094人参与

# 浅聊一下我实习的辛苦费 #

81713次浏览 765人参与

# 如何写一份好简历 #

263564次浏览 3969人参与

# 硬件人求职现状 #

185416次浏览 2710人参与

# 通信硬件人笔面经互助 #

112329次浏览 2263人参与

# 面试等了一周没回复，还有戏吗 #

40678次浏览 501人参与

# 机械制造面试记录 #

37695次浏览 505人参与

# 24届营销人拿到了几个offer #

4254次浏览 62人参与

# 铜五铁六真的存在吗？ #

28405次浏览 298人参与

# 实习生应该准时下班吗 #

77007次浏览 571人参与

# 打工人的辛酸 #

8650次浏览 134人参与

# 运营人的第一份offer应该如何选 #

35367次浏览 643人参与

# 美的求职进展汇总 #

39099次浏览 419人参与

# 如何看待offer收割机的行为 #

224423次浏览 3256人参与

# 产品实习，你更倾向大公司or小公司 #

36572次浏览 562人参与

# 数据人offer决赛圈怎么选 #

44887次浏览 728人参与

# 实习与准备秋招该如何平衡 #

172291次浏览 3115人参与

# 通信硬件薪资爆料 #

201476次浏览 1825人参与

牛客网
牛客企业服务