2022暑假实习 数据开发 字节 腾讯(已offer

看了不少面经,来回馈一下牛客。笔者双非大三软件工程专业,近俩年的大数据学习经历,三月份开始投递简历,经历了腾讯二轮技术面、字节二轮技术面,阿里测评 + 笔试 ,之后的面试拒了。面试都比较顺利全部通过,3.25拿到了字节data 大数据开发——电商 实习offer(腾讯岗位方向不符,二面挂了),拿到字节的offer之后 部门工作都很满意 就直接摆烂  没面阿里了

简单介绍一下我自己,大一进入学校的acm校队,打了一年多算法比赛,lc400题选手,大二学习重心转向大数据,到如今一年半多的时间,可能是因为我有竞赛经历,所以面试没考算法

3/10 腾讯 运营开发 一面

因为面试官和我的发展方向不是很对口 所以问的问题比较宏观 也不是特别对专业

因为投递的方向不同 介绍岗位

个人介绍

介绍一下 acm工作室里和项目的开发所担任的职责

数仓用到了什么技术 解决了什么问题 做了什么事情 ads最终展示的信息有什么

ads除了可视化展示之外 有没有做过推荐算法之类的

项目的主要难点 最大的问题

五层数据是什么?分别干了什么事

项目搭建在哪

部署的过程中有什么问题

有没有其他的项目 (面试官不是很懂这个项目)

写过最大项目的代码量(应该说这个数仓的 结果说了学校的水项目)

写代码 三个字符‘(,’)’,’*’ *代表任意字符 判断括号是否匹配

javaio了解吗? 多路复用说一下

介绍一下堆排序的思想

mysql常用的存储引擎

mysql同步原理  如何做主从和数据同步

hdfs存储原理和mr过程

计网有了解吗?说说七层架构

有了解的协议吗?(完全不了解)

python写过吗? (写过学校**签到的爬虫脚本)

反问:部门在干什么

听起来是中台  做推荐算法 做数据的运维 差不多就是写sql

3/11 字节跳动 数据平台

是个声音甜美也很温柔的小姐姐,很有亲和感 一下子就不紧张了

自我介绍 呜呜呜 她好温柔 我哭死

学了哪些大数据框架

消息队列了解除了kafka之外的框架吗(不懂)

kafka的工作原理

hdfs有几种存储类型

spark学了哪些方面(基础底层运行逻辑 以及常用算子)

sparkhive的区别

为什么sparkhive

sparkdag 如何转换stage

spark常用算子

sparkshuffle过程 (bypass记成passby了 问题不大)

sparkjob stage task excutor core memory的关系

数仓是怎么做的 实习还是校内

数仓建设需要关注哪些信息

介绍一下获奖经历 哪一方面比其他同学优秀拿了奖 在比赛过程中有什么困难吗

sql蛮简单的

求老师是李老师的所有学生的信息 学生姓名 学生总分数 学生排名 每一科的成绩 每一科的名词

学生表 sid sname 教师表 tidname 课程表 cid tid cname 分数表cid sid score

写一个类似于sql group by操作的操作 但只能用sql以外的语言

反问:部门是干什么的

给各个APP的业务做数据支撑的

3/16 字节数据平台 二面

自我介绍

简单的总结一下大数据这方面的了解

介绍项目

五层架构的作用

数据源是哪来的

用户行为数据 拿脚本生成的 逻辑

脚本一次生成多少条数据

统计的指标有哪些

sql

视频观看表 uid vid starttime endtime

用户表 uid gender

视频表 vid duration(视频时长)

1、 某一天观看不同视频个数的前五名的uid

2、 观看超过50个不同视频的女性用户 观看完整率最高的10个人

思维题:64匹马 8个赛道 赛跑时只知道马的名次 不知道马的秒数 求最少跑多少次可以找到最快的四匹马

yarn的资源调度 任务提交

yarn有几个模块 七个子模块?

flumekafka 在接受和sink方面有什么区别

个人的职业规划 个人的优势与劣势

啥时候能来

反问:在招实习生的时候更看重实习生的特点

基本功够(标准不高) 自驱力 聪明度 潜力

如果有三面的话 是hr和技术面

#字节跳动暑期实习##实习##面经##数据开发工程师##腾讯##字节跳动##大数据开发工程师#
全部评论
请问大佬简历上大数据项目都做的啥呀?
3 回复
分享
发布于 2022-04-02 18:47
老哥,请问写算法或者sql的时候是在哪里写啊,可以用ide吗
2 回复
分享
发布于 2022-04-05 12:48
联易融
校招火热招聘中
官网直投
大佬太强了,后天一面好紧张
1 回复
分享
发布于 2022-03-29 22:50
哥,你做的离线数仓是基于阿里云的那个还是?
1 回复
分享
发布于 2022-04-03 21:19
明天面字节,想请教一下,sql是怎么考啊,面试的时候用什么写sql,需要自己建表吗
1 回复
分享
发布于 2022-04-05 19:44
大佬感觉八股文没咋问😂
1 回复
分享
发布于 2022-05-09 17:38
老哥问了运营开发是干嘛的吗
2 回复
分享
发布于 2022-04-06 21:14
大佬,考sql的时候只能用sql以外的语言,你用的啥啊。还有yarn7个子模块是啥?
点赞 回复
分享
发布于 2022-04-01 11:50
楼主字节的base是哪里呢
点赞 回复
分享
发布于 2022-04-01 11:53
离线数仓项目简历咋写
点赞 回复
分享
发布于 2022-04-04 14:36
楼主能发一下字节二面sql题的参考嘛?😁
点赞 回复
分享
发布于 2022-04-17 13:07
老哥,请问,flink,hive问的多吗?
点赞 回复
分享
发布于 2022-04-26 22:11
哥 笔试都有些什么题型
点赞 回复
分享
发布于 2022-04-28 20:30
请问HR面之后多久发的offer呀
点赞 回复
分享
发布于 2022-05-07 09:42
请问大佬简历直接写的 电商离线数仓吗还是进行了包装什么的?
点赞 回复
分享
发布于 2022-06-30 12:32
可以转载到公众号么,会注明来源
点赞 回复
分享
发布于 2022-07-25 10:19
大佬 项目的难点 最大的问题是什么能说说吗
点赞 回复
分享
发布于 2022-08-06 23:36
老哥,能分享一下简历中尚硅谷电商数仓项目的内容吗 正在制作简历,想参考参考
点赞 回复
分享
发布于 2022-08-23 10:27 重庆
哥们别继续卷了,现在行情不好,学了也找不到工作,找到了过几年也裁,GPT的冲击太大了,好好享受享受大学生活吧
点赞 回复
分享
发布于 2023-04-04 11:48 辽宁

相关推荐

头像
04-16 11:12
Python
昨天面了腾讯软件工程-数开实习的三面,下面记录一下问题:1.自我介绍,有无实习经历(无),做的两个项目是自己练手的?(是)2.描述了一个场景,有一张员工表,有姓名、年龄、性别,求出所有姓张、年龄小于20的所有女性。口头作答3.刚才你说的这个sql怎么优化?(添加索引、联合索引)4.添加索引有什么副作用?(会占用空间)5.假设表的内容越来越多,比如上千万行,怎么优化表?(分区、缓存)6.怎么缓存到内存?(用redis这种内存数据库)7.内存数据库和非内存数据库的读写差异?(内存数据库读写可以在微妙完成,非内存数据库的读取速度取决于磁盘I/O性能和数据量大小)8.为什么非内存数据库就比较慢(因为存储介质比较慢)9.什么硬盘比较快?(固态硬盘)10.固态硬盘和机械硬盘读写差异有多大(由于固态硬盘使用闪存存储数据,它们具有非常快的读取速度,机械硬盘使用旋转的磁盘和读写头来存储和访问数据,比较慢)11.毫秒级别是什么场景?(操作系统的数据加载、固态硬盘的读写)12.SSD的缺点是什么?(价格贵,容易老化,数据丢失)13.为什么SSD会随着使用时间的增加而性能下降?(写入操作会导致存储单元的磨损,温度也会使性能下降)14.假设表很大,行怎么拆分?(可以考虑用时间分区)15.除了日期,还有什么可以水平拆?(地理位置、实体属性、业务流程)16.年龄性别怎么分?(年龄按年龄段分,性别按男女分)17.怎么评价划分好坏?(属性的区分度要好,分区后的数据尽量要均衡)18.有什么好的分法?19.如果从中国所有人里面搜索,怎么样可以快一点?(按省市区县分区)20.按地域划分的缺点?(分区后数据可能不均衡,比如深圳是千万级城市)21.python跟c++和java的区别是什么?22.linux查看系统资源,cpu怎么看?23.top看到的ioswap是什么原因?24.怎么解决io等待?25.磁盘上部署大量的 I/O 密集型任务,怎么均衡?26.公平调度是什么?27.有什么不公平的方法?28.爬泰山有10000级台阶,每一次只能走1,2,3步,怎么做?(用动态规划)29.这个动态规划的优点和缺点?30.这个动态规划代码的缺点怎么优化?31.自顶向下的记忆化搜索,怎么避免重复计算?32.最擅长的技术今天看到3面过啦!希望hr面顺利
点赞 评论 收藏
转发
41 197 评论
分享
牛客网
牛客企业服务