240327美团数据开发一面

1. mapreduce工作流程?
2. shuffle机制?
3. mapreduce进行了几次排序?
4. 环形缓冲区的溢写机制?
5. 提到了反向?反向如何理解?
6. hadoop读取文件过程?
7. 说说数据倾斜?项目中是否遇到
8. MySQL介绍下InnoDB, MyISAM区别?
9. 介绍下事务几大特性?
10. 介绍对应隔离级别?
11. 隔离级别是否可以修改?
12. 三数之和,要求输出结果不重复
13. 窗口函数求解累积用户访问数量;顺序如何保证
14. 项目使用了flinkcdc, flume, kafka,介绍下作用?
15. 数据量是多少
16. 有无考虑单独使用MySQL来实现数据仓库HDFS这一套东西?
17. 自己承担了什么工作内容
18. 有什么样的成果
19. 你对数据开发工作的理解?
    - 部门方向:SQL指标计算,理解业务需求;参与后端看板开发
20. 简历项目内容少
21. 反问
    - 数据开发需要学的内容?主要看重实习生工作深度,框架后面可以学
    - 算法刷题很重要!软件开发,代码能力很重要
全部评论
哪个部门啊佬
点赞 回复
分享
发布于 03-28 09:24 北京
同金服 请问有二面结果了吗?
点赞 回复
分享
发布于 04-01 00:38 广东
联易融
校招火热招聘中
官网直投

相关推荐

#数据人的面试交流地##数据人##SQL面试#**均为社区同学面试遇到题目**题目:找出连续登录5天的用户图1为模拟数据图2为运行结果Hsql解法如下selectuid,curr,5_dayfrom (        select                 uid,                to_date(`login_date`) curr, --当前日期                last_value(to_date(`login_date`))                         over(partition by uid order by to_date(`login_date`) asc                                 rows BETWEEN  CURRENT ROW and 4 FOLLOWING) as 5_day, -- 当前日期后四天的日期值                DATEDIFF(                last_value(to_date(`login_date`))                         over(partition by uid order by to_date(`login_date`) asc                                 rows BETWEEN  CURRENT ROW and 4 FOLLOWING),                to_date(`login_date`)) AS DRFF_DAY -- 当前日期后四天的日期值 - --当前日期 = 最近五次登录的间隔天数,间隔4才是连续登录5天        from                  (select distinct * from tmp) t1 --一个用户一天可能登录多次,只保留一次) t1 where DRFF_DAY == 4#数据人的面试交流地#更多实战题目及解法思路都在社区!
点赞 评论 收藏
转发
第一次能连续过2面,不容易(已过二面)有些记得不是很清楚,但是大差不差1.== 与equals的区别2.提到了Integer,Integer a = 1,b = 1;a == b结果是什么?3.有用到java里的哪些集合?4.你说用到了ArrayList,哪你是用ArrayList做什么操作的?5.假如你做了一个项目很多人去访问数据,但是你的系统服务器CPU飙升,但是数据库CPU正常,这是怎么回事?怎么去解决?6.你说到HashMap了,你知道他的原理是什么吗7.哪提到了死循环了,哪你是如何判断有死循环的(力扣判断环形链表),哪你咋找到的这个环的入口的(力扣判断环形链表II)8.如果在多线程情况下无法使用HashMap,哪有什么解决方案吗9.为啥不去选择HashTable?ConcurrentHashMap你是怎么用的10.你在你的项目中是如何保证线程安全的11. 说一下对volatile的理解12.Volatile底层原理是什么13.volatile与synchronization的区别是什么?14.如果有任务来了,如果线程池核心线程数满了,任务队列满了,这个任务会有个啥结果?你说会创建空闲线程去执行,哪他一定会被空闲线程去执行吗?15.说一下线程池的拒绝策略16.有用过什么数据库吗?17.为什么去使用MySQL(答的他性能好,又各种的客户端界面,方便,成本低)18.你提到了索引,说一说索引他又有什么失效的场景?19.你是怎么排查的索引失效的?20.假如你有一张表去查询他的数据,响应的时间很长,是什么情况导致的,有什么解决方案(SQL慢查询)21.看你项目里使用的Redis,哪你是如何保证Redis和MySQL的一致性的22.很多人去访问你的项目,多到1秒10w人访问,想你项目中有用户的信息,商户的一些信息,你是如何保证他们的信息安全,怎么保证他们访问的就是自己的数据(答了保证接口安全的一些,jwt令牌,redis存储信息好像都不对ThreadLocal蹭点边让我好好思考)23.如果你有一个实体类,我对实体类有很多操作,但是大部分代码是重复的,如何在添加进数据库之前节省一点操作?(答了使用AOP但是还有一些操作)24.MybatisPlus是怎么用的(说了自己咋定义的实体类,咋使用他的一些方法)25.反问
点赞 评论 收藏
转发
6 41 评论
分享
牛客网
牛客企业服务