首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
课程
专栏·文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
kathyr_
网易_数据开发(实习员工)
获赞
382
粉丝
70
关注
22
看过 TA
1473
男
安徽理工大学
2025
大数据开发工程师
IP属地:安徽
暂未填写个人简介
私信
关注
拉黑
举报
举报
确定要拉黑kathyr_吗?
发布(26)
刷题
kathyr_
05-08 17:02
已编辑
网易_数据开发(实习员工)
拿下小米暑期
4.24投递 4.29一面 4.30二面 5.6oc 5.8offer去给雷神打个工
小米二面144人在聊
0
点赞
评论
收藏
转发
kathyr_
04-27 16:32
网易_数据开发(实习员工)
好未来 数据仓库开发实习
一面项目深挖数仓分几层,每一层的作用事实表如何设计维度表如何设计数据域如何划分业务总线矩阵的概念如何设计完整的指标开发中和上线后数据质量如何保证如何设计调度,依据是什么hive数据倾斜解决办法hivesql常见优化手段什么是spark宽窄依赖,起到什么作用sql题:用户连续登录游戏的最大天数,允许间隔一天反问做什么业务 教培业务中的线下面授分析网络问题迟到了一会,面试官很不爽,没想到秒约二面二面感觉两面问的都很相似项目深挖维度建模理论介绍范式建模和维度建模的特点和区别为什么数仓不用范式建模缓慢变化维的解决办法数据质量的几个性质,分别如何保障hive表三种格式text,orc,parquet的区别hive数据倾斜解决办法如果参数调优无法解决倾斜,还有别的办法吗sql题,又是连续登录,这回要求至少2种不同的解法反问 数据来源有哪些 有没有转正机会流程很快,oc#面经##好未来#
查看13道真题和解析
0
点赞
评论
收藏
转发
kathyr_
04-25 09:04
已编辑
网易_数据开发(实习员工)
现在投暑期还来的及吗
今天看了下暑期的情况,好像很多公司最后一批笔试都结束了,投了之后没笔试是不是就一定没法进面啊,还有很多是不是已经没hc了,投了个快手被秒挂
投递快手等公司10个岗位
0
点赞
评论
收藏
转发
kathyr_
03-23 12:12
网易_数据开发(实习员工)
快手 数据研发实习
一面数据同步怎么做的事实表、维度表怎么设计数据完整性、唯一性怎么保证数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决数仓如何进行组件选型,理由数仓建设过程中有哪些难点atlas如何获取数据血缘拉链表怎么设计你觉得拉链表常用吗,为什么不用那你为什么要设计拉链表sql题 分组topnrow_number rank dense_rank区别看两个sql,差异在哪,哪个好,为什么高耗时任务优化思路尽可能优化后数据还是倾斜怎么办mapreduce原理mapreduce几次排序,为什么要排序#面经##快手#太菜了,估计又凉了
0
点赞
评论
收藏
转发
kathyr_
03-13 11:38
网易_数据开发(实习员工)
百度 大数据研发实习
一面实习深挖对于高耗时任务的代码优化思路如何发现不必要的扫表sparksql和hivesql有什么区别sparksql和hive on spark性能有差异吗,差异在哪hdfs架构datanode心跳机制datanode挂了之后会怎么样,容错机制是怎么样机架感知有限内存下的一亿数据怎么排序了解哪些shell命令有a,b两个文件,存的都是id,写shell找出a中有但b中没有的id行flink窗口计算相关java反射是什么,作用场景,反射性能数据质量是怎么保证的,完整性唯一性具体怎么实现的反问 业务和工作内容 主要做离线还是实时#面经##百度#
0
点赞
评论
收藏
转发
kathyr_
03-01 13:17
已编辑
网易_数据开发(实习员工)
大疆 数据工程实习
一面实习介绍设计过哪些数据指标,这些指标的意义项目介绍具体分层怎么做的表怎么设计的对数仓和数据湖的理解连续登录3天的用户问的太少了,估计没想招我#面经##大疆#
0
点赞
评论
收藏
转发
kathyr_
03-01 13:13
网易_数据开发(实习员工)
滴滴 数据开发实习
一面聊实习数仓怎么分层为什么要分层sql 连续登录天数最多的用户窗口和聚合函数的区别mr和spark对比还有些问题不记得了应该寄了,莫名紧张,发挥太差了#面经##滴滴#
0
点赞
评论
收藏
转发
kathyr_
02-26 16:10
已编辑
网易_数据开发(实习员工)
鸿程系统 数据开发实习
一面聊项目2道sql lead/lag函数 likepandas基础数据倾斜问题二面聊项目表连接方式数仓各层作用数仓建模类型有哪些维度模型有哪几种sql执行计划mr过程数学建模怎么分工为什么不读研数据中台产品了解哪些已oc#面经#
0
点赞
评论
收藏
转发
kathyr_
02-23 21:57
网易_数据开发(实习员工)
网易云音乐 数据开发实习
一面实习介绍mr过程mr和spark的区别spark shuffle举例说明事实表和维度表的设计拉链表设计3道sql题row_number rank dense_rank区别二面实习介绍怎么设计数据指标集群故障怎么排查解决的自动化运维脚本怎么写的实习的收获项目介绍讲一张你最熟悉的维度表,怎么设计的,说说都有哪些字段拉链表优缺点你觉得实际拉链表用的多吗用的不多为什么要做拉链表在校最有收获的一件事你经历过什么挫折如何化挫折为动力反问 olap技术推荐学哪个 对实习生的培养#网易##面经#
0
点赞
评论
收藏
转发
kathyr_
02-23 21:55
网易_数据开发(实习员工)
杭州公交云 数据开发实习
一面项目深挖数据采集怎么做的kafka如何保证数据不丢失kafka数据重复消费怎么办数据质量怎么保证怎么识别处理低价值表atlas是如何获取数据血缘的flink时间语义flink水位线arraylist和linkedlist的实现和区别hashset和treeset区别进程和线程的区别数仓怎么分层事实表,维度表怎么做数学建模做什么怎么分工蚁群算法原理已oc#面经#
0
点赞
评论
收藏
转发
kathyr_
01-16 12:39
网易_数据开发(实习员工)
题解 | #牛客直播各科目同时在线人数#
明确题意:请你统计每个科目最大同时在线人数问题分解:计算在线人数变动情况:select course_id,in_datetime dt,1 uv from attend_tb union all select course_id,out_datetime dt,-1 uv from attend_tb关联课程表和上课情况表:join course_tb ct on t1.course_id = ct.course_id计算同时在线人数:sum(uv) over(partition by course_id order by dt,uv desc)按科目分组:group by course_i...
0
点赞
评论
收藏
转发
kathyr_
01-16 12:22
网易_数据开发(实习员工)
题解 | #牛客直播各科目出勤率#
明确题意:请你统计每个科目的出勤率(attend_rate(%)),出勤率=出勤(在线时长10分钟及以上)人数 / 报名人数问题分解:关联上课情况表和用户行为表:left join attend_tb at on bt.user_id = at.user_id and bt.course_id = at.course_id按用户,科目分组:group by bt.user_id,bt.course_id,if_sign计算用户每个科目在线时长:sum(timestampdiff(minute, in_datetime, out_datetime))关联课程表和用户报名与在线时长情况表:join...
0
点赞
评论
收藏
转发
kathyr_
01-10 19:55
网易_数据开发(实习员工)
题解 | #各城市最大同时等车人数#
明确题意:请统计各个城市在2021年10月期间,单日中最大的同时等车人数问题分解:计算等车人数变动情况:增加(select city,event_time uv_time,1 wait_uv from tb_get_car_record) union all减少(select city,coalesce(start_time,finish_time,end_time) uv_time,-1 wait_uv from tb_get_car_record tgcr join tb_get_car_order tgco on tgcr.order_id = tgco.order_id)筛选2021年...
0
点赞
评论
收藏
转发
kathyr_
01-10 16:11
网易_数据开发(实习员工)
题解 | #工作日各时段叫车量、等待接单时间和调度时间#
明确题意:统计周一到周五各时段的叫车量、平均等待接单时间和平均调度时间问题分解:关联用户打车记录表和打车订单表:join tb_get_car_order tgco on tgcr.order_id = tgco.order_id筛选周一到周五的订单记录:where dayofweek(event_time) between 2 and 6计算每个订单所属时段:case when hour(event_time) between 7 and 8 then '早高峰' when hour(event_time) between 9 and 16 then '工作时间' when hour(eve...
0
点赞
评论
收藏
转发
kathyr_
2023-12-20 23:12
网易_数据开发(实习员工)
题解 | #店铺901国庆期间的7日动销率和滞销率#
明确题意:请计算店铺901在2021年国庆头3天的7日动销率和滞销率问题分解:关联商品信息表和订单总表:from tb_product_info, tb_order_overall筛选店铺901在2021年国庆头3天的记录:where (date(event_time) between '2021-10-01' and '2021-10-03') and shop_id = 901按dt分组:group by dt1计算已上架总商品数:count(distinct case when event_time >= release_time then product_id end)关联订单总...
0
点赞
评论
收藏
转发
1
2
工具箱
TA的圈子
暂未加入圈子
TA的圈子
TA的笔记
暂无笔记
TA的笔记
登录
0
天
已登录
0
天
连续登录
0
人
今日访客
牛客网
牛客企业服务