首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
语兴
网易_数据开发工程师
获赞
340
粉丝
538
关注
2
看过 TA
3380
男
中国海洋大学
2019
大数据开发工程师
IP属地:上海
前阿里数仓,现网易数仓,相关课程在b站搜索语兴呀
私信
关注
拉黑
举报
举报
确定要拉黑语兴吗?
发布(77)
评论
刷题
收藏
语兴
关注TA,不错过内容更新
关注
昨天 16:17
网易_数据开发工程师
SparkSQL AQE 八股文
AQE(Adaptive Query Execution,自适应查询执行) 是 sparksql 的一种动态优化机制,当开启 aqe 后,每当 shuffle map 阶段执行完毕,aqe 都会结合这个阶段 shuffle map 输出的中间文件的统计信息,基于既定的规则动态调整逻辑和物理执行计划,来完成运行时的优化* shuffle map / reduce 阶段 同 shuffle write / readaqe 默认是关闭(从 spark 3.2 开始默认开启),通过下面这个参数开启 # 开启 AQE set spark.sql.adaptive.enabled = true; AQE既...
数据人offer决赛圈怎...
0
点赞
评论
收藏
分享
11-15 16:20
网易_数据开发工程师
26 27校招谈薪
前言应校招同学要求这周我们临时加一节课来谈论数据开发谈薪问题,尽可能避坑,要到理想薪资目前语兴只列举了7个问题,如果有其他问题往下补就行了谈薪资问题1-我手里只有一个offer该怎么谈?如果你当前手里只有一个offer了,其他家都还没任何消息,同时这家公司面的一般,建议谈薪时表忠诚拿白菜最高档or小sp,先保住offer,但需要提前了解下该公司往年情况,最多要到小sp,别给谈没了,如果面评很好,包括面试官评价画饼,能拿到sp以上去争取大sp以下是薪资范围介绍,只能是一个大概的范围,比如阿里快手等介于2-3档之间浮动在2k公司白菜spssp小米+其他中小厂18-2021-23+期权/签字费25附...
不想努力的牛牛_:
兴哥发的从来都是干货😍
26届校招投递进展
0
点赞
评论
收藏
分享
11-08 01:15
网易_数据开发工程师
调度配置的使用(以阿里云Datawroks/Easy Data为例)
1.背景最近算法团队反馈历史离线推送算法平台任务长期未启动,最早可追溯在3个月前,经排查为上游非高优任务运行失败且没人处理,任务为自依赖导致(上游任务失败后导致后续推数任务都未执行)。所以语兴也想借此课一起聊聊离线任务调度配置,以及每个配置选项用途,该如何配置是正确的,科普项。2.调度配置板块调度板块通常在离线任务附近,用于离线任务调度运维配置,例如定时、参数、依赖、重跑等。3.参数板块Dataworks/Easy data参数用于日期信息传递,例如30min、1h、前7日等等,只可用于日期信息传递,不能和代码一样进行传参配置(如需设计到传参可通过python3进行传递),大家可根据任务周期进...
牛客在线求职答疑中心
0
点赞
评论
收藏
分享
10-25 00:15
网易_数据开发工程师
大模型与数据开发如何结合
1. 前言大多数公司都在做大模型应用+大模型工具去提升自己业务效率(可能也是因为大老板想做出一些价值,因此在各业务投入agent去使用),我们这期讲一下大模型与数据开发如何去结合去落地,大模型和数据开发是如何相辅相成,以及解释为什么到今天语兴也觉得数据最为重要的原因,感兴趣同学想了解更多细节可以加下星球,星球有5套不同业务的大模型项目,并提供完整代码、业务逻辑、产品方案、简历模板,皆可用于面试。2. 工作流agent解释:ai agent也叫人工智能代理,是一种能够感知环境、进行决策和执行动作的智能实体。智能体像人一样,它有记忆、有逻辑分析能力、有任务拆解能力、问题的拆解能力和最后综合回来统一...
数据人offer决赛圈怎...
0
点赞
评论
收藏
分享
10-19 23:57
网易_数据开发工程师
从面试官视角盘点完整的数开面试问题
刚才与群友沟通,盘点了一下完整的数开面试会问哪些方向问题,方便大家对自己项目、面试过程中方向把握,从而可以进行针对性提前复习,下方面试范围涵盖了所有数开面试问题方向,前提面试官是一个正常面试官 候选人自我介绍 1.项目(25分钟) 1.1 合作模式:上游下游合作模式,指标谁负责,开发时间不足如何协调,开发优先级 1.2 模型建设:数仓分层,表设计,举例指标(说下比较复杂的指标,说下来自什么表,数据量),最佳使用的模型设计,给你一个场景重新设计模型,增全量设计,ads用户标签画像宽表窄表设计,数据集市建设 1.3 数据质量:交付前如何保障数据质量,线上数据质量dqc,长期跟踪监测源头数据 ...
查看13道真题和解析
0
点赞
评论
收藏
分享
10-17 21:49
网易_数据开发工程师
分析报告的表达逻辑
初衷:为什么想要这么做作为一名数开兼岗数分,经常需要拿着自己的分析报告、总结去跟业务/TL 其他人分享, 或多或少经历过以下场景、存在过实实在在的困惑:辛辛苦苦加班清洗出近 12 个月内不同类型用户在各个链路环节下分5 个维度的数据表现,认认真真进行横向维度对比、纵向时间趋势分析,兢兢业业整理出数据图表一顿可视化操作,最终输出一份内容详尽、目录结构层次分明的分析报告。当你一腔热血地去跟业务打开文档、分享结论时,结果业务却打断你说:你这有xxx的表现吗?(你回复:有啊,在后面)那能不能先跳到那里,我想看看那个数据!于是整个分享在文档不同部位间反复横跳,你会不会觉得很累、且有种被带着走的不适感。或...
数据人的面试交流地
0
点赞
评论
收藏
分享
10-08 21:39
网易_数据开发工程师
26 27届数据类实习/校招出现的乱象
前言当前26届秋招已过了一半,盘点一下带过百位26届实习/校招出现过的一些情况,也能给27届或还在26届找工作的同学起到一些帮助。现象1-各公司越来越卷学历卷学历现象从最近2年来看都是普遍现象,数据开发侧可能还好,基本双非本硕以上同学都能有面试机会,但26届对于双非本科同学就没有那么友好了,需要多段大厂实习进行支撑(建议提前准备考研、或提前准备实习),即使双非本硕作为门槛,仍然有大量985、211同学在竞争,对于数分侧来说更不友好,985硕属于标配,还需要加之前大厂经历才能有面试机会,可能数开侧同学在28届29届学历要求标准还会继续有所变动,相对来说更卷一些。同时对于一些学历厂例如阿里云等更看...
语兴:
当前陷入恶性循环,很多大佬一人手里很多offer,但今年很多公司还没开奖,导致大佬们没办法释放offer,但面试官都认为大佬会选择,因此后面人流程都被卡住,很多同学到现在还在笔试 一面环节不动了,如果实在没机会,语兴建议再去投投实习等转正或等明年春招再看看,不过这次秋招时间会更久
如何一边实习一边秋招
0
点赞
评论
收藏
分享
09-20 15:29
网易_数据开发工程师
数据类sql面试题
需求背景: 筛选出异常售后订单, 用于给商家做预警, 最后要的是订单id+异常类型, 如果一个订单命中多个异常类型, 给多条数据 订单异常类型1: 同一个用户id+同一个退货快递单id下, 去重订单id数>=2, 且要求这些订单的店铺id不相同才计数 订单异常类型2: 同一个用户id+同一个退货快递单id下, 去重订单id数>=2, 且要求这些订单的商品id不相同才计数 售后表dwd_afs_df, 字段如下 afs_time(申请售后时间) afs_id(售后id) order_id(订单id) mall_id(店铺id) uid(用户id) return_id(退货快递单id)...
数据人offer决赛圈怎...
0
点赞
评论
收藏
分享
08-23 12:57
已编辑
网易_数据开发工程师
海量数据分流策略
面对万亿规模数据增量,纯数据拖拽构建链路消费会消耗大量的资源和成本;有必要对海量采集的数据按着业务的情况进行分别管理和组织,期待达到业务层面的解耦。通过分治思想在数据采集和业务消费层面做数据的合理切分,一方面能给下游不同优先级的业务消费带来优化加速的空间,同时也能够在整个数据链路侧对数据的产出和不同重要程度的业务做链路剥离, 从而满足不同场景下的业务诉求。1.数据分流的目的 首先,分流的目的很明确,就是一份数据很大的流需要分离成不同的流来并行处理,从而达到加速和链路产出时间上的提升。例如在流量业务中,往往采集的时候所有的数据是放在一起的,下游使用访问、点击的数据都需要等待前置所有的采集数据到齐...
数据人offer决赛圈怎...
0
点赞
评论
收藏
分享
08-08 01:03
网易_数据开发工程师
数据分析指标篇(2) -指标解读
前言指标的解读,包括日常看数,目标的达成情况监控,异常问题定位等等。指标对业务的执行进行好坏衡量或是建议指导,最关键就是指标的解读。指标的解读,并不等同于汇报指标的值+同比环比,更多的是需要反馈指标背后的业务问题或者流程问题,对于业务操作能有问题的发现和解决问题的建议。指标解读基础指标解读,大家第一感觉就是对于指标的数据进行波动汇报,认为不需要训练能直接上手,并且在短期之内还感觉解读的不错。但是长远下来会进入到一些误区当中,这里列举三种误区。第一种是会发现自己解读的数据,跟让听众自己去看数据效果差不多,解读的内容带不来听众任何惊喜感。其本质原因是,解读的方式,是“观察式解读”,缺少对于指标背后...
数据人的面试交流地
0
点赞
评论
收藏
分享
07-30 00:41
网易_数据开发工程师
数据指标篇(1)-指标设计
前言数据指标,并不是数据同学和业务同学的专属模块。日常会用到数据指标的,还包括开发(比如机器资源利用率,选仓选配计算平均时长等),产品(自动罚款功能使用率,自动调拨推荐转换率等),以及测试,设计等等。精准的指标,能提供好的方向,明确目标,更好的指导工作。优秀指标解读思维,能让自己辨识重要度,抓住问题关键。以及系统的指标体系,能够全面完整的覆盖关注范围,以及精准快捷的定位问题。指标篇会分为三篇:指标设计、指标解读、指标体系建设,进行介绍和案例分析,帮助大家在这几个方面有更加深入的了解和提升。指标设计基础指标的设计链路,可以从目的→设计→公式→口径&范围,每一步都需要跟使用场景强绑定。所以...
数据人的面试交流地
0
点赞
评论
收藏
分享
07-25 23:31
网易_数据开发工程师
宽表定义及使用
兴哥,咨询两个问题 1.你认为数仓中什么样的表算的上宽表,你对宽表的定义是什么? 2.宽表是怎么设计能让下游易用?问题1宽表定义: 宽表核心在于可复用、一次性解决查询的难题,宽表分三种dwm明细宽表,dws指标宽表,ads标签宽表 Dwm 明细宽表在于一次性解决查询问题,适用于场景包括业务方取数查询,数仓侧报表等展示,明细宽表将多个dwd 组合而成,并下沉维度,保障了后续查询时只需要查询这一张表即可(摆脱了每次查询都要关联维度表和其他dwd表),同时计算指标时也可以进行依赖。 Dws指标宽表在于复用,例如开发好交易场景的用户颗粒度的指标表,后续你每次开发指标时候都可以直接left join使用...
数据人offer决赛圈怎...
0
点赞
评论
收藏
分享
07-25 23:28
网易_数据开发工程师
大表关联大表倾斜(100亿 join 50亿)
昨晚有同学提到面试中问大表关联怎么调优(100亿 join 50亿,无聚合函数) 前置判断:需要判断两张表关联键是否是1对多、1对1,如果a、b表是多对多还是会倾斜 分析误区:加盐/打散,题目中只是提到将两张表进行关联,因此这里无论是加随机数还是、取模都是无效的(因为关联不到一起) 分析思路: (1)map端减少输入:通过on中过滤及谓词下推可限制关联表数据,例如过滤时间、过滤枚举、限制分区 (2)大key拆解:可以写sql by维度找到热点key分布,可以按照维度(例如一级类目、场景,但要保障相同)进行拆表,分批插入目标表(目标表也可以根据大维度去做二级分区,或者先做一个临时表也行) (3)...
数据人offer决赛圈怎...
0
点赞
评论
收藏
分享
07-15 00:06
网易_数据开发工程师
数据侧新人如何landing
前言最近也是过了招聘时间,相信很多同学都已找到了满意的工作java,结合当前情况,这里给大家提供一些试用期landing建议,帮助大家顺利通过试用期。新人挑战刚入职的新人,对于新业务理解及技术框架变更(例如hdp到数据平台、hdp到湖仓)都有挑战,这些其实也都不算什么,更大挑战而是接受一堆看不懂的历史项目及几十上百的“老”任务,同时需要快速熟悉这些老业务,并在新业务场景做出价值。另一种挑战则是上手变慢做不出业务价值,更多干历史dirty work去排查bug、帮业务取数等,最后发现啥也做了但啥也没做,导致试用期没啥量点从而不一定通过。价值评估之前也有同学问语兴为什么这么看重试用期产出价值,产出...
简历中的项目经历要怎么写
0
点赞
评论
收藏
分享
06-29 13:39
已编辑
网易_数据开发工程师
数据域与主题域区别(感觉大家对这块还是不清楚)
为什么要给数据分域 方便整体数据管理、查找、使用、使得业务环节模块独立化,既方便了数据仓库/数据分析同学划分自己负责的域,也让下游业务侧使用更清晰。 数据域 从数据视角自下而上搭建,对每个业务环节进行切割划分,形成不同环节的数据集,组装为完整的业务流程,例如常见的下单、支付、退款等环节。 举个例子🌰,小红书中用户从注册账号到发布动态、私信、评论、交互(点赞、收藏)、商品、直播等全生命周期中的每一个环节都可以定义为数据域。 主题域 从业务视角自上而下分析,从整体业务环节中升华出来大的专项分析模块,结合对接的业务范围和行业形态从更高的视角去洞察整个业务流程。 举个例子🌰,在小红...
数据人的面试交流地
0
点赞
评论
收藏
分享
1
2
3
4
5
6
创作者周榜
更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务