嘉云数据二面面经

1、介绍项目
2、和算法同学配合的时候,他们用的什么算法对数据特征分析然后去训练?我说知道是din。可以简单介绍一下din算法吗?我:(内心OS:???我好像不是算法岗)
3、离线批处理做数据解析的时候,比如A表解析过A1字段,B1字段,B表解析过c1字段,d1字段,现在让你解析新的字段,有没有动态实现的方案可以不修改原先的代码完成功能的实现?
4、接触过哪方面的业务呢?答特征工程。特征工程中有没有接触哪些方面,有没有接触过数据预处理及平滑算法?我。。。解析清洗过哪些字段呢?语义标签、标题、权重、关键词。。。。他们是怎么统计的?我:(内心OS:???我没面算法岗呀,难道要回去补课了?)
5、ctr了解过吗?暂时没有。。
6、spark使用过哪些算子,数据倾斜的时候怎么办,采样分析的时候,你的数据规模有多大?
7、sparkstreaming和flink的区别?flink的时间窗口中,简介下会话窗口。水印有哪几种?在工程中怎么使用的?flink怎么避免数据乱序?flink的checkpoint机制?
8、你的优缺点?
大概率不过,我自己觉得很多东西在问算法相关的,也许是公司要求比较高吧,当作年前找工作踩坑了。。
#嘉云数据##大数据开发工程师##面经##社招#
全部评论
最难受的一次面试,我真的没有面算法工程师,也没在简历里写特征工程和din算法相关。。。蓝瘦
点赞 回复
分享
发布于 2020-01-16 22:40

相关推荐

头像
04-07 00:10
点赞 评论 收藏
转发
2 13 评论
分享
牛客网
牛客企业服务