科大讯飞数据分析岗一面凉经

科大讯飞是楼主第一次正经遇到技术面试,主要问题就是对于项目和实习经历的考察,问实施细节的时候顺便插一点点八股,整体大概在30min左右,面试体验很好,可惜还是挂了。不过这次面试收获也比较大,姑且发一篇文章分享一下吧,主要面向的还是大数据相关的岗位。

下面是详细,楼主实习是跟着做了一个数据中台的项目(使用了低代码平台),项目是淘宝一个外包的数据分析项目;

一、实习方面

1.对于大数据量的数据库中的数据是如何快速进行ETL过程的?楼主这里答的是分布式并行抽取(使用的低代码平台带有的并行功能),当时比较紧张,其实增量同步也是一个显然答案;

2.对于ETL后的数据如何存储和加快读取?这里楼主只回答了使用Redis加速,没答好,因为Redis确实能存的数据量也是受硬件等等条件限制的;而且分区分表管理数据、对数据建立索引等等对HDFS文件进行的直接操作,也是显然答案。

3.对于连续/分批的其他数据来源怎么处理?这个问题纯没接触过,就是对于除开数据库,你有什么数据来源和处理方式;感觉想问的是:①用SFTP/FTP推送的报表文件的处理(用GDE的文件同步功能或Shell脚本定时去抓取) ②对于连续少量的流数据怎么处理的(用Kafka消息队列进行暂存和消费,或是建立流处理流程);实习没太接触这些,这个问题直接给我问傻了。

4.数据库类型?Oracle,顺便问了个相关八股和对于Oracle窗口函数的使用

5.你目前所做的工作?数仓建模你参与了哪部分?楼主目前的工作就是在数仓的DWD层和DWS层,根据相关的具体业务需求去映射数据,建立、测试新的业务表/宽表,为后面数据应用和功能开发做好准备;数仓建模则就是说了说ODS层、DWD层、DWM层、DWS层、ADS层之类的,答的比较笼统,这块可能会扣分。

二、项目方面:

这个淘宝项目是在校的时候线上跟的,跟的比较浅,对业务和写文档记忆多些,技术实现上有些忘了;

面试官主要根据简历来问的,大概就下面这些:

电商相关的评价指标,你当时做了什么工作、提出了什么建议,为什么用户群体划分出了高潜力用户和潜力用户?

当时使用的什么数据库?(他真的很爱这个问题,感觉想问的是HDFS相关的问题)数据怎么进行的处理?

你对于这个项目有什么未实现的改进或者有什么可以改进的地方?

(这个问题狠,我答的是RFM模型对用户群体进行分类的时候,分的有些粗糙了,对于一些中间用户不友好)

做的主要工作:①用RFM模型+k-means算法对用户群体进行分类

②漏斗模型的确立,和根据漏斗模型提出的相关建议

③A/B测试的实现细节和得到的结论

没答好的问题:你在数据库中用过json数据、处理过相关数据吗?楼主完全没给出回答,实际上json在电商中使用相当广泛,原始数据中会有很多这类的数据,这个问题拉了个大胯,因为这个项目完全没接触过相关的ETL过程,直接就着ADS层数据进行的分析。

后面就是反问环节了,问了后续答复、他们目前所做的工作、对我有什么建议 这三个问题。

顺便吐槽一下,之前面的浪潮和虾皮简直非人,这俩也是一面寄,就来走流程。

虾皮啥也不问,上来直接两道签到编程题,写完就结束;浪潮感觉像在聊天,10多分钟直接结束了。

这俩kpi面完全搞不懂,浪费双方心情和时间。

全部评论
真的很用心
2 回复 分享
发布于 昨天 17:13 湖南
加油
点赞 回复 分享
发布于 今天 00:38 湖北
面经用心详细,加油佬
点赞 回复 分享
发布于 昨天 22:35 江西
如果频繁出现一面挂的问题 得好好复盘总结一下 笔试能过简历肯定没问题
点赞 回复 分享
发布于 昨天 14:45 浙江
好详细的面经
点赞 回复 分享
发布于 昨天 11:21 四川

相关推荐

08-26 14:18
深圳大学 Java
现在深挖技术还来得及:垂直领域算大厂吧?
点赞 评论 收藏
分享
评论
2
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务