甲骨文 数据分析工程师 社招面经

一面

1.如何让一个网络爬虫速度更快、抽取更好的信息以及更好总结数据从而得到一干净的数据库?

2.如何检验一个个人支付账户都多个人使用?

3.点击流数据应该是实时处理?为什么?哪部分应该实时处理?

4.你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?

5.什么是概率合并(AKA模糊融合)?使用SQL处理还是其它语言方便?对于处理半结构化的数据你会选择使用哪种语言?

6.你是如何处理缺少数据的?你推荐使用什么样的处理技术?

二面

1.你最喜欢的编程语言是什么?为什么?

2.对于你喜欢的统计软件告诉你喜欢的与不喜欢的3个理由。

3.SAS, R, Python, Perl语言的区别是?

4.什么是大数据的诅咒?

5.你参与过数据库与数据模型的设计吗?

6.你是否参与过仪表盘的设计及指标选择?你对于商业智能和报表工具有什么想法?

7.你喜欢TD数据库的什么特征?

8.如果有几个客户查询ORACLE数据库的效率很低。为什么?你做什么可以提高速度10倍以上,同时可以更好处理大数量输出?

9.如何把非结构化的数据转换成结构化的数据?这是否真的有必要做这样的转换?把数据存成平面文本文件是否比存成关系数据库更好?

10.差不多是这样了,因为HR问的非技术的问题都很常见,就不写出来啦。





#社招##面经##数据分析工程师##甲骨文#
全部评论

相关推荐

【一面】对着项目问的比较多1. 线性回归的假设条件是什么2. 介绍lstm,transformer这些3. transformer相比于seq2seq,它的增量点在什么地方4. 因果推断和(事件发生前拟合一个模型,使用这个模型对事件发生后进行预测从而得到效应),增量在什么地方,有哪些本质上的区别(跟我的项目相关)5. 对于销量预测模型,你有什么思路;怎么进行模型选型;如果没有其他特征,只有按时间变化的销量,可以怎么预测?6. 一个人投篮的命中率是60%,是投10次至少命中7次的概率大,还是投100次至少命中70次的概率大(大数定律)7. 手撕:两个椭圆x^2+y^2/2=1,x^2/2+y^2=1,求这两个椭圆相交部分的面积(蒙特卡洛模拟,好像还可以使用极坐标直接求解,忘了)比较注重数理(可能也是因为我是数理出身)【二面】1. 50个黑球和50个白球,分别放进两个框,怎么放置,可以让一个人拿到白球的概率最大2. 一个细胞的生命有三个小时,每个小时都会分裂一次,到T时刻会有多少细胞呢?3. 希望在算法岗从事什么样子的工作4. 技术栈有哪些面试时间很短,面试官很佛系,没咋问【三面】1. 问对深度学习那块比较熟,回答时序预测,问有无读过现在的SOAT方法,回答无(没读过啥paper)2. 什么样的embedding是好的embeding,怎么评估3. 选择unieval模型是怎么做的模型选型4. 拿到一个新方向是怎么调研的,怎么去找论文的5. 介绍transformer,每个encoder的结构是什么6. 介绍self-attention7. 怎么理解q,k,v8. 可以使用同一个W_q和W_k吗9. 为什么q×k之后要scale,d 是什么10. 时空图(论文,但是别人做的这part,自己不太了解了)11. 手撕:打家劫舍(偏重对算法的理解,和项目实现上的一些细节)一二面反馈非常快,5分钟就会有下一面的反馈,三面无了,可能自己没过攒人品攒人品攒人品!许愿许愿许愿!
点赞 评论 收藏
转发
4 7 评论
分享
牛客网
牛客企业服务