富途大数据应用面经

来offer!来offer!来offer!

网上富途的大数据应用工程师的面经比较少,唯一找到的一篇问的还不是大数据方向的,所以来补充一篇,也赞赞人品。

笔试:
笔试的选择题都是数据分析甚至算法工程师方向的,比如会问你过拟合怎么处理、KNN算法等,当时做的时候也很懵,我投的不是大数据方向的吗,怎么问的都是机器学习的,幸好还是通过了笔试。
编程题难度还行,题目忘记了。

一面:30min左右
自我介绍
Java反射的作用
线程和进程的区别
NIO和BIO
MySQL常用的存储引擎及其区别
Linux中查看当前文件夹下所有文件和文件夹的大小的命令
Linux中查看占用某个端口的进程:回答了netstat和lsof。
netstat和lsof的区别
HDFS读写流程
Kafka高可用的实现
Kafka集群为什么挂掉一个broker后还能工作
Hive内部表和外部表
HBase rowkey的设计原则
如何查询散列后的rowkey
Flume分为哪几块
Channel的类型
Impala的作用
Impala和Hive各自的优缺点
介绍自己的项目
Flume传输数据的时候如何保证数据一致性
HDFS上小文件过多的原因和解决方法
Hive的UDF函数开发流程
Hive为什么要用Tez框架
编程题:股票的最大利润,详见:https://leetcode-cn.com/problems/gu-piao-de-zui-da-li-run-lcof/
反问

二面:20min左右
(只记得下面几个问题)
平常遇到的问题,怎么解决
HDFS集群的一些问题,比如能容忍几台DataNode挂掉,感觉这个问题似乎不像Zookeeper那样有一个标准答案
接着又问如果一天挂掉一台DataNode会怎么样
一百亿条数据(不确定是不是这个数,反正就是很大的数据量)怎么排序,不要用Hive和MapReduce
Java的内存泄漏
MySQL读取很大很大的数据集,一边select一边写入,结果如何

二面记得的比较少,大概就是这些。
许愿HR面,许愿HR面,许愿HR面
#面经##富途##大数据开发工程师#
全部评论
楼主最后offer了吗?
点赞 回复 分享
发布于 2021-09-07 09:34
我跟你一面估计是同一个面试官,问的都差不都
点赞 回复 分享
发布于 2021-04-14 21:00
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2021-04-14 17:17
同问,楼主收到hr面试了嘛
点赞 回复 分享
发布于 2021-04-01 18:35
楼主收到HR面通知了吗
点赞 回复 分享
发布于 2021-03-31 17:32
你接到HR面了吗
点赞 回复 分享
发布于 2021-03-31 16:33
有想法来上海字节试一下吗?
点赞 回复 分享
发布于 2021-03-30 18:15
请问几道编程题
点赞 回复 分享
发布于 2021-03-30 09:48
方便问下参加笔面试的时间么?
点赞 回复 分享
发布于 2021-03-29 15:58

相关推荐

昨天 17:40
门头沟学院 Java
不愧是字节,面麻了给我...1、项目介绍2、Agent项目是实习项目还是个人项目?有没有上线?3、拷打实习4、大模型微调,你的训练数据集是如何构建的?数据量有多大?5、在构建数据集的过程中,遇到了哪些挑战?花了多长时间?6、你之前的实习经历偏后端工程,你未来的职业规划更倾向于纯后端开.发,还是希望从事与AI/大模型结合的工作?7、详细讲一下Golang中Channel的概念和作用,它是否是并发安.全的?8、Channel和传统的锁(Mutex)在实现并发控制时有什么区别?各自的适用场景是什么?9、讲一下GMP模型10、当P的本地队列为空或者不为空时,它会怎么去调度G(协程)?11、Redis支持哪些数据结构12、为什么Redis的速度这么快13、如何实现一个类似某宝搜索框的实时商品名称模糊搜索功能?14、实时输入联想与输入完成后点击搜索在技术实现上有什么本质区别?15、实时搜索通常使用什么网络协议(如WebSocket)?你了解或有使用过吗?讲一下16、请详细说明扫码登录的完整流程和背后发生的原理17、在微服务架构中,服务发现和负载均衡是如何实现的?18、服务注册中心(如Nacos, Consul)是如何工作的?服务实例如何注册和保活(如通过心跳机制)?19、讲一下Agent中的“长短期记忆”20、什么样的信息应该放在长期记忆,什么样的信息放在短期记忆?21、当对话轮数很多,上下文窗口不足时,有哪些处理策略?(如截断、压缩)22、如果要进行记忆压缩,通常有哪些方法?23、了解过Agent的设计范式吗?有哪些?24、你设计的Agent是怎么实现ReAct模式的?详细讲讲25、手撕:实现一个并发任务处理器:给定一个包含100个任务ID的列表,要求控制最.大并发数为3,模拟并发调用某个外部接口
查看24道真题和解析
点赞 评论 收藏
分享
未知的命运:重新优化一下项目吧,不然你没机会了
点赞 评论 收藏
分享
评论
2
32
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务