10.29秋招字节数仓一面
1.实习相关问题(实习做的主要是数据仓库湖仓一体相关的东西,比如读写外部服务器上的大数据格式文件这些东西)
2.了解数据湖吗(hudi,iceberg这些)
3.非结构化数据或者说多模态的数据用向量化存储,为什么能解决查询问题?
4.设计一个向量数据库,需要哪些模块和核心能力?
5.机器内存不够的情况下,如何取出几个大文件中出现频率最高的URL(搞底层的面试官真的很喜欢问内存不够,三面的时候问了同样的问题)
6.刚才你有说到大根堆,实现一个大致的大根堆
反问:业务和部门人数这些
2.了解数据湖吗(hudi,iceberg这些)
3.非结构化数据或者说多模态的数据用向量化存储,为什么能解决查询问题?
4.设计一个向量数据库,需要哪些模块和核心能力?
5.机器内存不够的情况下,如何取出几个大文件中出现频率最高的URL(搞底层的面试官真的很喜欢问内存不够,三面的时候问了同样的问题)
6.刚才你有说到大根堆,实现一个大致的大根堆
反问:业务和部门人数这些
全部评论
相关推荐
独角仙梦境:乱杀
点赞 评论 收藏
分享
