希音这家公司也是第一次面试,感觉整体还是偏难的1 先做个自我介绍2 讲一下你目前做的项目,主要是用了哪些技术栈,解决了哪些问题,做了哪些优化3 对于数据湖你能说一下各个湖仓的优缺点吗,你目前用的哪个,主要是用了哪一块技术和实现4 对于flink来说,对于一条主流一天有千亿级别数据,目前对于数据实时写入Doris存在这性能瓶颈,第一个问题是解析比较慢,第二个精确一致写入比较慢,你如果来优化需要怎么入手,对于优化的话怎么实现不延迟不oom5 目前有个场景,需要每10秒看到某个APP的主页的实时uv并且需要取top100个页面,你来实现如何做到实时秒级计算和展示,数据量级有亿级起步6 对于离线模型,如果存在一个画像需求,对于某些人群或者漏斗需要做到每天周期2点前产出,你如何保证这个时效性7 目前你建设模型是怎么建设的,如何确保你这个模型是合理的,有啥量化的8 对于数据倾斜如何快速定位,如何实现快速解决数据倾斜,除了加资源和join改变还有啥方法9 对于数据治理有啥好的办法快速治理,你来主导治理的话主要是从哪一块入手,解决哪些问题10 来个SQL题目,取一支股票的最大利润11 有啥需要找我了解的我这还是第一次面试这家公司,给我的感觉似乎还比较难啊,技术深度算是比较深了,对于面试的人来说必须要有这方面的经验才能解决上面的问题,要不然感觉估计答不出来