timeline:2月10日一面2月13日二面(leader面)2月14日三面2月24日四面(hr面)2月25日谈薪,口头offer(跟hr提了几天时间考虑要不要接)面试提问的一些大概问题(针对项目的问题略过。。。):能说一下reduce类算子有哪些优化方案吗?对于reduce类算子,考虑shape为[M, N],对于M非常大怎么优化?对于N非常大怎么优化?了解sglang和vllm吗?vllm采用了哪些优化方案?PageAttention的实现思路是怎样的?vllm你觉得哪些方面可以进一步优化?说说flashattention的原理openMP外层循环开了四个线程,在内层循环可以开大于四个线...