迟到了10分钟bg 文转码,双9 无论文无实习上来先旋转数组,A了10分钟,要求原地算法logn时间复杂度,不允许先找k(虽然也是logn复杂度)拷打项目,被狂怼,反怼回去。后来结论是场景太简单了,所以方法效果还行,我也知道自己项目是玩具,就没过多说啥。(下次找实习一定做个完整的项目)问Transformer,经典吟唱问Lora,经典吟唱问大模型优化加速,吟唱Flash Attention、KV cache、分组注意力查询机制手写Layer Norm,没A出来,torch用的比较少Push了一下进度,给了2面(人生中第二个二面)