一面 自我介绍问项目内容(第一个项目介绍得不是很清楚,花了很久)Transformer的结构self–attention的时间复杂度Bert和transformer在结构,embedding上的区别Layer Normalization的含义,有什么用(本菜鼠没答出来)Tfidf的含义,怎么提取特征的算法题leetcode 64从格子每个都有权重,计算从左上到右下权重值加起来最小的路径菜鼠我最开始说了下动态规划的思路,然后在边界卡了半天,经过面试官反复提醒答出祈祷下二面