快手nlp推荐面试#
1.手撕LRU
2.手推两层网络的反向传播算法
3.手推Transformer的注意力机制
基础:
svm损失函数
F1为什么是1
AUC计算
了解的激活函数
了解的优化算法
bert为什么是双向机制,GPT呢
Transformer的多头是为什么
2.手推两层网络的反向传播算法
3.手推Transformer的注意力机制
基础:
svm损失函数
F1为什么是1
AUC计算
了解的激活函数
了解的优化算法
bert为什么是双向机制,GPT呢
Transformer的多头是为什么