无论文秋招——五八同城二面
45min
和一面一样,看着都是那种比较实在的中年人
问巨多细节
数据量到模型参数到loss function到用的卡的数量
CLIP的损失函数,infoNCE
image encoder 和 text encoder用的什么模型
dim是多少
qwen2.5 -vl 的data flow
Mrope怎么编码的
https://zhuanlan.zhihu.com/p/719388479
强化学习的目标函数,忘了重要性采样了
反问
业务
45min
和一面一样,看着都是那种比较实在的中年人
问巨多细节
数据量到模型参数到loss function到用的卡的数量
CLIP的损失函数,infoNCE
image encoder 和 text encoder用的什么模型
dim是多少
qwen2.5 -vl 的data flow
Mrope怎么编码的
https://zhuanlan.zhihu.com/p/719388479
强化学习的目标函数,忘了重要性采样了
反问
业务
相关推荐