浙大98投递背景:9本9硕,1篇2作A, 1篇4作A, 1篇1作在投,半年算法研究实习一面科研经历如何增强多模态模型的识别准确度(比如识别出一个医疗手写表格中的特征与具体值)在用verl做强化学习时,你是根据什么指标来查看训练的进度的。讲一讲你对rag的理解ppo的原理ppo是倾向于将模型往什么方向训练讲一个你最熟悉的模型(讲的deepseek-r1)多模态基础手写多头注意力为什么计算注意力要除以维度decoder-only的结构,输入prompt到输出token的整个过程。有什么办法将2维的embedding转换成3维的embedding,同时保留位置编码信息以后读博还是进入工业界如果有转正...