聊得还挺愉快的面试官问的更多的是思考看得出面试官还是比较懂的问了cot的发展历程,为什么出现cot,有什么好处,解决了什么问题,第一个cot模型怎么设计出来的?开山之作:Chain-of-Thought Prompting Elicits Reasoning(few-shot) ,“Let’s think step by step”过度思考怎么解决:1、训练混合推理的数据,2、用户自己决定开不开启think,3、外加一个分类器,输出是问题的think budget。test time scale是什么?语言捷径问题的定义,为什么会出现这种现象,如何验证,怎么解决?定义:VLM过分依赖文本先验的...