个人背景可以看之前写的腾讯LLM面经一面/技术面 2024/3/20 下午15:00-16:00一面是电话面你对大模型有什么了解?简单说了大致的流程,预训练、有监督微调,RLHF之类的说一下RLHF的具体流程给了一个场景:如果现在给你一个预训练模型,然后场景是要帮助小学生做数学题,你会如何从头到尾来做这件事?大概提了数据收集,清洗,然后有监督微调,思维链分解过程之类的东西,还有幻觉问题你刚刚提到了幻觉问题,请问你知道有哪些缓解幻觉问题的思路吗?(结合之前写的基金本子回答了一波)你刚刚提到了思维链,大概说一下流程说一下NIPS那篇论文,中间问了大概十多个问题写代码,以为会是LeetCode那种,...