百度 llm算法 一面凉经
刚面完估计凉,趁着还记得写写
论文项目实习
穿插八股
llama系列介绍下
大模型训练流程说下
lora介绍下
rope
为什么都不用正余弦编码了(感觉他不满意,说了相对位置编码优点,可学习的一些,最后硬说效果不好哈哈)
为什么要sft,试过么,调得什么包,做过rf么,无
通用的sft和业务的sft有什么区别
为什么gpt的少量多语言数据,多语言能力也很好,如何提高?(说了跨语言,多语言对齐做些nlu翻译任务和llama的少量微调,没答到他心趴上)
对比学习主要难点
sft和rf之后哪个模型的多样性更好(我说rf之后,他说不对反了,我又改口,刚刚搜gpt,gpt和我的观念和思路一样😡,所以到底是啥)
如何提高回答的多样性(说了温度,数据,多任务,数据加噪,又没答到心趴😡,我自己觉得挺对的)
手撕 18,四数之和,按照三数之和双指针写的,最后有点有个if的判断条件写错了没查到,给了感觉就20分钟,就说时间到了,我说我马上就写出来,他说但是时间到了,我说我思路肯定没问题,他说先不关心这些
,问我有啥要问他的
知道无望了就问了评价一下表现,说这个代码能力是基础就不用讲了(那你也给多我点时间我找找bug呀
,也没问我写的啥思路),说我大模型的了解一般(这个我认可),总得来说体验一般 ,本来就不太想去
哈哈哈对了,我还问他主要做啥,她说现在也没啥业务,主要还是整数据train basemodel
,我说那就是进去做数据工程喽哈哈,评价不如打游戏一小时 #牛客创作赏金赛#
论文项目实习
穿插八股
llama系列介绍下
大模型训练流程说下
lora介绍下
rope
为什么都不用正余弦编码了(感觉他不满意,说了相对位置编码优点,可学习的一些,最后硬说效果不好哈哈)
为什么要sft,试过么,调得什么包,做过rf么,无
通用的sft和业务的sft有什么区别
为什么gpt的少量多语言数据,多语言能力也很好,如何提高?(说了跨语言,多语言对齐做些nlu翻译任务和llama的少量微调,没答到他心趴上)
对比学习主要难点
sft和rf之后哪个模型的多样性更好(我说rf之后,他说不对反了,我又改口,刚刚搜gpt,gpt和我的观念和思路一样😡,所以到底是啥)
如何提高回答的多样性(说了温度,数据,多任务,数据加噪,又没答到心趴😡,我自己觉得挺对的)
手撕 18,四数之和,按照三数之和双指针写的,最后有点有个if的判断条件写错了没查到,给了感觉就20分钟,就说时间到了,我说我马上就写出来,他说但是时间到了,我说我思路肯定没问题,他说先不关心这些
知道无望了就问了评价一下表现,说这个代码能力是基础就不用讲了(那你也给多我点时间我找找bug呀
哈哈哈对了,我还问他主要做啥,她说现在也没啥业务,主要还是整数据train basemodel
全部评论
竟然有二面,论文实习项目,啥八股没问,手撕softmax,一个动规前缀和(没写出来),这次应该是寄了哈哈
哪个部门呀
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
2025-12-14 11:43
黑龙江大学 Java
用微笑面对困难:确实比较烂,可以这么修改:加上大学的qs排名,然后大学简介要写一些,然后硕士大学加大加粗,科研经历第一句话都写上在复旦大学时,主要负责xxxx,简历左上角把学校logo写上,建议用复旦大学的简历模板 点赞 评论 收藏
分享
01-09 11:18
门头沟学院 Java 创作小队长:你的批判视角非常犀利,尤其“结果决定叙事权”的洞察非常精准,哈哈想邀请你来成为我们的创作者🫰
但我想补充一个视角:许多分享者的初衷并非炫耀结果或者苦难,我更愿意相信他们在这个过程中付出了很多,在这场战役结束后,他们迫不及待地想被看到,记录和分享都是给自己的一个交代,而非真的教会别人什么,他们的初衷未必是想制造焦虑。求职市场的残酷、经济环境的下行、世俗价值观才是这种叙事流行的土壤,作为一个普通人无法抵抗洪流。
感谢你发起这场讨论。理想的社区,既需要这样锐利的批判来保持清醒,你的洞察非常犀利,也许会启发一些人,能逐渐改变这种叙事~
点赞 评论 收藏
分享
