商汤一面- 大模型算法应用实习生

问题

1、自我介绍。

2、列举你调过的大模型接口所使用的大模型名字?(自我介绍我介绍到自己有使用大模型接口调度的经验)

3、大模型训练的步骤。

4、知道哪些大模型微调方法?

5、解释一下什么是agent?

6、对python熟悉吗?

7、默认情况下python函数return会返回什么?

8、python函数的参数变量带*,表示这个变量是什么类型?进一步讲type(args)会返回什么?

9、python函数的不带*的参数变量是什么类型?

10、解释一下python的闭包。

11、口头说下python中lambda(匿名函数)怎么写。

12、用python语言中的try捕获两数相除的异常。

13、用python语言实现用户类,类中有两个变量:年龄和性别,并将构建好的类用python调度打印其信息。

总结

线上面试,平台是牛客,大概面了30来分钟,凉

python相关一个没回答出来,关于大模型的回答感觉语言组织不太流畅,主要问python最基础的编程知识和简单的实现,看似简单实际很难(对我而言),暴露出自己其实并没有掌握python,只是会简单的看懂代码而已。

结论:水平不够,不要任性开始找实习就投大厂,先从小厂面试练,不要忽略最基础的知识、自己做过的项目一定要倒背如流。

#实习面试初体验##大模型实习##商汤面经#
全部评论
商汤科技算大厂嘛好兄弟,我也在面这个
点赞 回复 分享
发布于 2025-09-17 18:20 上海
兄弟你是go转llm了吗
点赞 回复 分享
发布于 2025-03-04 13:07 北京
怎么问这么基础呢,不应该偏向Agent等的问题吗
点赞 回复 分享
发布于 2025-02-21 13:55 重庆
不是,py基础也问啊
点赞 回复 分享
发布于 2025-02-18 19:38 广东

相关推荐

攒人品中,祝大家都能拿到满意的Offer!1.项目拷打2. 实习拷打3. 你们选用的训练方法是什么?训练数据具体是怎么构造的?4. 这里的训练过程,我理解是前面有一段医学语料的预训练,然后再加一段对齐过程,是这样吗?5. 关于 SFT 阶段,数据具体是怎么生成的?6. SFT 之后,后面的 DPO 过程又是如何开展的?7. DPO 需要 Chosen 和 Rejected 至少两组对比数据,这两组数据你们是怎么得到的?8. 我们现在这边可能对于医疗业务关系比较远,问一下更加基础的知识。既然谈到 DPO,谈一下 DPO 以及后续其他偏好学习算法的区别,以及各自的优劣。9. 那么 GRPO 算法呢?10. DPO 算法有哪些缺点?11. 谈谈强化学习中 On-policy 和 Off-policy 的区别,你是怎么理解的?12. 看你不仅做训练,还负责基础设施 Infra 的搭建。训练基础设施也是归你亲自搭吗?13. 当时是在哪个项目里面参与 Infra 工作的14. 你刚才提到了 Megatron,你们试过 PyTorch 原生的 FSDP 吗?15. 既然试过 FSDP,为什么最终还是选用了 Megatron?,你们当时的选型考量是什么?16. 既然提到 FSDP 和 DeepSpeed ZeRO 的区别,FSDP 实现了 ZeRO 的哪几个阶段?ZeRO-1, 2 还是 3?17. 探讨一个现实的业务问题:我们核心业务是对话类 Agent 产品。经典架构是前端设有一个意图识别与路由环节,将客户请求分发到不同的子 Agent,由于子 Agent 功能实现完全不同,不能混在一起,所以路由非常关键,一旦路由错误就无法满意回答。另外,作为全链路的必经点,路由必须足够快。我们考虑在最前端用一个相对较小(如 7B 或 13B)的模型,通过后训练使其掌握特定领域知识,实现低延迟的路由。如果让你做这个模型,你会怎么去做?
查看15道真题和解析
点赞 评论 收藏
分享
评论
8
48
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务