我也是找不到实习的摆子

2024-04-07 12:22 北京大学算法工程师

关注

【25暑期实习】Soul大模型一面

面试时长40分钟
自由交流15分钟
面试官小姐姐超超超超温柔

1. 自我介绍
2. 问大模型实习项目，做了什么，用了什么开源模型，主要是chatglm和llama
3. 有没有尝试过改原模型的设计，比如结构或者loss函数？为什么不？
3. 说一下chatglm或llama与传统transformer结构的区别，有哪些改动，和可以借鉴的地方？主要从模型结构、layer norm、激活方式、位置编码回答
4. 在实际训练或微调的过程中遇到了哪些问题，是怎么解决的？主要讨论了下精度问题、梯度爆炸、loss出现nan
5. 说说bf16、fp16、fp32的区别
6. 简单讲了下deepspeed
7. 微调的话用了哪些方法？讲主要是lora
8. 追问了下我们用lora调哪些参数？不同参数怎么选？什么影响？
……想不起来了一部分
7. 代码实现transformer原来的sinusoidal位置编码

团队介绍
主要做的产品是Soul X系列
目前算法组将近100个人，其中NLP组不到20个人，目前主要工作在Role Play方向，AI狼人杀也在其中。国内海外都有相关产品，业务赚钱为主，发专利为辅，有发专利的Okr，没发过论文，但有往技术自研转型的趋势。
资源方面的话H800，不到100张。

全部评论

推荐最新楼层

莫得感情123123

华中科技大学机器学习

请问soul算中厂嘛？今天刚面完

1 回复分享

发布于 2024-04-07 21:13 北京

我不是降雨量

清华大学算法工程师

请问你是怎么遇到这么多温柔的面试官的

1 回复分享

发布于 2024-04-07 14:59 北京

苏州大学算法工程师

佬，从投简历到一面几天啊

点赞回复分享

发布于 2024-04-25 16:35 江苏

我也是找不到实习的摆子

楼主

北京大学算法工程师

补充：位置编码PE输入的tensor shape是怎样的？

点赞回复分享

发布于 2024-04-07 12:23 北京

03-26 12:05

长沙理工大学高等教育

国企‘三进三不进’”，不是所有的央国企都值得进

很多友友不知道怎么校招选国企，朝着这三个目标前进三类值得进入的央国企• 第一类：垄断型国企或政策性银行举例：中国烟草、国家电网、三桶油、三大政策性银行，铁路等。优势：应届生进入后，待遇和未来发展前景较好，不会失业类似公务员。• 第二类：受国家保障的央国企（如军工类企业，中储量，邮政）特点：工作稳定、福利待遇一般，且“不可能失业”。• 第三类：省属市属总部国企机关适合人群：家庭条件较好、追求稳定工作的求职者。优势：工作内容管理为主、待遇尚可，无业绩压力、离家近，“工作生活两不误”。#春招至今，你的战绩如何？##工作经验# 

职场吐槽大会

点赞评论收藏

分享

04-09 18:24

武汉工程大学 golang

360一面凉经

我面的是Golang后端，结果上来基本上不问后端问题，全问的是AI方向的，也不问简历，什么Go协程，并发，GMP调度和大部分是数据结构底层八股全部都不问，还有后台常考的Mysql，Redis和MQ也不问。问了大模型落地训练微调量化，还有FunctionCalling，MCP，龙虾Skill。出了两个简单的计算题有一个结果还出错了，我推导半天结果有问题，最后拿编译器穷举发现根本没结果。最后问为什么不问后端题目而是问AI方向的，回答是因为我简历里面的项目全是保密项目，技术难点不可能达不到真实业务高并发需求，所有的实现都是基于标书的，所以问了等于没问，索性就不问了。面完之后感觉人都麻了，感觉就是不想面，还不如直接说出来拒接，浪费双方的时间。题目：abc+cba=1331，求解a+b+c=？我的解法是：100a+10b+c+100c+10b+a=1331101a+20b+101c=1331101(a+c)=1331-20b令a+c=x∈0-18,b=y∈0-9101x=1331-20y右边y的系数是20，所以不管怎么减右边个位数都是1，那么左边101只能乘个位数为1的数也就是x要么是1要么是11，但是1和11的时候y都不满足条件0-9然后我人麻木了陷入了怀疑，就拿编译器用穷举（三重for循环实现）package mainimport "fmt"func main() {for a := 0; a < 10; a++ {for b := 0; b < 10; b++ {for c := 0; c < 10; c++ {if 101*(a+c)+20*b == 1331 {fmt.Println(a + b + c)fmt.Printf("a: %d, b: %d, c: %d\n", a, b, c)}}}}}最后结果也是没有输出，最后面试官才反应过来是1131算了半天结果是题目有问题

查看6道真题和解析

点赞评论收藏

分享

03-26 15:54

科大讯飞_教育BG_后端开发(准入职员工)

春招慢热前行，静待国企花开

春招以来我主要投递央国企，流程普遍偏长，目前大多还在笔试、面试或等待结果中。虽然暂时没有确定 offer，但每一次笔试复盘、面试总结都在夯实后端基础。不焦虑不浮躁，稳步推进，相信踏实准备终会迎来满意的结果。目前已投：南方电网海南昌江核电各个银行#春招至今，你的战绩如何？#

点赞评论收藏

分享

04-02 11:56

合合信息_Agent数据工程师(准入职员工)

合合信息内推-合合信息内推码

合合信息测试实习面经，摘自优秀牛友攒攒人品主要问实习经历base上海1.自我介绍2.实习项目做了几次迭代，每次迭代涉及几个功能3.实习项目时间是否非常紧凑4.讲解一下当时负责的比较复杂的功能5.发现的印象比较深刻的bug6.团队大概多#nyzc# 少人7.测试中怎么分bug是前端还是后端8.团队沟通有发生什么问题吗9.实习过程中测试时除了功能方面的问题还会注意哪些方面的问题10.对自己的规划是什么11.平时除了学习还有什么爱好12.自己的性格对于测试有什么优势13.自己有什么缺点14.反问合合信息2026届春招3.10开启【企业简介】合合信息是行业领先的人工智能及大数据科技企业。旗下明星产品有...

点赞评论收藏

分享

03-28 14:02

广西大学算法工程师

腾讯大模型应用开发一面

1. 项目里是把 skill 直接塞进 system prompt 的，如果 skill 太多，占用上下文窗口太大，怎么处理不能把所有 skill 常驻塞进 system prompt，这样会带来三个问题：上下文窗口被占满、候选技能噪声太大、模型在选择 skill 时更容易混淆。更合理的方式是把 skill 做成外部注册表，system prompt 里只保留最小规则和调用协议，真正的 skill 描述按需动态注入。常见做法是先做一层 skill routing。可以用规则、分类模型或者向量检索先筛出 topk skill，再把这几个 skill 的 description、参数 schema...

AI-Agent面试实战...

点赞评论收藏

分享

评论

5

33

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

88548次浏览 638人参与

# 什么专业适合考公 #

69484次浏览 345人参与

# 在爱玛，骑向未来 #

44313次浏览 434人参与

# 机械人，说说你的烦心事 #

148530次浏览 1162人参与

# 毕业季，给职场新人一些建议 #

221162次浏览 2600人参与

# 工作压力大，你会干什么？ #

82370次浏览 707人参与

# 选offer应该考虑哪些因素 #

172500次浏览 1057人参与

# 工作后，你落下了哪些病根 #

42348次浏览 294人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

103458次浏览 707人参与

# 巨人网络工作体验 #

76604次浏览 507人参与

# 如何缓解入职前的焦虑 #

290794次浏览 1505人参与

# 携程笔试 #

174215次浏览 916人参与

# 我的第一份实习怎么找的 #

288573次浏览 2108人参与

# 重来一次，我还会选择这个专业吗 #

466704次浏览 3983人参与

# 你被哪些公司挂了？ #

198038次浏览 1076人参与

# 职场新人体验 #

192736次浏览 1241人参与

# 实习生的蛐蛐区 #

957581次浏览 4840人参与

# 实习生工资多少才算正常？ #

76165次浏览 526人参与

# 应届生，你找到工作了吗 #

174079次浏览 900人参与

# 找工作中的小确幸 #

92829次浏览 472人参与

# 你上一次加班是什么时候？ #

157468次浏览 823人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务