大模型实习面经

中国电子技术标准化研究院(大模型方向)

1.自我介绍
2.了解rag吗?简单介绍一下
3.Rag流程是什么?
4.做过微调吗?怎么做的?
5.大模型训练的超参数是怎么选的?学习率是什么?一般设置为多少?
6.Lora和qlora的区别?
7.训练时的pt是什么?(不记得是不是pt,这个真不知道)
8.情景题:假如有一万个PDF文档,要做垂直领域的大模型,用什么方法?具体怎么做?(我觉得可能是公司的业务,回答用RAG来做)
反问:公司业务(垂直领域大模型),薪资(月薪4000包午餐),职责(数据处理、训练微调、rag)
说明:事业单位无转正
地点:北京市东城区(不知道工资够不够吃住
有大佬能指点一下吗?欢迎交流
全部评论
给的太少了,我在某创业公司大模型算法岗还一天400呢
2 回复 分享
发布于 2024-06-19 08:26 北京
哥,我是干JAVA的我想转大模型,我该怎么学呀,有相关的视频教程还是怎么个学习路线😂。
1 回复 分享
发布于 2024-06-13 10:35 天津
实习的话感觉薪资基本都是这个数
点赞 回复 分享
发布于 03-02 22:45 北京
可以看我的文章,亲身经历
点赞 回复 分享
发布于 2024-11-08 11:46 北京

相关推荐

📍面试公司:字节抖音💻面试岗位:前端暑期❓面试问题:- Linux文件系统 权限分级 操作- Linux有哪些命令- Linux改写文件权限是怎么设计的- 硬连接软连接区别- 硬连接软连接在前端方面的应用- pnpm- pnpm优势 怎么设计的- 幽灵依赖问题是什么- Monorepo优点- Monorepo整体架构- Monorepo项目都有哪些核心目录 每个层级内有哪些包 详细的文件名叫什么- package.json文件放那些内容- package.json有哪些字段- 怎么声明一个本地依赖包 别的项目去使用它- 怎么理解开发环境下的依赖和生产环境下的依赖 怎么区别哪些包应该安装在哪里 他们俩有什么区别- 模块化了解哪些- esModule和CommonJs区别- 怎么理解动态编译静态编译- 树摇是怎么影响的- 引入模块有哪些引入方式- 怎么知道根据路径去寻找他的包的- 如果是包名引入的话查找逻辑是什么- 用户登录是怎么设计的- token存在哪里 怎么判断用户是否登录态- 用户鉴权怎么做的- token和cookie区别- 常见的请求头有哪些- Content-type有哪些常见格式- 缓存有哪些层面- 怎么去定义浏览器缓存的强缓存和协商缓存的- 一些构建的静态资源怎么缓存- js,图片,css怎么缓存 缓存时效- 项目拷打- zustand状态库应该怎么设计- 他应该有哪些功能 怎么定义怎么更新等等- 双向数据流单向数据流- diff算法- 不用第三方工具 不用api怎么实现一个状态管理库- 什么时候开始学前端的 最近在学什么新技术- 人工智能了解过吗 大模型 pytorch transform 有没有做过深度学习的项目- 为什么现在在实习还考虑我们这边的岗- this指向题- 事件循环输出题- ez算法:括号匹配🙌面试感想:好难 全是工程化  
点赞 评论 收藏
分享
评论
5
46
分享

创作者周榜

更多
牛客网
牛客企业服务