大模型项目流程

今天老师给大家分享大模型项目准备经验,供各位同学参考学习。
1️⃣大模型流程
✅数据处理:
1.参考 deepseek 、 llama 、 qwen 等技术报告的数据清洗工作;
2.强烈建议使用 Data - Juicer 做启发式数据清洗工具;
3.做数据多样性探索,保证 Prompt 的多样性;
4.做数据质量增强,用强基座做数据改写等。做拒绝采样保证 response 的" Online "性质。
✅开始训练:
1.卡多做 CPT ,没卡就基于 Base 模型做 Post - Training ;
2.不同规则的模型调参差异大,参考大厂技术报告和其他博客;
3.试试不同的训练策略,有挺多 fancy 的增量预训练和 Post - Training 方法,多试试;
✅评估 Case :
1.在常见的 Benchmark 上看看效果,脚本都有现成的;
2.不要只看指标和 loss ,多分析 case ,知道加什么数据,摸清模型的边界能力,持续迭代优化模型能力;
3.基座或者 Chat 作为 Baseline ,对比看看效果。
2️⃣做一个垂域大模型项目
资源准备:你需要准备至少4张3090级别的显卡,核数足够多的 CPU 。
✅前期准备:
1.调研业务,设计业务场景,分析可行性(数据,技术,实用性);
2.会爬虫;
3.需要留钱买 API ;
✅数据处理:
1.爬的数据很脏,一定要做数据清洗;2.如果垂域没那么垂直,比如法律方向,大概率 Base 模型见过了,可以选择不做垂域和通用的数据配比;
评估 Case :搞两个 Benchmark ,垂域和通用的,通用不能掉点太多;评估下一致性,从训练集里按任务分层抽样看看 case ;
3️⃣做一个大模型应用
做完上面两个项目后,其实都可以在此基础上构建一个大模型应用,目前最多的就是 rag 或者 agent 嘛,讲讲如何构建一个 RAG 。
✅前置能力:
1.学下 Langchain 和 Llama - index ;
2.看看简单的 workflow 怎么做的,强烈推荐看看 Anthropic 的《 Building effective agents 》;
3.有一定的工程能力。
✅参考框架:
1.Langchian- Chatchat ,之前笔记就推荐了, rag 很有影响力的开源项目,而且可优化点多;
2.Qanything;
3.自己手搓个 workflow .
可优化点:内容供给;重排策略;微调 embedding ;意图分流单独训个 agent ;优化归纳
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系
全部评论
已关注,这篇太有用了!!
点赞 回复 分享
发布于 2025-05-15 20:00 广东
我们是一家AI Agent公司,深圳南山,正在招Agent后端开发,有兴趣聊聊吗
点赞 回复 分享
发布于 2025-05-06 16:54 广东

相关推荐

02-09 20:56
已编辑
门头沟学院 Java
AI Agent开发实习生,不是研发岗。后续发展是售后技术支持路线。。。一面 是现在的mentor电话面1.19 19:06 约20min1. 问:你在做实习项目的过程当中,遇到了哪些难点,又是如何解决的?2. 问:你所说的规则提取具体指的是什么规则?(项目)3. 问:针对pdf文件,你是通过什么样的方式去解析的?4. 问:如果pdf里面有文本、表格,且表格有合并单元格和公式,遇到这种情况要怎么处理?5. 问:人才在线考试系统是你们自己做的项目,还是对接的其他框架?6. 问:你提到的扣子智能体的能力,这指的是什么东西?7. 问:这个考试系统是用java写的吗?8. 问:Java框架你在学校里面学的比较多是吗?9. 问:你对服务器有了解过吗?比如自己写完项目后把它安装部署到服务器上?10. 问:你自己在电脑上整过虚拟机然后去进行操作吗?11. 问:你使用过LangChain吗?12. 问:你用到过RAG技术吗,能简单说一下你的了解吗?13. 问:Embedding有哪几种算法你了解过吗?14. 问:你对前端了解过哪些呢?15. 问:你在Vibe coding的过程当中,主要用的是哪个?二三面 线下1.21 14:00 约90min 二 三面部门领导面 约1h1. 问:请说明你们学校课程安排的紧张程度以及目前的学业进度。2. 问:请详细说明毕业论文的完成情况。3. 问:会议论文的撰写过程中,你的具体贡献和作者排序是怎样的?4. 问:请简要介绍你的学习或工作经历,尤其是与AI开发工程师岗位相关的部分。5. 问:请详细说明实习项目的核心功能、解决的问题,以及你在项目中的具体分工。6. 问:请解释原始报告与决策层需求之间的差异点,以及系统如何解决这一问题。(项目背景)7. 问:请具体描述你在实习项目系统录入部分的技术实现细节,包括使用的工具和数据处理逻辑。8. 问:请详细说明你在月报系统中设计的大模型提示词逻辑及其约束条件。(提示词工程 被严厉拷打)9. 问:你对AI Agent开发岗位的理解是什么?以及你希望在该岗位中从事哪些具体工作?10. 问:请阐述你对AI Agent的定义及其能解决的核心问题。三面mentor面 约30min1. 你对线程池了解吗2. 你对锁的了解说说3. 你觉得 Python 和 java 啥区别4. Python 并发、异步了解吗5. Docker 如何查看日志6. 对 Linux 了解吗聊天:1. 介绍公司产品2. 聊毕设3. 聊大模型 ai 编程 Vibecoding反问1 入职的话 我要学点什么呢2 我们这边智能体开发偏工程还是偏算法除了项目 八股都答得很浅。。已oc 记录一下 已上班两周 继续努力这个后续怎么变成后端产出呢
实习如何「偷」产出?
点赞 评论 收藏
分享
评论
13
88
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务