大模型项目流程

今天老师给大家分享大模型项目准备经验,供各位同学参考学习。
1️⃣大模型流程
✅数据处理:
1.参考 deepseek 、 llama 、 qwen 等技术报告的数据清洗工作;
2.强烈建议使用 Data - Juicer 做启发式数据清洗工具;
3.做数据多样性探索,保证 Prompt 的多样性;
4.做数据质量增强,用强基座做数据改写等。做拒绝采样保证 response 的" Online "性质。
✅开始训练:
1.卡多做 CPT ,没卡就基于 Base 模型做 Post - Training ;
2.不同规则的模型调参差异大,参考大厂技术报告和其他博客;
3.试试不同的训练策略,有挺多 fancy 的增量预训练和 Post - Training 方法,多试试;
✅评估 Case :
1.在常见的 Benchmark 上看看效果,脚本都有现成的;
2.不要只看指标和 loss ,多分析 case ,知道加什么数据,摸清模型的边界能力,持续迭代优化模型能力;
3.基座或者 Chat 作为 Baseline ,对比看看效果。
2️⃣做一个垂域大模型项目
资源准备:你需要准备至少4张3090级别的显卡,核数足够多的 CPU 。
✅前期准备:
1.调研业务,设计业务场景,分析可行性(数据,技术,实用性);
2.会爬虫;
3.需要留钱买 API ;
✅数据处理:
1.爬的数据很脏,一定要做数据清洗;2.如果垂域没那么垂直,比如法律方向,大概率 Base 模型见过了,可以选择不做垂域和通用的数据配比;
评估 Case :搞两个 Benchmark ,垂域和通用的,通用不能掉点太多;评估下一致性,从训练集里按任务分层抽样看看 case ;
3️⃣做一个大模型应用
做完上面两个项目后,其实都可以在此基础上构建一个大模型应用,目前最多的就是 rag 或者 agent 嘛,讲讲如何构建一个 RAG 。
✅前置能力:
1.学下 Langchain 和 Llama - index ;
2.看看简单的 workflow 怎么做的,强烈推荐看看 Anthropic 的《 Building effective agents 》;
3.有一定的工程能力。
✅参考框架:
1.Langchian- Chatchat ,之前笔记就推荐了, rag 很有影响力的开源项目,而且可优化点多;
2.Qanything;
3.自己手搓个 workflow .
可优化点:内容供给;重排策略;微调 embedding ;意图分流单独训个 agent ;优化归纳
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系
全部评论
已关注,这篇太有用了!!
点赞 回复 分享
发布于 05-15 20:00 广东
我们是一家AI Agent公司,深圳南山,正在招Agent后端开发,有兴趣聊聊吗
点赞 回复 分享
发布于 05-06 16:54 广东

相关推荐

客观聊一下韶音入职一个月感觉,个人评价感受:个人岗位偏工程技术,整体感受还好,后续持续更新。优势:1.工作氛围:1.1 整体还是比较好,领导的话还是比较和蔼,工作上的话针对具体项目推进难点和具体情况可以直系上级沟通,基本都能得到比较正向的回应和支持。针对项目验证还未落地情况也基本会支持验证推进,和一些稍微大一些企业对比的话,这边还是比较鼓励尝试新的工艺&流程,个人想法更能去实践与铺开。1.2 针对于工作强度的话,这边也没有强制要求加班,新产品项目导入验证难免会有问题需求加班(即使华为的话在新品上线基本会有),但针对一些国企为了数据好看要求强制加班的话这边基本不存在。加班的一些待遇也确实说没有加班补贴,但还是有一些外卖补贴,整体待遇看具体人谈,基本能满足。2.生活 生活的话看个人看法了,这边会要求每个月运动量和学习量,这个看个人看法,我看法至少公司还是关注员工身体和对于后续能力开发,对于韶音不断学习才能提升整体企业的行业能力,对个人来说,也为以后积淀。这个也有人认为占用个人时间,我觉得只能说个人看法3.部门配合度 我是在韶音坪山部分,整体部门之间会比其他企业协调力和配合力会更高一些,具体项目问题也有明确职能划分,针对生产和工程难得的出现比较好的一个配合度。这点也是我对比我上两家比较好的一点。以上就是一个月左右的一个上班体验,整体感觉还是比较好的,团队比较有活力,项目研发和创新也是能得到老板的认可和支持。虽然有些缺少加班补贴一些缺陷,但是整体待遇还是在入职提的待遇需求能得到满足。我可以内推!!全球运动耳机销量第一!骨传导耳机领导者!一路领先,等你加入!国家级专精特新重点小巨人,近7年100%营收增速,高速发展中的企业!⏰ 我们倡导工作生活平衡,拒绝996!!【多领域招才,与你同行】研究类、开发类、产品类、工程技术类、供应链运营类、营销运营类、品质管理类、设计策划类、职能类、IT类【内推链接】https://app.mokahr.com/m/campus-recruitment/aftershokzhr/36940?recommendCode=DSe1vF9A&hash=%23%2Fjobs#/jobs【内推码】DSe1vF9A(内推简历有免笔试的机会!)【工作地点】深圳,部分岗位全国分布投递的uu评论一下姓名缩写加岗位(HFG+产品经理)
韶音科技公司氛围 399人发布
点赞 评论 收藏
分享
评论
12
77
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务