写给工程同学的大模型初体验

背景概述:

为什么要写这个呢?虽然现在大模型很火,但对于我们工程同学来说,把大模型当一个黑盒用就好了。一开始我也是这么认为的。直到我在小红书做到了一个需求

在小红书的时候有一个需求是优化组内一个 agent 项目的响应和结果优化,这个 agent 是一个复杂的商业助手,并不是说技术很难,但要分析的广告业务很复杂,有上千个指标,好几种场景,prompt非常长,如果输出的效果不好,是没有人愿意用的。

用了很多优化手段,比如并发查数据等等。有一天这个项目的正职同学和我说,他和算法那边的同学交流,说可以把我们动态拼到 System prompt 的指标数据拼到用户的 query 里面,这样就可以利用模型的 kv cache 加快响应时间。

当时我是很惊讶的,后来又想,为什么这种优化思路我想不到呢?其实就是对模型的原理不了解,像 sql 调优,spark 调优这些,都是要对中间件的原理有了解,把模型当成一个中间件的话,肯定也要对模型有了解的。

所以有了这篇文章的想法,我学东西一直喜欢从实际项目入手,这次也是推荐一个实际项目,minimind

项目地址:https://github.com/jingyaogong/minimind

这个项目堪称大模型求职中的“黑马点评”,但是我们本质也不是要去找算法相关的工作,用这个项目体验模型训练的全流程以及模型的原理和组件还是非常不错的。并且不吃资源30系的显卡就可以部……署体验

体验模型训练全流程:预训练,SFT 监督微调,LoRA,强化学习等,也可以了解模型中的分词器,transfomer 架构,MoE 专家模型等

作者还有一个多模态版本的 VLM 模型,同样可以用来入门学习https://github.com/jingyaogong/minimind-v

如果本机的算力资源也不是很够的话可以去一些算力社区,蹭一点免费的算力体验一下模型训练部署的流程

#AI求职实录#
全部评论
虽然但是,你想表达的应该是学习如何agent工程里的提示词工程,而不是训练或者微调模型,这基本上是两个不同的方向。我认为学习agent主要就两个东西:提示词工程和上下文工程。像你说的prompt caching这种优化怎么能想到,建议多读大模型供应商尤其是anthropic的博客,anthropic大概一年前就有很详细的博客讲最佳实践和实现了
4 回复 分享
发布于 02-07 05:04 美国
没必要看这个,数据比这些更重要,学习合成数据吧
1 回复 分享
发布于 02-09 19:02 山东
这个项目怎么写简历和准备面经呢
点赞 回复 分享
发布于 03-05 17:02 江苏
那看来我mac本地训练不了这个模型了 m1pro芯片的性能最多就20系显卡的水平
点赞 回复 分享
发布于 02-09 15:48 新加坡
确实了解一下中间的流程原理可能会有新的优化思路
点赞 回复 分享
发布于 02-09 15:05 浙江
多学习一下大模型的项目也是挺好的
点赞 回复 分享
发布于 02-07 15:29 湖南
点赞 回复 分享
发布于 02-06 16:40 北京

相关推荐

评论
19
53
分享

创作者周榜

更多
正在热议
更多
# 一张图晒出你司的标语 #
4419次浏览 78人参与
# 找AI工作可以去哪些公司? #
9751次浏览 287人参与
# 米连集团26产品管培生项目 #
13457次浏览 285人参与
# 你的实习产出是真实的还是包装的? #
20622次浏览 345人参与
# 从事AI岗需要掌握哪些技术栈? #
9562次浏览 360人参与
# 春招至今,你的战绩如何? #
67275次浏览 595人参与
# 开放七大实习专项,百度暑期实习值得冲吗 #
15603次浏览 226人参与
# AI面会问哪些问题? #
28768次浏览 606人参与
# 中国电信笔试 #
32207次浏览 295人参与
# 你做过最难的笔试是哪家公司 #
35185次浏览 288人参与
# 金三银四,你的春招进行到哪个阶段了? #
22472次浏览 284人参与
# 投递几十家公司,到现在0offer,大家都一样吗 #
341130次浏览 2175人参与
# 如何准备秋招 #
78321次浏览 868人参与
# 同bg的你秋招战况如何? #
212262次浏览 1121人参与
# 哪些公司真双非友好? #
69778次浏览 289人参与
# 应届生被毁约被毁意向了怎么办 #
63331次浏览 305人参与
# 阿里笔试 #
179261次浏览 1321人参与
# 机械人避雷的岗位/公司 #
62720次浏览 393人参与
# 小马智行求职进展汇总 #
25149次浏览 80人参与
# 第一份工作一定要去大厂吗 #
15079次浏览 123人参与
# 担心入职之后被发现很菜怎么办 #
291415次浏览 1210人参与
# 为了减少AI幻觉,你注入过哪些设定? #
26313次浏览 310人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务