02-06 15:53 已编辑快手_MLOps(实习员工)

发布于北京

关注

写给工程同学的大模型初体验

背景概述：

为什么要写这个呢？虽然现在大模型很火，但对于我们工程同学来说，把大模型当一个黑盒用就好了。一开始我也是这么认为的。直到我在小红书做到了一个需求

在小红书的时候有一个需求是优化组内一个 agent 项目的响应和结果优化，这个 agent 是一个复杂的商业助手，并不是说技术很难，但要分析的广告业务很复杂，有上千个指标，好几种场景，prompt非常长，如果输出的效果不好，是没有人愿意用的。

用了很多优化手段，比如并发查数据等等。有一天这个项目的正职同学和我说，他和算法那边的同学交流，说可以把我们动态拼到 System prompt 的指标数据拼到用户的 query 里面，这样就可以利用模型的 kv cache 加快响应时间。

当时我是很惊讶的，后来又想，为什么这种优化思路我想不到呢？其实就是对模型的原理不了解，像 sql 调优，spark 调优这些，都是要对中间件的原理有了解，把模型当成一个中间件的话，肯定也要对模型有了解的。

所以有了这篇文章的想法，我学东西一直喜欢从实际项目入手，这次也是推荐一个实际项目，minimind

项目地址：https://github.com/jingyaogong/minimind

这个项目堪称大模型求职中的“黑马点评”，但是我们本质也不是要去找算法相关的工作，用这个项目体验模型训练的全流程以及模型的原理和组件还是非常不错的。并且不吃资源30系的显卡就可以部……署体验

体验模型训练全流程：预训练，SFT 监督微调，LoRA，强化学习等，也可以了解模型中的分词器，transfomer 架构，MoE 专家模型等

作者还有一个多模态版本的 VLM 模型，同样可以用来入门学习https://github.com/jingyaogong/minimind-v

如果本机的算力资源也不是很够的话可以去一些算力社区，蹭一点免费的算力体验一下模型训练部署的流程

#AI求职实录#

全部评论

推荐最新楼层

八股战士0offer

New York University Java

虽然但是，你想表达的应该是学习如何agent工程里的提示词工程，而不是训练或者微调模型，这基本上是两个不同的方向。我认为学习agent主要就两个东西：提示词工程和上下文工程。像你说的prompt caching这种优化怎么能想到，建议多读大模型供应商尤其是anthropic的博客，anthropic大概一年前就有很详细的博客讲最佳实践和实现了

4 回复分享

发布于 02-07 05:04 美国

牛客315903028号

算法工程师

没必要看这个，数据比这些更重要，学习合成数据吧

1 回复分享

发布于 02-09 19:02 山东

结城理找不到面试

National University of Singapore C++

那看来我mac本地训练不了这个模型了 m1pro芯片的性能最多就20系显卡的水平

点赞回复分享

发布于 02-09 15:48 新加坡

牛客910542727号

门头沟学院 Python

确实了解一下中间的流程原理可能会有新的优化思路

点赞回复分享

发布于 02-09 15:05 浙江

长沙学院 Java

多学习一下大模型的项目也是挺好的

点赞回复分享

发布于 02-07 15:29 湖南

创作小队长

牛客创作者运营

点赞回复分享

发布于 02-06 16:40 北京

昨天 19:58

门头沟学院 C++

C++ 并发编程常考面试题总结

1. 如何使用std::mutex实现线程同步？核心机制：std::mutex是互斥锁，用于保护临界区，保证同一时间只有一个线程执行临界区代码。使用方式：直接使用lock()/unlock()：需手动加锁解锁，易因异常导致死锁；推荐使用RAII包装器：std::lock_guard（自动加锁解锁，作用域结束自动释放）、std::unique_lock（支持延迟加锁、解锁、超时等待）。代码： #include <mutex> #include <thread> std::mutex mtx; int shared_data = 0; void increment() { ...

C++面试总结

点赞评论收藏

分享

01-26 20:10

四平职业大学人工智能

27届硕士找暑期实习

目前情况是985本硕，但是本身实力不强，目前无实习无论文，方向与agent有些关系，但不是算法组，应该会在实习前投个c会。考虑到现在还有时间，还有努力的机会，想找一个有关大模型应用开发的工作，想问问朋友们应该如何准备呢？项目用论文中的实验可以吗？需要系统性地学习java吗？

点赞评论收藏

分享

02-10 11:30

西北大学安卓

最推荐的AI项目实战

双非本科 25届软件工程专业，秋招最终上岸某大厂移动端 AI 算法岗。分享下三个能帮你在 AI 赛道脱颖而出的硬核项目：1. ncnn 手机端高性能神经网络前向计算框架项目实践：基于 ncnn 实现手机端 YOLOv8 目标检测模型部署，针对 ARMv8 架构做指令级优化，将单帧推理速度从 200ms 压缩至 80ms，无第三方依赖，适配 Android/iOS 双平台。项目地址:https://gitee.com/Tencent/ncnn求职价值：直接体现移动端 AI 部署、跨平台兼容和高性能优化能力，是软开专业在 AI 嵌入式 / 移动端方向的硬核加分项；该框架已在腾讯 QQ、微信等亿级用...

推荐一个值得做的AI项目

点赞评论收藏

分享

01-27 00:12

美团_测试开发(准入职员工)

wlb在互联网里真的很重要

大家可能对wlb的定义和理解有很大误区 可能都拿上下班的时间去做唯一衡量 这个可以是外企国企去跟互联网做对比的优势 比如可能前者6.就能做到准点下班 后者可能12.还在公司战斗 但是在互联网里面找wlb 就不能只拿工作时间去衡量了对于实习生/校招生第一 工作强度是一方面因素 拿测开举例 有的同学可能任务就是做一些手工测试或者自动化 那一些同学可能做的是ai提效或者开发专项 所以强度不同感受也是不同的第二 你的mt/ld/同事的个人风格也会影响你的工作 比如你的mt可能苛刻甚至带有pua的风格 那我想你的工作感受可能是比较偏激的 假如你对接的研发都比较高效 能够按时执行你的冒烟用例也能及时的去修复你提的bug 那我觉得你在工作中应该充满干劲 相反 你的上游同学是一个延迟一个小时回你消息的人 频繁阻塞你的测试 那我想你心里也不会很好受第三 工作地点也很重要 比如南方人可能习惯杭州深圳成都一点 北方人可能更倾向北京一点 这个就看自身爱好也不绝对 比如我就很喜欢北京这个城市 我提前实习最主要的因素还是因为能在北京这个城市生活 因为主播不是北京人学校也不再北京 但是特别喜欢这个城市 所以在别人觉得base北京是减分项 在主播这里是加分的第四 公司整体的福利制度以及团建时间周期和团建内容也影响你的工作情绪 当然这个就不赘述 大家能切身实地的感受到最近的一些帖子新闻大家也看到了 所以趁着实习和提前实习的机会可以去实地感受到不同公司不同组的风格 当然 为了高薪那总得失去什么 为了轻松舒适也必然会失去什么

点赞评论收藏

分享

01-30 16:49

清华大学 Java

java春招还是在金三银四

对于 Java 岗位来说，春招依然集中在“金三银四”。3 月是企业集中放 HC、启动流程的高峰期，4 月进入面试和定岗密集阶段。相比秋招，春招岗位数量略少，但对往届生和补招需求更友好。提前准备项目和算法，在 2 月底前进入状态，能明显提高春招成功率。

今年春招是金一银二嘛？

点赞评论收藏

分享

评论

18

46

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 有转正机会的小厂实习值得去吗？ #

3298次浏览 44人参与

# 工作不开心辞职是唯一出路吗 #

7358次浏览 25人参与

# xx岗简历求拷打 #

2039次浏览 23人参与

# 联想求职进展汇总 #

334832次浏览 2220人参与

# 你最讨厌面试被问什么 #

4386次浏览 49人参与

# 非技术er求职现状 #

138843次浏览 821人参与

# 牛客租房专区 #

157889次浏览 1795人参与

# 如何缓解入职前的焦虑 #

261581次浏览 1468人参与

# 大家每天通勤多久？ #

87419次浏览 871人参与

# 金三银四，你有感觉到吗 #

688666次浏览 6074人参与

# 哪些公司开春招了？ #

29808次浏览 194人参与

# 记录实习开销 #

188481次浏览 1006人参与

# 毕业季等于分手季吗 #

54560次浏览 649人参与

# 你觉得今年春招回暖了吗 #

930407次浏览 7229人参与

# 掌握什么AI技能，会为你的求职大大加分 #

2107次浏览 82人参与

# 重来一次，我还会选择这个专业吗 #

418179次浏览 3902人参与

# 不给转正的实习，你还去吗 #

2632290次浏览 23091人参与

# 正在实习的你，几点下班 #

301027次浏览 2246人参与

# 开工第一帖 #

4383次浏览 91人参与

# 牛友们，签完三方你在忙什么？ #

138003次浏览 1003人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务