如何系统学习大模型推理

在最近几年,大语言模型(LLM)和各类大模型推理技术正在快速发展。很多小伙伴对如何入门、学习路径很迷茫。今天,我就整理了一份系统的学习路线,帮助你高效掌握大模型推理。

1. 基础知识

1.1. 数学基础

线性代数与概率论矩阵运算、向量空间、特征值/特征向量概率分布、条件概率、贝叶斯思想。

这些大学课程里面都会有,如果已经忘了,先不要专门回去看,可以继续往下学。等遇到了,发现自己不理解,再回头看。

1.2. 编程基础

主要是python和C++。

python学习网站:https://www.liaoxuefeng.com/wiki/1016959663602400

C++建议看《C++ Primer》这本书

学习方法:

学习时把握住要点:快看多练,学习从速

什么意思呢?学习时常备电脑,不论看网站还是看书,保持清醒的头脑,快速去看快速去学,然后立马开始动手写代码练习。

一定要多练习,一定要多练习

每天可以刷刷leetcode,为面试做准备。

1.3. 深度学习基础

做大模型推理的话,要先学学深度学习,以及pytorch的使用,对模型的训练需要有一个基本概念上的认知,深度学习基础推荐李沐的公开课。如果找不到 X信🔍季叶杂货铺,后台回复“公开课”获取。

学习方法:

跟上面一样,快看多练,学习从速;

二、大模型推理技术学习

这里放我总结的一个大模型推理技术学习图。

这里要搞清楚大模型推理的过程,根据推理的过程,去分析每一个优化手段是怎么回事,这样才能从根本上理解,而不是只知道浮在表面的一些东西。

三、实践项目建议

  • 可以找个开源的大模型推理框架,去实现暂时还没有支持的功能,或者去适配还没有支持的模型~

四、关于如何学习

学习一定要快,慢工出细活,放在大多数人身上会变成由入门到放弃。

一定要多动脑筋,特别是大模型的这些优化feature,一定要去想明白,并且能够串起来。

心静:选择了这个方向就安心学习,不要想乱七八糟的,给自己情绪负担。

这是一个还不错的方向,值得一学,薪资还是很不错的

最后求个关注,X信🔍季叶杂货铺,我会定期分享大模型推理相关知识,大模型面试题目,面经,大模型推理项目~

#大模型加速##大模型推理##大模型##学习指引##深度学习#
全部评论

相关推荐

牛友们,大佬们,我到底该走计算机方向就业,还是抛开一切啊找别的路啊。本来小县城就是想要好就业才考的这个专业。😥结果还是没办法。不玻璃心,最近特别焦虑,学院本,计科专业,不知道以后该走啥路子。数学差,0实习也没什么项目经验(基本上课设)学的特别杂,不知道以后该走什么路,c语言,c++,python,java只能说都上过课,有一点点基础。嵌入式方面,就智能小车(特别水的那种stm32小车,基本的c语言编程;做了一个简易四旋翼无人机的项目文档。)目前家里条件不是很好,现在想的就是求稳,想早点找到一个出路。目前这学期课属于有但不多,刚好每周都有一两天可能有课,后面还有实验可能还会有另外安排。不知道现在该学点什么,属于是傻读两年半的书了😭,之前都是为了减轻点家庭压力假期都是做的不相关的寒暑假工,看了牛友们的简历上什么架构,工具全都不知道,更觉得自己是个废物了。开学了天天睡不好难受。目前我是老师那有个项目是如下这些:基于ROS2的AGV小车安全监控平台设计基于ROS2的AGV小车系统编组系统设计基于R0S2的AGV小车自动跟随废弃矿坑自动安全巡检六足机器人设计基于激光雷达点云数据的地图构建基于双目摄像头的简单三维模型建模基于DDS的自动泊车系统设计基于DDS的实时通信中间件设计老师选什么说大体都差不多,但是这个项目是属于老师学长们给我资料,基本上我自己学自己做,做的话老师说要一年,还不一定能做完,最短的实验期都是一学期,做不出来再说。我现在怕的是我做不出来,浪费了一学期乃至一年的时间,实习经历也没有,项目也没有。秋招春招直接完犊子。现在想的是一下几条路:1.安心死磕这个项目。2.这学期抓紧练一个技术,做做对应的项目,背八股,刷力扣,去沿海地区实习看看能不能有公司要我这个臭鱼烂虾。不知道牛友是否有推荐的。3.现在就开始投对口实习,考试,课程什么的再想办法。4.考公考研之类的。我觉得我考研顶多顶多一本的研究生了,除了考完再去考公没必要。考公直接考我老家的小县城乡镇看公考雷达都是一般在5:1到30:1之间。
点赞 评论 收藏
分享
02-26 13:41
门头沟学院 Java
“如果想要去ai相关的岗位实习,需要先学习什么内容,可以给个学习路线吗(比如先要学习什么做基础然后学到什么程度之类)。”这是很多同学想了解的问题,我浅谈一下自己的学习路线,仅供参考。阶段一:打好地基 🧱Python编程:重点掌握核心语法、数据结构和面向对象(OOP)思想。目标:能熟练使用Python解决问题,至少刷完LeetCode简单和中等难度的题目。数学基础:理解高数、线性代数、概率论的核心思想。目标:不要求背公式,但要懂原理。阶段二:迈入核心 🧠机器学习基础:学习监督/无监督学习、分类、回归等经典理论。目标:熟练掌握NumPy、Pandas、Scikit-learn这“三件套”,能独立完成一个简单项目深度学习入门:理解神经网络(NN)、CNN、RNN等核心概念。目标:推荐PyTorch框架,并能搭建一些小项目。阶段三:垂直深耕 🚀针对心仪岗位(以AI Agent为例)针对学习,了解相关岗位需求大语言模型 (LLM) 基础:核心是理解Transformer模型原理并学会如何调用GPT等大模型的API。Prompt Engineering:学习如何写出高质量的提示词,让LLM精准理解你的意图Agent开发框架:重点学习LangChain或LlamaIndex。目标:能用框架调用LLM、连接外部知识库或工具,并搭建一个简单的应用阶段四:动手实践 💻项目是简历的敲门砖! 可以利用前几个阶段学习的内容写一个小项目,将代码上传到GitHub,并写一份清晰的README文档,可以成为你面试时的Demo。可能很多时候一开始摸着石头过河会有点迷茫,但最重要的是一定要多动手、多实践
掌握什么AI技能,会为你...
点赞 评论 收藏
分享
评论
6
27
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务