大模型快速入门路径

今天老师整理了大模型入门的几个学习步骤、目标和需要掌握的基础知识,供初学者快速掌握基本路径。
1️⃣前置知识: Python 基础、 Linux 基础
🌟学习内容
1.熟练掌握 Python 语言,熟悉常用的
Python 库和工具,如 NumPy 、 Pandas 、  Scikit - learn 、 PyTorch 等。
2.具备 NLP 相关的基础知识,包括文本预处理、分词、词性标注等。
3.对大模型有一定了解,包括
Transformer 模型的结构和原理、基于注意力机制的自然语言处理技术等。
2️⃣Step1:NLP相关基础知识
🌟学习内容
1.了解文本预处理、分词、词性标注、命名实体识别、词向量表示等基础知识。
2.掌握机器学习中的数据预处理、特征提取、分类、回归等基础算法,并了解其在 NLP 领域的应用。
3.了解大规模 NLP 任务中的常用技术和方法,如深度学习中的 Transformer 模
型、 BERT 、 GPT 等。
3️⃣Step2:GPT API 调用及 Prompt 设计
🌟学习内容
了解 GPT API 的调用方式和基本操作,熟悉 Prompt 设计技巧和要点,能够结合自己的任务调用 API 实现对应的任务代码。
4️⃣Step3:模型微调( Fine - tuning )
🌟学习内容
了解常见的微调模型的基本流程和原理,熟悉数据集的构造、训练、评估等过程,能够独立构建 QA 对,在服务器上对模型进行微调。
5️⃣Step4: RAG (外挂数据库)
🌟学习内容
RAG 作为目前最火的一个 LLM 落地方向,可以结合私有数据(表格、 word 、 txt 、 pdf 、数据库皆可)实现本地问答,且训练成本较低,可以快速实现效果。
✴️有需要提升面试能力和辅导项目的同学可以后台联系我~
全部评论
Mark学习
点赞 回复 分享
发布于 2025-05-23 00:05 广西
mark
点赞 回复 分享
发布于 2025-05-12 16:07 江苏

相关推荐

算法: 一、算法题 & 代码思路滑动窗口最大值的解题思路是什么?为什么选择使用双端队列?双端队列维护了哪些内容、具备什么性质?口述讲解这道题的整体思路(被judge怀疑写力扣不够多了)八股:二、大大模型模型预训练流程一个开源大模型在预训练过程中会经历哪些步骤?你是从哪些方面、哪些渠道学习并理解这些预训练知识的?(可能这里开始质疑我有点背答案的逻辑了)BERT 和 GPT 架构最核心、最本质的区别是什么?四、简历拷打开始从项目去拷问:你所理解的视频理解是粗粒度总结,还是细粒度描述?能否捕捉动作的开始、过程、结束?固定摄像头场景单一有限,用大模型做事件判断性价比是否不高?简单任务(如闯入检测)是否用小模型、路由、MoE 架构更合适?这种情况下,使用视觉大模型(VLM)的意义在哪里?用大模型做数据预标注,为后续小模型服务,这套思路是否合理?大模型在工业落地中,真正的性价比体现在什么地方?五、反问1,公司业务是否会涉及视频细粒度动作理解?不只是判断 “动作是否发生”,还要精确识别动作发生次数,避免重复扣费、误扣费这类问题。回答:确实有这类细粒度视频理解与识别需求,核心是精准、不重复、不误判。目前业界 / 团队常用方案:用多个专用小模型组合,针对特定任务做定制化小模型。采用 MoE(混合专家模型) 架构,但不是简单路由,路由逻辑需要专门设计,用来解决特定任务。现在也在探索:利用大模型 / 大语言模型的能力,提升复用性,希望换任务也能快速适配,减少重复开发,因此在尝试搭建新架构。2. 关于细粒度视频数据 & 数据集构建训练这些细粒度识别小模型时,数据和标注是怎么获取 / 构建的?回答:采集行业真实数据主要流程:采集行业真实数据 → 交给外包公司标注(YOLO、分割等常规标注)。模型上线部署后,把线上回传的困难样本 / 错误样本再人工补充标注。整体思路:先众包 / 外包大规模标注再人工筛选、修正难例,是业界比较经典的做法。3,面试官一般怎么判断面试者有没有背稿、有没有用辅助工具?回答:看表达一致性真实做过的人,叙述风格、逻辑是统一的;背稿 / 套话,容易在切换问题时风格断裂、内容漂浮。看是否聚焦问题本身真懂的人会顺着问题深入聊;套答案的人容易答非所问、逻辑不连贯。紧张很正常面试少、科研多的同学容易紧张,多面几次就会像日常学术聊天一样自然。建议把面试当成和老师 / 教授学术讨论,懂就说懂,不懂就坦诚,重点看人岗匹配。大概率寄了,就当聊聊天
查看16道真题和解析
点赞 评论 收藏
分享
02-27 13:44
吉林大学 Java
浅谈一下,个人理解跑路互联网几大岗位学习路径🎇非技术岗产品+运营:业务八股,主要是实习,办公软件使用,软实力更多一点,学历和实习其中产品需要:prd,原型图,sql入门就行,主要是查询语句,几个小时的速成即可,excel的vlookup等,从0-1入门产品经理的网课,运营需要:主要还是偏软实力的运营相关课程数分:sql(黑马,python,bi画图工具+业务八股,ab实验之类的,也是主要是实习,学历和实习 40hAi产品:python,pytorch,机器学习,深度学习理论与实战,大模型相关基础知识,transform架构和知识,业务知识 学历和实习 60h风控策略:s数分的技能点还要对应的信贷的业务知识背景 学历和实习🔧技术岗:学习门槛比较少的搜广推,python,pytorch,spark,机器学习+深度学习,小土堆,李沐,吴恩达,李宏毅,王树森推荐系统,kaggle项目, 学历和实习 80h风控算法,python,机器学习和深度学习,相关业务知识和项目 80h数开数仓:java,python,linux,sql,这些是基础的,进阶的:hadoop,hive,spark,kafka,flink,zookeep,数仓建模理论,阿里大数据,bi,tb可视化,几个项目,尚硅谷或者黑马,可选的:redis,hbase,monggodb 200h大模型应用开发:python,java,机器学习深度学习,rag,mcp,agent,langchain,langgraph,大模型微调 150h大模型算法:学历实习论文,python,机器学习和深度学习,nlp,损失函数、数据处理,预训练,大模型结果评估,监督微调sft,人类偏好对齐rlhf,高效微调lora等,强化学习,经典的大模型架构,例如gpt,qwen,创新的架构,框架应用,性能优化deepseed,模型量化,检索增强rag,agent,其他:模型压缩,技术报告 300h (校招故事会)核心精简版:python,机器学习和深度学习,llm的前置知识和理论,transformer,预训练的知识,tokenization,rope,归一化,flashattention,后训练,sft,lora微调,rlhf,rag,agent数据科学数据挖掘:低配版算法,sql,python,机器学习和深度学习,业务知识开发大类(含前后端测试):暂未整理全部都是:一两个项目,学历,专业尽量对口,跨专业也可以,主要看实习,大模型这一块还看论文,八股,有代码的还要准备手搓代码,力扣hot100,然后刷实习
掌握什么AI技能,会为你...
点赞 评论 收藏
分享
评论
1
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务