【ai产品】1.基础模型概述:大语言模型
最近没更新,因为去干了件大事,我辞职啦!!!离职前,因为工作性质原因,确实各种内耗,严重影响心里健康了,这里离职后,发现不上班是真的爽,短期也没有找工作的打算了,也打算好好理一下我的职业或者说人生规划。这次还是先总结这段时间对ai方面的学习。
课程中,对于大模型的介绍,是按大模型从训练到评测的过程来安排的,包括:数据集、预训练、微调、强化学习、模型评测5个方面。
数据集方面,现在已有众多公开的数据集,如GLM-130B等,要求数据集高质量、大规模、丰富性。同时,需要对数据集进行评测,对于不同的数据类型(文字、图片、音频)有不同的标注方法。
预训练:预训练数据集的构建、效果评测
微调:其实主要是指令微调,因为模型训练本质是预测,并不是问答,微调主要就是通过有监督的训练,是模型能更好的对话。其实可以在prompt中使用few show来告知模型需要怎么样的回答,但是对于数据较多情况,就不适用了。
强化学习:因为模型会产生有害性以及幻觉,因此需要使用强化学习,人工告诉模型结果是好还是坏。
模型测评:现在模型评测已经比较多了,有考察客观题的c-eval,还有集合客观与主观的openCampus。
课程中,对于大模型的介绍,是按大模型从训练到评测的过程来安排的,包括:数据集、预训练、微调、强化学习、模型评测5个方面。
数据集方面,现在已有众多公开的数据集,如GLM-130B等,要求数据集高质量、大规模、丰富性。同时,需要对数据集进行评测,对于不同的数据类型(文字、图片、音频)有不同的标注方法。
预训练:预训练数据集的构建、效果评测
微调:其实主要是指令微调,因为模型训练本质是预测,并不是问答,微调主要就是通过有监督的训练,是模型能更好的对话。其实可以在prompt中使用few show来告知模型需要怎么样的回答,但是对于数据较多情况,就不适用了。
强化学习:因为模型会产生有害性以及幻觉,因此需要使用强化学习,人工告诉模型结果是好还是坏。
模型测评:现在模型评测已经比较多了,有考察客观题的c-eval,还有集合客观与主观的openCampus。
全部评论
相关推荐
点赞 评论 收藏
分享
2025-11-24 12:00
门头沟学院 Java glint~1108:看来不止我一个人被这节奏整懵了。现在这环境确实没人会耐心带你,上来就直接扔活干。任务东一块西一块的,对整体业务又没概念,每次对接都跟猜谜似的,太折磨人了。
点赞 评论 收藏
分享
等闲_:业务开发就是prompt+数据,Ai就是中间件,中台或者鸡架会做一些Agentic infra和智能体记忆之类的,再底层一点就是AI infra,MLops,模型微调,推理优化之类的了,所以对于普通后端就是纯业务,没啥技术含量,除非去技术架构组或者底层一点的组,要不AI就是个API,别神话AI应用开发
点赞 评论 收藏
分享

