这期的创作激励收益将全用于购买我的薯片。
很感谢各位观看,上期文章有两块钱的收益,
看来大模型还是很不少人感兴趣的,
今天继续写自己学习的心得了。
那么首先各位要搞清楚大模型本质上分为两种,上期文章里面我写到了,有预训练模型和底层手搓论文模型两种,
云服务方面
但是实际上我们去使用的时候还是会出现本地内存不够用的情况,不管用那种,在下载模型去跑的时候因为内存不够所以电脑会卡死,那么想要去跑,就可以选择轻量化模型+云服务的方式(这里试了一下谷歌的colab可以免费试用GPU/TPU也可接入gemini去写代码),这个就是云计算的一种体现,它的代码全部在云上,同时代码执行速度远高于你的本地,另外也不管也可以去试试微软,阿里的云服务,也类似。
分词器:
然后这两天搞了个医疗大模型+本地论文问答模型,后面请了个老哥讲这东西,它一看就知道本地论文模型,github拉去的代码里面没有模型也没有数据集(假设你要调试模型的话,你需要有模型作为底座+成型的系统+数据集(数据集有几个G到百来个G不等同时)多少多少B就是切块,2B返回值就是一次返回作为2bit)然后基本上模型需要分词器(这个就是类似序列化一样你的模型要看懂你写了什么就需要分词器去将数据向量化导入数据)。
agent方面
然后就是有朋友私信我,问agent的问题,这里统一讲一下,智能体在你去dify/coze上的预调智能体和你自己做的智能体基本上不一样,就跟你微调模型一样,一般来说是你拿人家东西去改出来,同时去针对专门的方向的,比如我下的医疗模型,我配置不行,我就专门调试骨科的东西,问他骨折了怎么办,而其他关于肌肉的,血液的东西,它没有对应数据集作为知识库,所以回答不了我,那么我们知道微调就是为了针对专门问题而诞生的,同时自己写agent也是一样的,可以去针对性解决痛点。
付费方面:
咱们讲一讲要不要付费去请人生成agent,我个人而言不大建议,因为这个东西现在报价有点离谱,本质上他们也是问ai一键生成的,不如你花个两三天去学一下。。。如果你愿意请问喝奶茶我也可以帮你弄一个(广告位招租ing)。
少年啊,我请你不要有所失而有所得,这完全是不必要的。
然后就是报班问题,先前传统开发很多培训班,现在依旧会有,但是我个人而言现在很多面试官面试都不知道问什么,那么你去报班岂不是没什么用?我不否认去报班可以学很多东西,但是培训班本质上是给你洗脑让你去学会了然后找工作,你的思维或者想法就是学了去找一份工作,然后愿意花钱,但是你考虑过没有,你万一学了不喜欢呢?或者你足够自律并且你是科班可以完全自学呢?我不建议花太多钱在这个上面,知识付费可以收取一点点费用,你完全可以去找在职的老大哥请人家喝杯咖啡,百来块搞定,问些行业发展前景,还有职业规划,应该怎么学,之类的。胆子大一点,不要付费而后悔,光是凭借兴趣去做事情就够了,对金融感兴趣就去学税法,去炒股,了解债券,期权是什么,喜欢看电视剧看电影,就去做自媒体天天讲给人家听,不要为了一份工作而摇尾乞怜,这毫无意义,That‘s just a fucking job,到最后你转行了或者你考上大学了,你自己也会感叹,过去的烦恼根本没必要,只不过是社会或者家庭给你的压力罢了,考不上又如何,没工作又如何,太阳照常升起,明天依旧会到来,人家不会把你怎么样,你也不会死,而除却生死,其余皆是小事。#
#牛客激励计划##创作激励计划##牛客创作赏金赛#