我想上班求你了

04-09 17:54 已编辑黑龙江农垦科技职业学院电话销售发布于重庆

关注

铂中数字科技数据模型训练实习生

1.自我介绍

2.一个机器学习模型的训练流程是什么样的

3.怎么根据场景选择合适的模型

4.知道哪些评估指标

5.ROC

6.召回率

7.假如一个模型训练效果不好，怎么去解决

8.过拟合

9.做过数据标注吗

10.正则化是什么

11.了解过大模型吗
追问：你用过哪些大模型
追问：你微调过哪些数据
追问：怎么微调的，开源框架还是云服务器
追问：微调效果不好怎么办

全部评论

推荐最新楼层

我想上班求你了

楼主

黑龙江农垦科技职业学院电话销售

屡面屡挂，屡挂屡面

点赞回复分享

发布于 04-09 17:49 重庆

04-28 15:23

University of Cambridge 算法工程师

一下午面了三个大模型岗，全是一言难尽...

真服了，我不信有这个题，还不会 常见的业务题 ◆ 大模型（LLMs）基础面 • 目前主流的开源模型体系有哪些？ • prefix Decoder 和 causal Decoder 和 Encoder-Decoder 区别是什么？ • 大模型LLM的 训练目标 是什么？ • 涌现能力是啥原因？ • 为何现在的大模型大部分是Decoder only结构？ • 简单 介绍一下 大模型【LLMs】？ • 大模型【LLMs】后面跟的 175B、60B、540B等 指什么？ • 大模型【LLMs】具有什么优点？ • 大模型【LLMs】具有什么缺点？ ◆ Layer normalization 篇 • La...

查看29道真题和解析

点赞评论收藏

分享

04-13 19:45

山西科技学院数据分析师

大厂的数据标注和小厂的数据运营

兄弟们，你们说我为了大厂title干数据标注可行吗，干俩月就跑，然后简历上适当编一下😂

点赞评论收藏

分享

04-24 20:43

清华大学 C++

RAG：AI 落地的过渡方案，还是未来标配？

理想：RAG 的完美愿景 在大语言模型（LLM）的浪潮中，检索增强生成（Retrieval-Augmented Generation, RAG）被寄予厚望，作为 LLM 应用落地的关键技术范式之一，它的核心思想很简单： “让大模型在生成答案时，先检索外部知识库，确保回答既准确又新鲜。” 理论上，RAG 能解决大语言模型（LLM）的三大痛点： 知识固化：LLM 依赖训练数据，无法自动更新知识（如 GPT-4 不知道 2024 年后的新闻），导致时效性差、专业领域知识不足，而 RAG 通过连接外部知识库，可以随时引入新信息。 幻觉问题：LLM 可能编造虚假信息，而 RAG 为回答提供证据、增强生...

牛客创作赏金赛聊聊我眼中的AI

点赞评论收藏

分享

04-28 14:15

西安交通大学人工智能

最后提醒下大模型算法面试肚子里没墨水的人

算法岗面试95%，全可以被预测！#大模型# #ai##人工智能##编程##程序员##计算机#

点赞评论收藏

分享

04-27 12:27

中山大学算法工程师

算法求职简历该怎么写大模型微调

结合最近辅助修改的简历及项目，老师总结了部分大模型微调简历的踩雷点。🙅‍♂️错误示范：在 x任务中，获取 xxx 条数据，通过规则 or 脚本清洗出 x 条数据，然后微调 y 大模型，在业务上提升 x 个点。✍🏻原因:大模型微调的平台是现成的，基模是现成的，体现不出核心能力。✅应该怎么写？首先介绍业务背景：业务是一个销售对话业务，机器人是销售，代替真人，直接面对用户。我们会给模型设定任务，任务是 prompt 。步骤1️⃣．提取训练数据问题：1.真人通话每通电话任务是未知的，我们训练数据是任务＋通话的 pair 对。2.真人通话很乱，与客户的对话是各种交叉的，导致 asr 后并不是一人一轮。解决方案：1.首先通过大模型 prompt 对该通电话提取任务，得到任务＋ pair 对。需要用到 cot + reflection ＋多 Ilm 一致性+ debating 的模式。2.使用大模型根据以上任务和真人对话，让大模型编写出通话内容。提问，为什么要编写而不是直接用？步骤2️⃣．制定训练数据集问题：1、正常的对话内容，前面几句和后面几句基本上一致的。都是问候和拜拜，但是也有一些差异。2、因为都是相似场景，虽然任务不同，但是很多场景语义很相似。解决方案：1、基于轮次的权重采样：通过轮次设定权重进行 weighting sample 。解决问候和拜拜的高占比问题。2、基于语义的采样：使用 bert 对对话内容进行 embedding ，然后使用层次聚类通过调节阈值聚类出相似语义的类。对一个类里的样本进行随机采样，提问，为什么要对重复语义的数据进行下采样？3、基于客户类型和产品的采样，因为很多产品是热品，导致对话内容有偏，用户类型一样，需按照类型调整整体比例采样。提问，为什么要这么采样？步骤3️⃣．制定训练数据集我们直接把输出当作 target 进行训练。使用的 lora 训练，但是 lora alpha 设定成为4倍的时候达到了比较好的效果，经验值不同任务不一样，提问，在各种情况下要怎么调？步骤4️⃣.dpo训练问题：v1版本训练时，很多输出内容是对的，但是输出的语气不太像真人，机器人味还是很严重。解决方案：由于训练本身是有 ground truth 的，因此使用v1训练的模型，预测训练集，使用大模型对比两者语气不符合训练集的拿出来，使用训练集的 ground truth 和模型的预测数据作为 dpo 训练对，对v1版本模型重新训练。📳这里老师只是简要进行概括解答，具体情况和详细解答可以咨询辅导，如果想了解项目辅导，提升面试能力，欢迎后台联系。#算法# #简历中的项目经历要怎么写# #算法岗面试# #互联网大厂招聘#

简历中的项目经历要怎么写

点赞评论收藏

分享

评论

点赞

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 国企还是互联网，你怎么选？ #

122814次浏览 949人参与

# 找工作，行业重要还是岗位重要？ #

8828次浏览 115人参与

# 五一之后，实习真的很难找吗？ #

47540次浏览 345人参与

# 盲审过后你想做什么？ #

13111次浏览 117人参与

# 应届生进小公司有什么影响吗 #

67315次浏览 984人参与

# 外包能不能当跳板？ #

22437次浏览 192人参与

# 25届秋招公司红黑榜 #

257408次浏览 1083人参与

# 租房找室友 #

13621次浏览 98人参与

# 小厂实习有必要去吗 #

42402次浏览 260人参与

# 领导秒批的请假话术 #

10338次浏览 76人参与

# 蚂蚁集团工作体验 #

10854次浏览 70人参与

# 设计人如何选offer #

98694次浏览 690人参与

# 五一假期，你打算“躺”还是“卷”？ #

34813次浏览 459人参与

# 考研可以缓解求职焦虑吗 #

21801次浏览 257人参与

# 如果校招重来我最想改变的是 #

245436次浏览 2781人参与

# 面试等了一周没回复，还有戏吗 #

116244次浏览 1079人参与

# 一句话证明你在找工作 #

292491次浏览 2410人参与

# 大疆的机械笔试比去年难吗 #

69737次浏览 603人参与

# 找工作前vs找工作后的心路变化 #

7267次浏览 64人参与

# 潍柴工作体验 #

17078次浏览 17人参与

牛客网
牛客企业服务