昨天 00:15 网易_数据开发工程师

发布于上海

关注

大模型与数据开发如何结合

1. 前言

大多数公司都在做大模型应用+大模型工具去提升自己业务效率（可能也是因为大老板想做出一些价值，因此在各业务投入agent去使用），我们这期讲一下大模型与数据开发如何去结合去落地，大模型和数据开发是如何相辅相成，以及解释为什么到今天语兴也觉得数据最为重要的原因，感兴趣同学想了解更多细节可以加下星球，星球有5套不同业务的大模型项目，并提供完整代码、业务逻辑、产品方案、简历模板，皆可用于面试。

2. 工作流

agent解释：ai agent也叫人工智能代理，是一种能够感知环境、进行决策和执行动作的智能实体。智能体像人一样，它有记忆、有逻辑分析能力、有任务拆解能力、问题的拆解能力和最后综合回来统一解决问题的能力，例如自动回复邮件的程序，自动驾驶都叫agent。

dify：是一个集成开发环境，提供低代码工具帮助开发者构建、部署和管理AI应用，如聊天机器人、智能助手等。

2.1 dify平台功能

探索

工作室

知识库

工具

可查看和使用定义好的Chat bot、chatflow、workflow、agent

可查看、编辑和创建Chatbot、chatflow、workflow、agent

可查看、维护知识库（知识库可作为上下文被其他智能体中的大模型引用），目前仅自己创建可用

全部

ai

2.2 workflow工作流

基于workflow工作流可以获取大模型执行的信息，同时还会根据每个节点执行情况，节点包括（input输入数据，output输出数据，预处理（python对数据二次加工），调用大模型，条件分支等），可以将节点看作离线任务链路中加工的节点，最后根据大模型对数据识别后将识别的数据output输出到大模型工作流表中。

3. 数据与大模型配合类型

谈到大模型+数仓组合，通常大家都会想到通过开发底层数据完成大模型训练，从而提供数据支撑，这个观点是对的，通常大模型+数仓组合一般呈现为2种，即（1）清洗数据保障数据质量后将明细投放到大模型中，（2）通过大模型的工作流执行及识别精准程度进行数据分析。

3.1数据前置生成投入大模型进行打标

数据前置生成投入即清洗好原始宽表数据信息，选择更贴合场景的内容数据，例如今天我们要做模拟抖音进行内容生成，那需要提前爬取抖音优质/劣质内容（具体看你用在什么场景，风控就用擦边/涉政类，优质就爬优质的），接入数仓ODS->DWD->ADS（ODS接入原始逆向也叫爬虫的数据，DWD进行json解析即数据清洗维度下沉，ADS进行内容打标，标记内容优质情况，当然打标可以走算法模型，最终封装json推送大模型平台）

因此数开在前置通常是接入研发/逆向研发数据从而给大模型推送

暂时无法在飞书文档外展示此内容

3.2大模型后置产出数据进行测算评估

当经过workflow工作流识别、产出后的数据可以用于评估业务召唤/准确率，结合各种维度属性进行大模型生成内容调整，从而调整工作流，因此数据开发在大模型后置则是基于workflow返回数据及业务数据构建ods到ads链路，建设指标搭建报表。

暂时无法在飞书文档外展示此内容

完整链路图

暂时无法在飞书文档外展示此内容

3.3大模型在数仓中使用

大模型在数仓中投入可分为几个方向，这里别说什么网易chat bi、SQL copilot这种，已经不是数仓方向能干出来的，我们就以chat bi为例，

（1）企业内部chatbi难落地:依赖数据开发、数据产品、数据平台等各方配合，开发周期长，人力投入，还需要长期调整精度，roi较低（正儿八经使用的人甚至不如取数据平台），平台价值远不如做业务价值，同时也很考验数据开发的资产完善情况，当前大部分数仓表较为分散，资产烟囱式建设太多。

（2）购买三方平台：购买3方（quick bi，网易有数较为成熟），价格太贵，带来的收益也低，即使有用户在用也很难用明白（最后变成数据表查询智能问答工具，还不如做个agent），如果只是为了套壳满足一些混子高层汇报吹牛逼那还是够的。

因此，我们只说数仓一个组能做的事

（1）根据数据表元数据，数据资产自动化评估有效资产、核心资产、是否可下线及优化等，并可以做一个简单问答助手

（2）根据任务执行元数据（消耗cpu、内存、近15日执行时间、执行sql语句等）识别不良任务进行自动化推送诊断，结合血缘对于无效任务进行推荐冻结/下线

#数据开发工程师##数据人offer决赛圈怎么选##数据分析##聊聊我眼中的AI##大模型#

全部评论

推荐最新楼层

10-24 14:29

东北师范大学 Java

魔门塔momenta实习怎么样？

本人目前秋招进入空窗期了，所以想找个日常实习干干。面过了一个魔门塔的实习，做大数据平台开发的。Python+大数据为主，少量后端。我对于大数据算是零基础，所以在纠结去不去，想听听牛友们的建议

投递Momenta等公司10个岗位

点赞评论收藏

分享

10-21 14:29

忠诚度管理软件，年复合增长率CAGR为13.3%

忠诚度管理软件是一种管理全渠道忠诚计划的软件应用程序，旨在帮助营销人员和品牌有效地管理他们的忠诚计划，从而在品牌和客户之间建立长期关系。通过这类软件，客户可以因为成员奖励和福利而分享个人信息，有助于推动客户终身价值、客户保留和整体品牌满意度。例如，具有AI预测功能的忠诚管理软件可以集成到CRM（客户关系管理）系统中，通过行为数据驱动的个性化奖励来赢取持续的客户忠诚度。据QYResearch调研团队最新报告“全球忠诚度管理软件市场报告2024-2030”显示，预计2030年全球忠诚度管理软件市场规模将达到130.6亿美元，未来几年年复合增长率CAGR为13.3%。图.   忠诚度管理软件，全球市...

点赞评论收藏

分享

10-15 15:22

门头沟学院营销

科大讯飞产品管理面经

1. 假设你需要为AI医疗产品（如智能辅助诊断系统）制定roadmap（产品路线图），如何确定功能优先级（如“影像识别精度提升”“医生操作简化”等功能的开发顺序）？a. 追问1：确定功能优先级前，你会使用哪些需求分析方法（如用户访谈、问卷调研）收集和梳理需求？b. 追问2：制定roadmap时，如何平衡短期迭代（如3个月内上线的核心功能）和长期规划（如1年内的AI算法升级）？2. 描述一次你参与产品定义的经历（如校园医疗APP原型设计、实习时的AI诊断工具），你是如何撰写PRD（产品需求文档）的（如功能描述、交互逻辑、验收标准）？3. 解释产品生命周期管理（PLM）的核心概念（如从概念到退市的全流程管理），在AI医疗产品中，如何通过PLM推动持续创新（如功能迭代、用户体验优化）？4. 在AI医疗产品的市场调研中，你会从哪些维度分析竞品（如同类智能诊断系统）？a. 追问1：通过竞品分析和市场调研，如何识别未被满足的市场机会（如“基层医院对操作简化的需求”）？b. 追问2：进行市场调研时，你会使用哪些工具（如数据分析平台、调研方法）收集信息？5. 分享一次你通过用户反馈（如医生、患者的使用意见）优化产品的经历，你采取了哪些具体措施（如功能调整、流程简化），效果如何（如用户满意度提升）？

点赞评论收藏

分享

昨天 16:11

门头沟学院 Java

得物测开一面（25min）

给你一段代码，说说代码可以怎么优化，各种层面（可维护性，可读性，异常处理，时间复杂度，空间复杂度，写注释）平时是怎么排查问题的团队合作问题

查看3道真题和解析

点赞评论收藏

分享

10-23 16:09

已编辑

中山大学 Java

一面：8.21二面：9.1三面：9.10hr面：10.20意向：10.22泡了一个多月

刷牛客的我很豁达：恭喜要泡出来了佬

点赞评论收藏

分享

评论

1

收藏

招聘动态

联易融

2026届秋季校园招聘

杉川集团2026届校招

杉尖计划·与杉川一览群山

真格基金

被投企业秋季联合校招

瓴岳科技

2026届“登岳计划”校招启动

新华三

2026秋招校园招聘

厦门银行

2026届秋季校园招聘

滴滴

2026届秋季校招

联想

2026届校园招聘

字节跳动

2026校园招聘

平安产险科技中心

2026届校园招聘

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 牛客树洞，我想对你说 #

16927次浏览 121人参与

# 大学最后一个寒假，我想…… #

55455次浏览 607人参与

# 快手技术岗信息交流阵地 #

7545次浏览 54人参与

# 你最满意的offer薪资是哪家公司？ #

42536次浏览 213人参与

# 求职中的尴尬瞬间 #

7081次浏览 65人参与

# 应届生被毁约被毁意向了怎么办 #

47907次浏览 282人参与

# 牛客周边新品开箱 #

11791次浏览 91人参与

# 研究所笔面经互助 #

97877次浏览 550人参与

# 如何KTV领导 #

74195次浏览 505人参与

# 牛友的志愿填报指南 #

36561次浏览 188人参与

# 硬件人的春招flag #

53055次浏览 435人参与

# 机械人避雷的岗位/公司 #

30205次浏览 250人参与

# 怎么给家人解释你的工作？ #

15395次浏览 89人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

137612次浏览 883人参与

# 得物app工作体验 #

30106次浏览 69人参与

# 国企还是互联网，你怎么选？ #

172707次浏览 1309人参与

# 打工人锐评公司红黑榜 #

176125次浏览 1023人参与

# 大疆工作体验 #

20104次浏览 85人参与

# 你的mentor是什么样的人？ #

19063次浏览 121人参与

# 机械人集合！你是什么工程师？ #

21260次浏览 91人参与

# 帮我看看，领导说这话什么意思？ #

25247次浏览 110人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务