首页 / 大语言模型

#

大语言模型

#

43884次浏览 281人互动

此刻你想和大家分享什么

热门最新

2024-07-03 12:43

门头沟学院自然语言处理

大模型秋招

大模型自己学搞一个什么项目好啊。有微调的项目，不过面试时面试官不认可。然后之前一段大模型实习，纯打杂还傻了吧唧实习了两个多月。现在搞了一个文生图实习，感觉也还是做一些杂活，知道现在再找实习也来不及了，想自己学一个项目，该学啥呢，RAG Agent？还是其他？大家有什么建议嘛

RZ_Q：我实习就是在搞数据，我也不知道秋招说啥😰

点赞评论收藏

分享

2025-05-12 23:13

已编辑

门头沟学院自然语言处理

大模型 0实习经验暑期实习投递记录

个人背景：双9，0对口实习+0对口论文，2月中下旬投完小论文后，由于自己本身没有太多大模型的经验，一直在纠结是做传统NLP/搜广推/大模型，甚至是开发。在纠结思考了很久，综合牛客+xhs各路dl的建议后，决定全力梭哈大模型。准备过程2月中下旬开始准备大模型八股+刷力扣，目前力扣300题左右，八股找了一些大模型资料看了一遍之后，3月中下旬开始大规模海投。投递记录OPPO：大模型算法岗，3.7投递，一直在初筛阶段；蔚来：大模型应用研究岗， 3.9投递，一面 + 二面后OC已拒；腾讯音乐：技术研究—自然语言处理（TME没有专门的大模型岗），3月初投递，一面 + 二面 + 三面 + HR面， OC；美...

职导未来：在薪资待遇相同的情况下选offer策略，公司知名度＞项目含金量＞项目承担角色

点赞评论收藏

分享

2024-10-24 19:28

门头沟学院算法工程师

阿里斑马智行 - NLP算法工程师OC

岗位是大模型方向，面经可以看之前的帖子，附上timeline：10.11 一面/技术面10.17 二面/技术面10.23 三面/HR面10.24 OC

点赞评论收藏

分享

2024-10-19 12:02

门头沟学院算法工程师

京东自然语言处理面经（1234面）

一二面连在一起，当时被打了个措手不及一面/HR面 2024/9/5 下午13:30-13:40自我介绍从实习中学到了什么实习和在学校的差异你觉得有哪些找工作时最关注哪些因素家乡是哪里，base选择做一个自我分析，谈下自己面试这个岗位时有哪些优势，同时有哪些不足需要去改进反问：面试流程问题，HR面和一面技术面一起，后边再来一轮技术面就OK了二面/技术面 2024/9/5 下午13:40-14:40直接开始八股Transformers中为什么用LN不用BN图像中BN是怎么用的在NLP中如果句子长度不一致，用BN会有什么后果给定一个三维矩阵bsz * seq_len * dim，BN和LN分别作用在...

点赞评论收藏

分享

2023-07-16 22:36

阿里巴巴_算法工程师

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT（Supervised Fine-Tuning）监督微调是指在源数据集上预训练一个神经网络模型，即源模型。然后创建一个新的神经网络模型，即目标模型。目标模型复制了源模型上除了输出层外的所有模型设计及其参数。这些模型参数包含了源数据集上学习到的知识，且这些知识同样适用于目标数据集。源模型的输出层与源数据集的标签紧密相关，因此在目标模型中不予采用。微调时，为目标模型添加一个输出大小为目标数据集类别个数的输出层，...

点赞评论收藏

分享

2024-04-10 22:41

南开大学算法工程师

有同学想一起参加大模型比赛吗

我这里有个大模型的比赛，感觉比较好拿奖，还有丰厚的奖金，想找队友

点赞评论收藏

分享

2025-07-26 15:05

湘潭大学运营

长沙湘江新区大科城基地公司招人

【   从入职到招人】公司为中南博导科研技术成果转换的团队，省级代培大学生创业公司，位置在中南大学旁大科城内。业务方向为数据平台建设和新材料研发，公司团队成员普遍高学历，氛围友好，下午茶团建都有，社保入职即交，公积金转正交， 年终奖丰厚。

点赞评论收藏

分享

03-27 11:24

已编辑

复旦大学量化分析

📢4/11腾讯青云计划上海场

📢cs领域27届及以下的硕博可以关注一下4/11腾讯青云计划上海场！有机会推进面试拿offer！🐧腾讯青云群星未来・技术交流展 | 上海场来啦📅时间：4月11日（周六）11:00-18:00🏠地点：腾讯上海总部（上海市徐汇区龙爱路231号腾讯滨江大厦）🔗报名：https://wj.qq.com/s2/25914471/19gi/👀名额有限，欢迎报名！具体参与信息以活动通知邮件为准。（报名截止时间:4月8日23:59）🎙️LLM/多模态/AI Infra三大分会场同步开展⭐️领域深度Talk+Poster快闪+业务深度交流🎈腾讯参观&amp;HR现场答疑🎁青云专属伴手礼&amp;市内打车费腾讯报销！我们把实验室的Poster Session搬进腾讯——无冗长宣讲，只做 AI 硬核对话。聆听深度技术分享、Poster快闪碰撞、一站式深度交流，带来青云顶级技术体验～————🐧腾讯2026青云实习热招中：https://mp.weixin.qq.com/s/dGoPD3orndsM_RPlW9Hviw

点赞评论收藏

分享

2023-08-21 16:56

华东交通大学电气工程师

这是文心一言吗？

莫名其妙送到百度发来的广告我有点好奇这是文心一言的体验资格吗？

我一定能拿到满意的o...：可以画图

点赞评论收藏

分享

2024-04-10 17:35

阿里巴巴_算法工程师

NL2SQL基础系列(2)：主流大模型与微调方法精选集

NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理  Text-to-SQL（或者Text2SQL），顾名思义就是把文本转化为SQL语言，更学术一点的定义是：把数据库领域下的自然语言（Natural Language，NL）问题，转化为在关系型数据库中可以执行的结构化询语言（Structured Query Language，SQL），因此Text-to-SQL也可以被简写为NL2SQL。   输入：自然语言问题，比如“查询表t_user的相关信息，结果按id降序排序，只保留前10个数据”   输出：SQL，比如“SELECT * FROM...

点赞评论收藏

分享

2023-07-19 11:09

阿里巴巴_算法工程师

大语言模型的预训练[5]：语境学习、上下文学习ICL原理详解

大语言模型的预训练[5]：语境学习、上下文学习In-Context Learning：精调LLM、Prompt设计和打分函数（Scoring Function）设计以及ICL底层机制等原理详解 1.In-Context Learning背景与定义  背景  大规模预训练语言模型（LLM）如 GPT-3 是在大规模的互联网文本数据上训练，以给定的前缀来预测生成下一个 token（Next token prediction）。通过预测词的训练目标、大规模数据集以及超高参数量的模型相结合，产生了性能极强的 LLM，它可以 “理解” 任何文本输入，并在其基础上进行“写作”，除此以外，GPT-3 的论文...

点赞评论收藏

分享

2023-11-15 11:03

阿里巴巴_算法工程师

ChatGLM3-6B：新一代开源双语对话语言模型

ChatGLM3-6B：新一代开源双语对话语言模型，流畅对话与低部署门槛再升级 1.ChatGLM3简介 ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B 引入了如下特性：  更强大的基础模型： ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，ChatGLM3-6B-Ba...

点赞评论收藏

分享

2023-07-20 12:42

阿里巴巴_算法工程师

大语言模型的预训练[6]：思维链以及在LLM上应用

大语言模型的预训练[6]：思维链(Chain-of-thought，CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用 1.思维链定义  背景  在 2017-2019 年之间，随着 Transformer 模型的提出，计算资源与大规模语料库不断出现，自然语言处理领域发生了翻天覆地的变化，传统的全监督学习的范式逐渐达到了瓶颈，很难在传统的训练方式上取得大幅度提升。这时大规模预训练模型的如 Bert、RoBERTa 等模型的出现使得研究方向转向了以预训练模型为基础 + 下游任务 Fine-tune 的范式。 然而随着语言模型规模的不断增大，Fine-t...

点赞评论收藏

分享

2025-03-31 17:03

已编辑

阿里巴巴_后端开发工程师

阿里国际广州lazada招算法实习生

【LZD智能发品——用AI重塑东南亚电商生态的核心引擎】🔥🌟 项目价值：作为Lazada商品发布链路的&quot;中枢神经系统&quot;，我们通过自主研发的多模态大模型与AIGC技术，正在革新东南亚电商基础设施，你的代码将直接触达6国市场亿万消费者。🚀 技术纵深：攻克多模态理解难题：构建多模态深度学习框架，实现图文信息到商品要素的智能映射打造电商领域专属AIGC：基于GPT与Diffusion模型创新，解决生成内容与平台流量规则的匹配挑战建设东南亚首个商品知识图谱：融合多语言语义理解，突破小语种市场本地化难题🎯 成长加速度：接触完整的电商技术生态：从内容生成、质量评估到流量预测的全链路实战国际化技术视野：解决英语/泰语/越南语等多语言场景下的独特AI问题🌍 社会影响力：你的工作正在降低东南亚中小商家的数字化门槛，让所有商家能享受AI红利。我们寻找这样的你：✅ 渴望用算法解决真实商业问题的实战派✅ 对生成式AI、多模态学习有深度热情的技术探险家✅ 具备国际视野，愿意用技术推动东南亚数字经济的基础建设【LazGenie——定义电商运营的下一代AI协同智能体】✨🌟 价值革命：这不是普通的聊天机器人，而是重塑东南亚商家命运的商业决策中枢。作为首个深度植入阿里国际业务系统的智能副驾，LazGenie处理运营决策请求，直接提升小二人效，助力商家实现GMV增长突破。你的代码将成为东南亚电商经济的&quot;隐形推手&quot;。🚀 技术制高点：攻克LLM在商业场景的认知边界：构建基于卖家画像的动态知识蒸馏框架，让通用大模型掌握跨境电商业务DNA首创&quot;场景感知型&quot;对话系统：融合工作台操作流上下文，实现从被动响应到主动决策的服务范式跃迁💡 你的创造时刻：参与构建商业级LLM应用范式：从prompt engineering到RAG增强，探索大模型在万亿级交易场景的落地极限设计智能体的决策神经中枢：开发融合用户行为预判的混合推理引擎，让AI助手具备&quot;提前三步思考&quot;的商业直觉我们寻找这样的你：✅ 渴望用算法解决真实商业问题的实战派✅ 对生成式AI、多模态学习有深度热情的技术探险家✅ 具备国际视野，愿意用技术推动东南亚数字经济的基础建设

点赞评论收藏

分享

2024-04-24 14:46

Northwestern University Java

oppo和实在智能怎么选

请问一下大家，oppo和实在智能这两家的nlp/llm实习怎么选。面试官都是直系上司，也都聊着很好。但是实在智能这边描述的项目更具体，感觉暑假三个月的时间能学到更多东西以及做更多事情。原来没有实习过，想问一下大家有没有什么办法！

点赞评论收藏

分享

2023-08-25 10:45

阿里巴巴_算法工程师

超级AI助手：全新提升！中文NLP训练框架，快速上手

“超级AI助手：全新提升！中文NLP训练框架，快速上手，海量训练数据，ChatGLM-v2、中文Bloom、Dolly_v2_3b助您实现更智能的应用！” 1.简介  目标：基于pytorch、transformers做中文领域的nlp开箱即用的训练框架，提供全套的训练、微调模型（包括大模型、文本转向量、文本生成、多模态等模型）的解决方案； 数据：  从开源社区，整理了海量的训练数据，帮助用户可以快速上手； 同时也开放训练数据模版，可以快速处理垂直领域数据； 结合多线程、内存映射等更高效的数据处理方式，即使需要处理百GB规模的数据，也是轻而易举；   流程：每一个项目有完整的模型训练步骤，如：...

点赞评论收藏

分享

2023-10-18 17:36

阿里巴巴_算法工程师

大规模语言LLaVA：多模态GPT-4智能助手，融合语言

大规模语言LLaVA：多模态GPT-4智能助手，融合语言与视觉，满足用户复杂需求 一个面向多模式GPT-4级别能力构建的助手。它结合了自然语言处理和计算机视觉，为用户提供了强大的多模式交互和理解。LLaVA旨在更深入地理解和处理语言和视觉信息，从而实现更复杂的任务和对话。这个项目代表了下一代智能助手的发展方向，它能够更好地理解和应对用户需求。  效果展示  demo链接：https://llava.hliu.cc/    当我来这里旅游时，我应该注意哪些事情?   在平静的湖面上游览码头时，有几件事你应该小心。首先，要注意天气状况，因为图像显示的是多云的天空。这可能表明天气突然变化的可能性，如...

点赞评论收藏

分享

2023-07-29 22:36

阿里巴巴_算法工程师

MedicalGPT：基于LLaMA的中英医疗问答模型

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。 **** 训练医疗大模型，实现包括二次预训练、有监督微调、奖励建模、强化学习训练。  分四阶段训练GPT模型，来自Andrej Karpathy的演讲PDF State of GPT，视频 Video   版本迭代   V1：发布中文医疗LoRA模型，基于Ziya-LLaMA-13B-v1模型，SFT微调了一版医疗模型，医疗问答效果有提升，发布微调后的LoRA权重，   V0：以医疗为例，训练领域大模型，实现了四阶段训练：包括二...

点赞评论收藏

分享

2025-02-05 18:38

乐鑫科技Espressif_人力资源部_HR

乐鑫解决方案｜豆包大模型 LLM 方案网页上线

随着生成式人工智能的蓬勃发展，大语言模型 (LLM) 正成为人工智能领域的核心技术，推动了 AI 编程、智能客服、AI 办公等应用场景的落地。然而，这些技术通常依赖强大的云计算资源，而将其扩展到端侧设备需要克服计算能力、延时和功耗等众多挑战。乐鑫科技凭借其领先的无线 SoC 技术，为这一挑战提供了解决方案。暨火山引擎 2024 冬季 FORCE 原动力大会宣布与乐鑫、ToyCity、Folotoy 及魂伴科技联合发布 AI+ 硬件智跃计划之后，公司官网上线了 AI 大模型解决方案。乐鑫携手火山引擎豆包大模型，致力于为用户提供卓越的端到端解决方案，融合前沿技术，为智能设备注入强大的智能内核。 方...

点赞评论收藏

分享

2023-12-04 16:49

阿里巴巴_算法工程师

人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景

人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景 LLM（Large Language Model）技术是一种基于深度学习的自然语言处理技术，旨在训练能够处理和生成自然语言文本的大型模型。  LLM 技术的核心思想是使用深度神经网络，通过大规模的文本数据预训练模型，并利用这些预训练模型进行下游任务的微调或直接应用。 LLM 技术的主要特点是可以从大规模文本数据中学习到丰富的语言知识和语言模式，使得模型能够对自然语言的语义、语法等进行理解和生成，具备更强的语言处理能 LLM 技术在自然语言处理领域具有广泛的应用前景。以下是一些应用前景的示例：   语言理解和生成：LLM 技术可以应用...

点赞评论收藏

分享

玩命加载中

创作者周榜

更多

热议话题

更多

牛客网
牛客网在线编程
牛客网题解
牛客企业服务